你意思是这个讨论本身有倾向,引导了AI
【 在 Oliver87 的大作中提到: 】
: 它是强化过的上下文输出,你prompt里的每个字都在“引导”。比如它给你的答案里,批判了“多写几遍就会了”,因为这是个片面表述,RLHF训练让它倾向于输出批判内容。但如果你的prompt是“为什么多写几遍就会了”,它就会输出另外一种更容易高分的答案。
: 另外还有注意力因素。你贴给它的每个词都有强度,你感觉不到里面的倾向或引导,但实际上是存在的。如果你把prompt改成JSON或Markdown格式的结构化提示词,它输出的回答也会不同。
--
FROM 39.144.79.*