它是强化过的上下文输出,你prompt里的每个字都在“引导”。比如它给你的答案里,批判了“多写几遍就会了”,因为这是个片面表述,RLHF训练让它倾向于输出批判内容。但如果你的prompt是“为什么多写几遍就会了”,它就会输出另外一种更容易高分的答案。
另外还有注意力因素。你贴给它的每个词都有强度,你感觉不到里面的倾向或引导,但实际上是存在的。如果你把prompt改成JSON或Markdown格式的结构化提示词,它输出的回答也会不同。
【 在 smallpapaya 的大作中提到: 】
: 到你满意为止。
: 然而这是一个新话题,并没有之前的记录。你要说后面去引导,我还没试过。但这里给出的建议实际上能看出是网上资料的汇集。
--
FROM 219.143.141.*