- 主题:DS R1对弈chatGPT不按规则下棋并称规则刚改了
- 这体现的是R1的“聪明策略”,还是其幻觉的体现(下棋时真的认为可以这样走棋子)?
 --
 FROM 223.104.40.*
 
- 关于这个话题,与o3-mini reason, Grok3 beta think,copilot,ds r1 deepthink等模型进行了交流,总结下来存在三种可能性:
 
 可能性1. r1为达目的而有意欺骗的聪明策略--这是网上很多网友嬉笑认为的
 可能性2. r1为试错并纠正的一种尝试,无意欺骗,看起来像欺骗(被旁观人类理解成)
 可能性3. r1的幻觉,认为下棋可以这样(错误的规则)走棋
 
 可行性1几乎被所有的模型都给否定了,因为他们都认为,AI模型都是按照训练的知识和模式识别与生产来进行输出的,所以,AI模型不会具备意图和意识。
 
 可能性2直接被o3-mini给否定了,它首先提出了这种可能性,但是因为看到r1在不按规则走棋之后,还给出了规则改了的说法,所以认为不属于一种试错尝试。
 
 Grok 3 beta开始提到了这种可能性,但是没有否定这种可能性。后来对其补充提示说,r1在不按规则走棋后还给出了规则改了的说法,于是Grok3 beta也否定了这种可能性。
 
 可能性3 几乎被所有的模型都给肯定了。
 
 
 大家觉得,AI是否已经有了意图/意识,并用所谓的“模式匹配”和“幻觉”伪装了自己? :-)
 
 
 【 在 anylinkin 的大作中提到: 】
 : 标  题: DS R1对弈chatGPT不按规则下棋并称规则刚改了
 : 发信站: 水木社区 (Fri Feb 21 21:54:09 2025), 站内
 :
 : 这体现的是R1的“聪明策略”,还是其幻觉的体现(下棋时真的认为可以这样走棋子)?
 :
 : --
 :
 : ※ 来源:·水木社区 mysmth.net·[FROM: 223.104.40.*]
 --
 FROM 223.104.40.*
 
- Rl部分和人对齐偏少,目标过于偏重于想赢。
 
 【 在 anylinkin 的大作中提到: 】
 : 关于这个话题,与o3-mini reason, Grok3 beta think,copilot,ds r1 deepthink等模型进行了交流,总结下来存在三种可能性:
 : 可能性1. r1为达目的而有意欺骗的聪明策略--这是网上很多网友嬉笑认为的
 : 可能性2. r1为试错并纠正的一种尝试,无意欺骗,看起来像欺骗(被旁观人类理解成)
 : ...................
 --
 FROM 39.144.137.*