- 主题:openai这次o1不太行
- 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
 #发自zSMTH@CDU.MP
 --
 FROM 117.23.183.*
 
- 怎么不大行了?  
 
 【 在 VincentGe (VincentGe) 的大作中提到: 】
 :  我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
 :  #发自zSMTH@CDU.MP
 :  --
 :
 --
 FROM 117.143.102.*
 
- 数学推导是怎么实现的?
 
 【 在 VincentGe 的大作中提到: 】
 : 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
 : #发自zSMTH@CDU.MP
 --
 FROM 210.77.28.*
 
- 靠自推理,直观理解就是思维链的扩大化。
 
 越是准确的前文越是能生成准确的后文
 
 如果以前是问1+1等于几,直接回答 2
 现在是 先思考你问什么,这是一个简单的加法,求和,然后再返回2,中间有思路有过程,这样有利于正确的答案的提出。由于我们很多文本都是去除脚手架后的,缺乏哪些深入的细节和思维过程,因此添加过程后自然高了。
 
 细节上就是RL的扩大版,对于前文按照某种段落生成思维树,做搜索,然后训练,类似于下题的自博弈。
 
 【 在 icome 的大作中提到: 】
 :
 : 数学推导是怎么实现的?
 :
 : 【 在 VincentGe 的大作中提到: 】
 : : 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
 
 #发自zSMTH@CDU.MP
 --
 FROM 113.143.106.*
 
- 方向不太好,如果按照我的理解,这个模型最合适的地方是合成数据。
 
 现在我们需要的不是一个知识模型,而是具备极高迁移学习能力的的小模型,只要这个模型出来,我们就可以彻底宣告AI时代来临
 
 【 在 stevenwyy 的大作中提到: 】
 :
 : 怎么不大行了?
 :
 : 【 在 VincentGe (VincentGe) 的大作中提到: 】
 : : 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
 
 #发自zSMTH@CDU.MP
 --
 FROM 113.143.106.*
 
- 如果以前是问1+1等于几,直接回答 2
 
 我的理解
 如果问1000+1000
 过去是搜索
 现在是真算
 【 在 VincentGe 的大作中提到: 】
 : 靠自推理,直观理解就是思维链的扩大化。
 : 越是准确的前文越是能生成准确的后文
 : 如果以前是问1+1等于几,直接回答 2
 : ...................
 --
 FROM 36.110.6.*
 
- 我没看现在大模型怎么搞
 
 但数学推导与证明是AI上世纪六七十年代符号主义的优势
 
 
 【 在 icome 的大作中提到: 】
 : 数学推导是怎么实现的?
 --
 修改:pixYY FROM 111.36.201.*
 FROM 111.36.201.*
 
- 昨天看微博上说还是没解决5.11>5.9这类问题
 --
 FROM 202.100.50.*
 
- 分解成子问题,再调用专门工具
 这样就精准了
 
 【 在 alpaca 的大作中提到: 】
 : 昨天看微博上说还是没解决5.11>5.9这类问题
 --
 FROM 101.24.102.*
 
- 陶哲轩的评价还是挺高的。
 相当于一个研究生助手。
 
 【 在 VincentGe 的大作中提到: 】
 : 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
 : #发自zSMTH@CDU.MP
 --
 FROM 114.92.109.*