现在靠RL吧?
另外有没有语言的区别在于,是否能通过语言高效抽象理解世界,语言是否能作为输入token影响最终输出
比如理想前一代VLA,可以通过语言影响ACTION,比如命令超车,靠边停车,往前50米什么的,识别到路口防御驾驶降速啥的
只是由LLM输出实现得不好,L部分效率不高。
【 在 Icanread 的大作中提到: 】
: 靠,我手打的!
: 以前用ngram时的确有可能可以debug,从用神经网络后lstm开始就不可能debug都是黑盒
:
: ...................
--
FROM 58.246.240.*