- 主题:大模型交流
图片、视频等的大模型,也是文字的概率吗?之前识别图片的机制是切分、计算概率,现在有没有什么机制上的改变?
【 在 hut 的大作中提到: 】
: 这是他的本质,他就是这样的机制
: 你从人的角度来看,他生成的不符合你的标准
: 你就觉得他在胡说八道
: ...................
--
FROM 103.208.15.*
那就是说,之前识别图片的范式,就是向量化之后算概率,和现在大语音模型的范式,分词之后算概率,其实是一样的?
【 在 hut 的大作中提到: 】
: 向量化之后都是数据
: 然后计算概率
: 文字那个我说的是语言大模型
: ...................
--
FROM 103.208.15.*
文本大模型需要用多层,是因为上下文的原因?还是因为什么原因?
【 在 hut 的大作中提到: 】
: 以前的图片识别,自动驾驶就是用神经网络做的
: 都不用很多层,就能做的很好了
: 文本大模型用了很多层的神经网络
: ...................
--
FROM 103.208.15.*