- 主题:Re: 今天以示例给孩子证明deepseek好过豆包
不觉得字节会故意让豆包不会的问题就瞎扯,我认为这只是一个效果不太好的case。
豆包和deepseek应该是互有优劣的,至少不能根据这一个case就说豆包不好。
【 在 sunsungll 的大作中提到: 】
: 孩子看一个电影,片尾曲不是英文,问我什么语言
: 我也不会
: 问豆包,因为它有语音输入,方便
: ...................
--
FROM 219.143.199.*
你想多了,翻翻我的历史发帖看看像不像水军。
我也算半个业内人士(跟字节无关),同事们这俩都会用,国外的一些也会用,日常使用不至于说哪个碾压另一个。而且这个领域进步很快,一个月后的评测指标就不一样了。
【 在 sunsungll 的大作中提到: 】
: 水木体质内说内部都用deepseek,我认为体质内还是人才济济的
: 水木发帖没人给我钱,我从来不会想哪个id是不是水军
: 握手!
: ...................
--
FROM 219.143.199.*
从我的角度看,找一个case太容易了。
很多论文都会拿各大模型跑评测集,总会有A模型不好B模型好的case,找单个case很容易且不太说明问题。
对于普通用户,都能解决大部分问题,正确率83%还是85%用户的体验并不明显。
当我们用大模型蒸馏数据的时候,会生产某个类别下的大量数据,这时会发现不同模型对于某一类任务的表现有差异,我们往往会对一个任务评估一下各模型的表现,再决定用哪个模型大规模生产数据。
【 在 sunsungll 的大作中提到: 】
: 握手!
: 11楼有人也说了一个case,说ds强.
: 但是整个楼没有人列出某个出豆包强的cases
: ...................
--
FROM 219.143.199.*