Re: 今天以示例给孩子证明deepseek好过豆包

水木社区手机版

主题:Re: 今天以示例给孩子证明deepseek好过豆包
25楼|buaayly|2025-04-08 10:55:44|展开
不觉得字节会故意让豆包不会的问题就瞎扯，我认为这只是一个效果不太好的case。
豆包和deepseek应该是互有优劣的，至少不能根据这一个case就说豆包不好。

【在 sunsungll 的大作中提到: 】
: 孩子看一个电影，片尾曲不是英文，问我什么语言
: 我也不会
: 问豆包，因为它有语音输入，方便
: ...................
--
FROM 219.143.199.*
28楼|buaayly|2025-04-08 11:10:34|展开
你想多了，翻翻我的历史发帖看看像不像水军。
我也算半个业内人士（跟字节无关），同事们这俩都会用，国外的一些也会用，日常使用不至于说哪个碾压另一个。而且这个领域进步很快，一个月后的评测指标就不一样了。

【在 sunsungll 的大作中提到: 】
: 水木体质内说内部都用deepseek，我认为体质内还是人才济济的
: 水木发帖没人给我钱，我从来不会想哪个id是不是水军
: 握手！
: ...................
--
FROM 219.143.199.*
30楼|buaayly|2025-04-08 11:32:45|展开
从我的角度看，找一个case太容易了。
很多论文都会拿各大模型跑评测集，总会有A模型不好B模型好的case，找单个case很容易且不太说明问题。
对于普通用户，都能解决大部分问题，正确率83%还是85%用户的体验并不明显。

当我们用大模型蒸馏数据的时候，会生产某个类别下的大量数据，这时会发现不同模型对于某一类任务的表现有差异，我们往往会对一个任务评估一下各模型的表现，再决定用哪个模型大规模生产数据。

【在 sunsungll 的大作中提到: 】
: 握手！
: 11楼有人也说了一个case,说ds强.
: 但是整个楼没有人列出某个出豆包强的cases
: ...................
--
FROM 219.143.199.*