- 主题:Re: 阿里Qwen臆想症,要命后还要钱
- 推荐kimi k1.5 长思考模型,能联网搜索,能有类似的深度思考过程。
 效果不错,比想象中好,1月20日上线
 
 【 在 do 的大作中提到: 】
 : 月初开始用deepseek编程也还行,虽然也不是能轻松搞定,但反复debug还能慢慢走。
 : 结果近些天来太火了,实在连不上了,要赶进度,我只好搜下,到底哪个能替代。阿里Qwen的max, 1月25日版说coding评测分数更高,于是获得API Key,vscode+cline试一下。
 : 一个很简单的任务,一段log记录,日期时间开头,然后是大括号,各个Key,与value,各自都有单引号括起来。让他按新的顺序整理,写入新文本文件(本想写入数据库的,但后来想还是一步步来)。
 : ...................
 --
 FROM 111.197.86.*
 
- 自己搭deepseek私服
 【 在 do 的大作中提到: 】
 : 月初开始用deepseek编程也还行,虽然也不是能轻松搞定,但反复debug还能慢慢走。
 : 结果近些天来太火了,实在连不上了,要赶进度,我只好搜下,到底哪个能替代。阿里Qwen的max, 1月25日版说coding评测分数更高,于是获得API Key,vscode+cline试一下。
 : 一个很简单的任务,一段log记录,日期时间开头,然后是大括号,各个Key,与value,各自都有单引号括起来。让他按新的顺序整理,写入新文本文件(本想写入数据库的,但后来想还是一步步来)。
 : ...................
 --
 FROM 112.66.25.*
 
- 本地个人一般只能用量化丐版,不大行
 【 在 chaobill 的大作中提到: 】
 : 自己搭deepseek私服
 --
 FROM 119.125.216.*
 
- 6000美元的CPU完整版ds私服,一秒也就4个词元的生成速度,50多万个词元得等到天荒地老。
 至于70b的版本,那就是个弱智,还不如用qwen2.5.
 
 【 在 chaobill 的大作中提到: 】
 : 自己搭deepseek私服
 --
 FROM 171.221.52.*
 
- 没那么夸张,1小时就1万多词元了,50多万个只要30多个小时就能生成完。而且6000美元的速度没这么低,说是每秒6-8tokens。50多万个不管阅读还是运行我感觉我两天肯定弄不完,够快了。
 【 在 poocp 的大作中提到: 】
 : 6000美元的CPU完整版ds私服,一秒也就4个词元的生成速度,50多万个词元得等到天荒地老。
 : 至于70b的版本,那就是个弱智,还不如用qwen2.5.
 --
 FROM 223.77.78.*