反重力里的Gemini Flash现在是个超级大垃圾了

水木社区手机版

主题:反重力里的Gemini Flash现在是个超级大垃圾了
7楼|lvsoft|2026-05-08 00:11:40|展开
推荐 DeepSeek.

是的，Deepseek v3/r1的时候我认为ds就是垃圾没法用。
但这版v4开始很好，在跟glm5.1的对比中我认为两者不相上下甚至更好。
目前我在重度使用 DSV4 Pro。但才用了两天，还有很多东西要评估。只能说初步感受很不错。

【在 z16166 的大作中提到: 】
: 没钱了，cursor订阅里的API quota都打满了（号称有400刀的价值，鬼知道实际是多少）
: 现在让Gemini Flash审核代码，不要它改了。
:
--
FROM 116.230.107.*
8楼|lvsoft|2026-05-08 00:17:23|展开
所以需要Rust。
gemini一直是这样的，gemini2.5的时候它就非常的不稳定，基本上没有办法确定的干好任何一件事情。完全一样的prompt输入的代码，改当中一行的过程中，它都可以把其他不需要改的代码改掉。但我就是在这个时候靠它每天写一万行可运行可通过测试的代码的。

现在的gemini3/3.1已经比以前好太多了，flash也是从2.5的时候一个弱智，进化到现在一个小pro的状态。

对于gemini，如果只是从执行力的角度来说，它和现在的同期模型比拉垮的一塌糊涂。但它的大局观非常好，gemini目前依然是无可替代的。简单的说就是大部分模型都在拼执行力，但执行力高了这个模型一般就没什么脑子。反过来也一样，有脑子的话它就有自己的理解和想法，不怎么会听从你的指挥。其实跟人某种程度来说也是一样的。

【在 PaoloMaldini 的大作中提到: 】
: 他家怎么现在还这样，之前在cursor里就是编辑文本老出错
: 我甚至遇到过他编辑半天最后告诉我实在没法编辑成功放弃了的情况
:
--
FROM 116.230.107.*
21楼|lvsoft|2026-05-20 16:54:36|展开
我已经退订google的ai ultra，
现在的目标是要以国产模型和本地模型为主了。

【在 z16166 的大作中提到: 】
: 反重力升级了。LSP exe改了个名字。
: 不能设置字体大小，ctrl + 加号也不能放大字体了
: 不能安装vscode市场的插件了。SuperSmooth插件用不了了，每次都要点击确认，估计还得设置通配，全都放行才行。
: ...................
--
FROM 116.230.107.*
23楼|lvsoft|2026-05-20 17:04:33|展开
那是相当可以，我现在是v4 flash + qwen3.6-27b
gemini就是干干美工
【在 poocp 的大作中提到: 】
: 前几天就用DeepSeek给Gemini擦屁股，V4还行。
:
--
FROM 116.230.107.*
26楼|lvsoft|2026-05-20 17:17:26|展开
当然不是，国产模型依然是落后的

【在 hgoldfish 的大作中提到: 】
: 为啥？国产的更聪明吗？
:
--
修改:lvsoft FROM 116.230.107.*
FROM 116.230.107.*
27楼|lvsoft|2026-05-20 17:22:06|展开
DeepSeek V3开始，文学能力就很强。DeepSeek-V3的最大问题是喜欢胡说八道，这里包括过高的幻觉和过于发散的思路。V4就好了很多。

豆包是上不了台面的。我甚至觉得可能只是一个7-30b的小模型，不太聪明的样子。
qwen本来就主打小模型。我甚至觉得别家是先大模型，然后再蒸馏出小模型。他们家似乎是先做个小模型，然后把它撑大作为大模型发布，仅仅是为了完成KPI。qwen的大模型我没感觉到比小模型有任何强的地方，很多时候甚至还更差。

其他几个主流模型都是coding特化的，偏理。

【在 poocp 的大作中提到: 】
: 不谈编程，gemini和deepseek的文学水平其实差不多，比qwen或者豆包高明不止一个身位。
:
--
FROM 116.230.107.*
29楼|lvsoft|2026-05-20 19:32:25|展开
这个模型我也用。这个模型比较奇葩，有的地方它比千问要好很多，但有的时候它又比千问差很多。
目前我还没有吃透这个模型。
【在 smthhz 的大作中提到: 】
: gemma怎样，也是小模型
--
FROM 116.230.107.*
35楼|lvsoft|2026-05-21 10:43:17|展开
没有必要，而且慢
【在 RuralHunter 的大作中提到: 】
: 怎么不用v4 pro？
:
--
FROM 116.230.107.*
37楼|lvsoft|2026-05-21 14:07:52|展开
我要是跟你说我上个月在glm5.1上用掉了7w rmb的token你会不会吓死...

【在 gfkid 的大作中提到: 】
: 现在国产top模型不便宜了啊
: glm5.1一个月要16刀
: :
--
FROM 116.230.107.*
47楼|lvsoft|2026-06-03 21:32:50|展开
没有没有，我前面说了，蹭的朋友的私有化部署的glm5.1，我确实是干掉了7w的token，但实际上不要钱。

不过我确实也投入了不少硬件，6000 pro, 4090 48g, a100*2, 3090*n, 3080-20g*n, 2080ti-22g*n....
我太喜欢搞私有化部署了....基本上全收集了...甚至连jetson，amd的显卡都有...
再加上去年一个月1000$的烧token，学费是交了很多的，至少肯定远远不止7w...

产出嘛，目前还是加速人类的产出，我是觉得这本质上还是人类的产出，得完全是ai自己全流程搞定的产出才算是它的。我目前的目标是先不断削减人类参与的比重，让整个人类参与流程可以简化到只要一副AR眼镜就可以搞定的程度，然后我要先赛博游牧一段时间，边旅游边让AI干活。最终达到我可以完全不管事，让AI养我的程度。
【在 hgoldfish 的大作中提到: 】
: 好奇奢侈博你 7w 的投入，能不能得到 700w 的产出啊？
:
--
FROM 116.230.107.*