- 主题:谷歌Gemini 3.0 Pro发布
快科技11月19日消息,谷歌最新一代推理模型Gemini 3.0 Pro正式发布,并同步在Google AI Studio推出预览版,开放API接口。该模型即将陆续登陆谷歌旗下各类产品。
一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。
根据谷歌公布的测试数据,Gemini 3 Pro毫无争议地成为当前全球数学能力最强的AI。在被誉为“地狱难度”的数学竞赛基准MathArena中,当GPT-5.1等其他大模型仍在1%左右徘徊时,Gemini 3 Pro一举达到23.4%,遥遥领先。
Gemini 3 还在多个权威榜单中直接“封神”:
LMArena:1501 分(历史最高)
HLE(通用推理能力):37.5%,超过 GPT-5 Pro
GPQA Diamond:91.9%
事实准确性 SimpleQA:72.1%
--
修改:Luftmench FROM 117.36.116.*
FROM 117.36.116.*
编程能力方面,尽管在SWE-Bench上未取得SOTA成绩,但仍稳居第一梯队。其在Live Code Bench的Elo得分突破2400分,并在工具调用与终端操作基准测试中排名第一。
更令人震撼的是其视觉理解能力:对屏幕截图的理解准确率高达72.7%,达到现有最先进水平的两倍。这意味着AI Agent将不再是“视觉障碍者”,有望彻底重塑AI操作计算机的交互模式。
此外,谷歌还同期发布了自家的Agentic编程平台——Google Antigravity,再添一枚“技术砝码”。
根据Model Card披露,Gemini 3 Pro在推理、多模态、Agent工具使用等关键基准测试中实现了全面领先。
在硬件层面,Gemini 3 Pro基于谷歌自研的张量处理单元(TPU)训练。相比CPU,TPU在处理大语言模型所需的大规模计算时速度更快,其配备的大容量高带宽内存也使其能够高效运行超大模型与批量数据。
--
FROM 117.36.116.*
Gemini 3 的多模态测试全面拉满:
MMMU-Pro:81%
Video-MMMU:87.6%
代表它在理解视频内容、识别动作、提取信息、进行场景推理方面几乎是行业天花板。
--
FROM 117.36.116.*
刚刚有人用过 被删除了800G的资料
到处求人恢复
哈哈哈
【 在 Luftmench 的大作中提到: 】
: 快科技11月19日消息,谷歌最新一代推理模型Gemini 3.0 Pro正式发布,并同步在Google AI Studio推出预览版,开放API接口。该模型即将陆续登陆谷歌旗下各类产品。
: 一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。
: 根据谷歌公布的测试数据,Gemini 3 Pro毫无争议地成为当前全球数学能力最强的AI。在被誉为“地狱难度”的数学竞赛基准MathArena中,当GPT-5.1等其他大模型仍在1%左右徘徊时,Gemini 3 Pro一举达到23.4%,遥遥领先。
: ...................
--
FROM 183.157.222.*
哈哈,就像每次找人讨论某个名人的学术文章和内容时,总有人把话题引到热门八卦上
应该是想凑上话题,但是学习的时候挑简单的学
【 在 Bruce12 的大作中提到: 】
: 刚刚有人用过 被删除了800G的资料
: 到处求人恢复
: 哈哈哈
: ...................
--
FROM 163.125.217.*
我让它登录到我的zfs和它讨论扩容方案,它为了证明我的想法不对,决定给我现场演示一下我考虑的那条路线的zpool remove是执行不下去的。
因为我是allow它做任何事情的,根本拦不住...
尼玛把我吓的半死,这要成功了马上几十T数据灰飞烟灭....
【 在 Bruce12 的大作中提到: 】
: 刚刚有人用过 被删除了800G的资料
: 到处求人恢复
: 哈哈哈
: ...................
--
修改:lvsoft FROM 39.144.45.*
FROM 39.144.45.*
这说明除了中国公司不买英伟达的显卡,连美国公司都不买英伟达的显卡了
--
FROM 171.213.151.*
科技爆料人汤姆·沃伦撰文称,知情人士向他透露,OpenAI计划通过即将推出的GPT-5.2,对谷歌的Gemini 3系列模型首度展开回应。目前该模型已经准备就绪。知情人士称,GPT-5.2应该能弥补谷歌上个月发布Gemini 3所拉开的差距。
--
FROM 125.76.212.*