最新消息:关注人工智能 AI赋能新媒体运营

谷歌发布Gemini 3,增强推理、多模态及代理能力

科技资讯 admin 浏览

Google周二(11月18日)发布了新一代Gemini 3模型,大幅升级了推理、多模态理解及代理能力,当天已部署至Search AI模式、Gemini应用、AI Studio与Vertex AI。

Gemini 3目前包含两大版本。主力版本Gemini 3 Pro是当前公开可用的全功能模型,具备最强的多模态理解、推理与vibe coding能力,并支持100万Token上下文窗口。另一版本Gemini 3 Deep Think为强化推理模式,专为跨领域、高复杂度问题设计,目前仅提供给安全测试者,未来将开放给Google AI Ultra订阅用户。

Google表示,Gemini 3 Pro在多项AI基准测试中创下新高。在LMArena取得1501 Elo分,登上排行榜首位,展现出模型在对战式评估中的整体回答质量。Humanity’s Last Exam得分为37.5%,表明其能处理极高难度的人类推理题。GPQA Diamond达到91.9%,反映模型在博士级科学与研究问题上的理解深度。在针对高难度数学推理的MathArena Apex中,Gemini 3 Pro也取得23.4%的成绩。

在多模态方面,Gemini 3在MMMU-Pro与Video-MMMU等测试中刷新纪录,显示模型在文本、图像、视频与代码推理方面均已达到新水平。

Gemini 3延续Gemini 2.5的代理发展方向,在Vending-Bench 2中展现出全年稳定的模拟运营能力。该测试以经营一台自动售货机长达一年的情境,评估模型能否在季节变化与动态需求下维持连贯策略与正确决策。Gemini 3在此表现显示其具备长期任务中的一致性与耐久性,未来将通过Gemini Agent在产品中落地,协助处理如预约服务、整理收件箱等跨应用任务。

目前Google AI Pro月费为19.99美元,Google AI Ultra月费为249.99美元,开发者API采用按使用量计价,Gemini 3 Pro每百万Token输入约2美元,每百万Token输出约12美元。