谷歌发布Gemini 3，增强推理、多模态及代理能力

Google周二（11月18日）发布了新一代Gemini 3模型，大幅升级了推理、多模态理解及代理能力，当天已部署至Search AI模式、Gemini应用、AI Studio与Vertex AI。

Gemini 3目前包含两大版本。主力版本Gemini 3 Pro是当前公开可用的全功能模型，具备最强的多模态理解、推理与vibe coding能力，并支持100万Token上下文窗口。另一版本Gemini 3 Deep Think为强化推理模式，专为跨领域、高复杂度问题设计，目前仅提供给安全测试者，未来将开放给Google AI Ultra订阅用户。

Google表示，Gemini 3 Pro在多项AI基准测试中创下新高。在LMArena取得1501 Elo分，登上排行榜首位，展现出模型在对战式评估中的整体回答质量。Humanity’s Last Exam得分为37.5%，表明其能处理极高难度的人类推理题。GPQA Diamond达到91.9%，反映模型在博士级科学与研究问题上的理解深度。在针对高难度数学推理的MathArena Apex中，Gemini 3 Pro也取得23.4%的成绩。

在多模态方面，Gemini 3在MMMU-Pro与Video-MMMU等测试中刷新纪录，显示模型在文本、图像、视频与代码推理方面均已达到新水平。

Gemini 3延续Gemini 2.5的代理发展方向，在Vending-Bench 2中展现出全年稳定的模拟运营能力。该测试以经营一台自动售货机长达一年的情境，评估模型能否在季节变化与动态需求下维持连贯策略与正确决策。Gemini 3在此表现显示其具备长期任务中的一致性与耐久性，未来将通过Gemini Agent在产品中落地，协助处理如预约服务、整理收件箱等跨应用任务。

目前Google AI Pro月费为19.99美元，Google AI Ultra月费为249.99美元，开发者API采用按使用量计价，Gemini 3 Pro每百万Token输入约2美元，每百万Token输出约12美元。

Google 多模态推理 Gemini 3

CB科技站

谷歌发布Gemini 3，增强推理、多模态及代理能力

与本文相关的文章