谷歌发布Gemini 3.1 Pro，推理能力是前代的两倍

谷歌于本周四（2月19日）发布最新代理式模型Gemini 3.1 Pro，现已向企业、开发者及付费用户开放。新模型在推理能力和编程能力上显著提升，并在多项基准测试中超越Anthropic和OpenAI的竞品模型。

Gemini 3.1 Pro基于Gemini 3系列开发，在核心推理能力上实现进一步突破。根据谷歌公布的ARC-AGI-2（抽象推理能力）基准测试结果，3.1 Pro得分达到77.1%，是3 Pro版本推理性能的两倍以上。此外，新版Gemini 3.1 Pro在GPQA Diamond（科学知识）、Terminal-Bench 2.0（代理终端编程）、SciCode（科研编程）、APEX-Agent（长程专业任务）、t2-bench（代理工具使用）、BroweComp（代理搜索）及MMMLU（多语问答）等多项基准测试中，均优于竞争对手如Anthropic Opus 4.6和GPT-5.2。

谷歌表示，Gemini 3.1 Pro更聪明，解决复杂问题的能力更强，适用于多种实际任务。首先，它能将文字描述转化为程序代码，例如根据英国古典小说《呼啸山庄》的文本，生成能捕捉主角个性的具象画面；它还能编写程序生成动态图表，直接从文字提示生成可用于网站的动态SVG图像；其系统合成能力可借助高级推理整合复杂的API与设计，例如构建动态航天仪表盘，可视化空间站轨道遥感数据。3.1 Pro还配备了一个3D星椋鸟群飞（starling murmuration）交互设计工具，不仅能生成视觉代码，还允许用户控制鸟群飞行轨迹，生成的声音会随距离远近变化，该工具支持用户制作内容丰富的原型。

目前，Gemini 3.1 Pro已面向消费者、企业与开发者部署。具备付费方案Google AI Pro或Ultra资格的用户，可在Gemini应用和NotebookLM中使用。企业用户可通过Vertex AI和Gemini Enterprise访问该模型。开发者则可通过Gemini AI Studio、Gemini CLI、Google Antigravity以及Android Studio中的Gemini API使用3.1 Pro预览版。

此外，最新版Gemini Pro模型也以预览形式上线GitHub Copilot，使Gemini 3.1 Pro成为继GPT-5.3-Codex和Claude 4.6 Opus之后，第三个登陆GitHub Copilot平台的顶尖模型。

Google 人工智能推理能力 Gemini 3.1 Pro

CB科技站

谷歌发布Gemini 3.1 Pro，推理能力是前代的两倍

与本文相关的文章