谷歌于本周四(2月19日)发布最新代理式模型Gemini 3.1 Pro,现已向企业、开发者及付费用户开放。新模型在推理能力和编程能力上显著提升,并在多项基准测试中超越Anthropic和OpenAI的竞品模型。
Gemini 3.1 Pro基于Gemini 3系列开发,在核心推理能力上实现进一步突破。根据谷歌公布的ARC-AGI-2(抽象推理能力)基准测试结果,3.1 Pro得分达到77.1%,是3 Pro版本推理性能的两倍以上。此外,新版Gemini 3.1 Pro在GPQA Diamond(科学知识)、Terminal-Bench 2.0(代理终端编程)、SciCode(科研编程)、APEX-Agent(长程专业任务)、t2-bench(代理工具使用)、BroweComp(代理搜索)及MMMLU(多语问答)等多项基准测试中,均优于竞争对手如Anthropic Opus 4.6和GPT-5.2。
谷歌表示,Gemini 3.1 Pro更聪明,解决复杂问题的能力更强,适用于多种实际任务。首先,它能将文字描述转化为程序代码,例如根据英国古典小说《呼啸山庄》的文本,生成能捕捉主角个性的具象画面;它还能编写程序生成动态图表,直接从文字提示生成可用于网站的动态SVG图像;其系统合成能力可借助高级推理整合复杂的API与设计,例如构建动态航天仪表盘,可视化空间站轨道遥感数据。3.1 Pro还配备了一个3D星椋鸟群飞(starling murmuration)交互设计工具,不仅能生成视觉代码,还允许用户控制鸟群飞行轨迹,生成的声音会随距离远近变化,该工具支持用户制作内容丰富的原型。
目前,Gemini 3.1 Pro已面向消费者、企业与开发者部署。具备付费方案Google AI Pro或Ultra资格的用户,可在Gemini应用和NotebookLM中使用。企业用户可通过Vertex AI和Gemini Enterprise访问该模型。开发者则可通过Gemini AI Studio、Gemini CLI、Google Antigravity以及Android Studio中的Gemini API使用3.1 Pro预览版。
此外,最新版Gemini Pro模型也以预览形式上线GitHub Copilot,使Gemini 3.1 Pro成为继GPT-5.3-Codex和Claude 4.6 Opus之后,第三个登陆GitHub Copilot平台的顶尖模型。