谷歌发布Gemini 3.5 Flash推理模型，主打智能体开发任务

在周二举行的Google I/O 2026大会上，Google宣布Gemini 3.5 Flash模型正式上线，主打赋能企业与开发者构建强大的智能代理，并试图挑战OpenAI的GPT-5.5和Anthropic的Claude Opus 4.7。

3.5 Flash的最大亮点是显著提升了构建智能代理的能力，它是Gemini 3.5系列中首个发布的版本。Google同时预告，其旗舰版本3.5 Pro正在内部测试中，预计下月正式发布。

3.5 Flash是一款轻量级模型，但在多项推理与编程能力上超越了更大尺寸的模型。在编程开发和智能代理相关基准测试中，它在Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和MCP Atlas（83.6%）等指标上均优于Gemini 3.1 Pro。

该模型还挑战了GPT-5.5和Claude Opus 4.7等旗舰模型。尽管在编程能力、综合推理与知识理解两项测试中仍落后于这两款模型，但在AI代理与工具调用基准测试MCP Atlas中，3.5 Flash以83.6%的得分超越了GPT-5.5（75.3%）和Claude Opus 4.7（79.1%）。其多模态能力尤为突出，在MMMU-Pro和CharXiv Reasoning测试中分别取得83.6%和84.2%的高分，超越了旧版模型及竞品。在Artificial Analysis Intelligence指标和输出速度象限中，3.5 Flash凭借出色的分析能力与响应速度，独居右上象限。

凭借其速度、推理能力和多模态表现，3.5 Flash擅长处理多步骤工作流、大规模部署子代理（Sub-agents）以及长时间运行的复杂任务。该模型配合升级版的Antigravity执行框架，成为强大的引擎，能够协调多个协同工作的子代理，执行复杂的场景任务。在人类监督下，它能高效完成多步骤流程与编程任务，快速规划、构建并迭代解决方案，应对真实世界的问题，无论是开发新应用、维护代码，还是协助编制财务报表，都能大幅缩短原本需要数天甚至数周的工作周期。

Gemini 3.5 Flash目前已全面部署至Gemini应用和Google搜索的AI模式。其中，Google搜索新增的个性化AI搜索代理Gemini Spark，其底层即基于3.5 Flash。对于开发者，新模型已通过Google Antigravity、Google AI Studio及Android Studio的Gemini API开放接入。企业用户则可通过Gemini Enterprise Agent Platform和Gemini Enterprise进行使用。

Google同时发布了Antigravity 2.0。这是一款全新的独立桌面应用程序，为开发者提供集中化的工作空间，用于引导、定制和协调智能代理，无需依赖集成开发环境（IDE）。目前已推出macOS、Linux和Windows版本，可在此下载。

CB科技站

谷歌发布Gemini 3.5 Flash推理模型，主打智能体开发任务

与本文相关的文章