最新消息:关注人工智能 AI赋能新媒体运营

谷歌发布Gemini 3.5 Flash推理模型,主打智能体开发任务

科技资讯 admin 浏览

在周二举行的Google I/O 2026大会上,Google宣布Gemini 3.5 Flash模型正式上线,主打赋能企业与开发者构建强大的智能代理,并试图挑战OpenAI的GPT-5.5和Anthropic的Claude Opus 4.7。

3.5 Flash的最大亮点是显著提升了构建智能代理的能力,它是Gemini 3.5系列中首个发布的版本。Google同时预告,其旗舰版本3.5 Pro正在内部测试中,预计下月正式发布。

3.5 Flash是一款轻量级模型,但在多项推理与编程能力上超越了更大尺寸的模型。在编程开发和智能代理相关基准测试中,它在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等指标上均优于Gemini 3.1 Pro。

该模型还挑战了GPT-5.5和Claude Opus 4.7等旗舰模型。尽管在编程能力、综合推理与知识理解两项测试中仍落后于这两款模型,但在AI代理与工具调用基准测试MCP Atlas中,3.5 Flash以83.6%的得分超越了GPT-5.5(75.3%)和Claude Opus 4.7(79.1%)。其多模态能力尤为突出,在MMMU-Pro和CharXiv Reasoning测试中分别取得83.6%和84.2%的高分,超越了旧版模型及竞品。在Artificial Analysis Intelligence指标和输出速度象限中,3.5 Flash凭借出色的分析能力与响应速度,独居右上象限。

凭借其速度、推理能力和多模态表现,3.5 Flash擅长处理多步骤工作流、大规模部署子代理(Sub-agents)以及长时间运行的复杂任务。该模型配合升级版的Antigravity执行框架,成为强大的引擎,能够协调多个协同工作的子代理,执行复杂的场景任务。在人类监督下,它能高效完成多步骤流程与编程任务,快速规划、构建并迭代解决方案,应对真实世界的问题,无论是开发新应用、维护代码,还是协助编制财务报表,都能大幅缩短原本需要数天甚至数周的工作周期。

Gemini 3.5 Flash目前已全面部署至Gemini应用和Google搜索的AI模式。其中,Google搜索新增的个性化AI搜索代理Gemini Spark,其底层即基于3.5 Flash。对于开发者,新模型已通过Google Antigravity、Google AI Studio及Android Studio的Gemini API开放接入。企业用户则可通过Gemini Enterprise Agent Platform和Gemini Enterprise进行使用。

Google同时发布了Antigravity 2.0。这是一款全新的独立桌面应用程序,为开发者提供集中化的工作空间,用于引导、定制和协调智能代理,无需依赖集成开发环境(IDE)。目前已推出macOS、Linux和Windows版本,可在此下载。