最新消息:关注人工智能 AI赋能新媒体运营

Google预览新模型Gemini 2.5 Flash,导入思考预算机制提升推理控制弹性

科技智能 admin 浏览 评论

Google宣布推出新预览语言模型Gemini 2.5 Flash,主打具备可切换推理功能与思考预算(Thinking Budget)控制机制,协助开发者在速度、成本与结果品质之间取得更细緻的平衡。相较先前版本2.0 Flash,本次更新在保留高运算效率的前提,进一步强化对複杂任务的理解与处理能力,特别是可明显提升需要多步骤推理指令的回答準确度。

Gemini 2.5 Flash为Google第一个混合式推理模型,允许开发者透过API或Google AI Studio介面,依据使用场景决定是否启用模型的思考能力,并可设定Token上限作为推理预算。系统将依据提示字串的难度,自动判断是否进入推理程序以及推理的长度,避免资源浪费。开发者也可将预算设为0,跳过推理阶段,以最低延迟回应简单问题。

在推理能力评估方面,Gemini 2.5 Flash在开源测试平台LMArena的Hard Prompts测试表现接近旗舰级2.5 Pro模型,表示其已具备处理跨领域计算、逻辑推论与结构分析的能力,同时保有相对轻量的参数规模与运算成本。Google指出,Gemini 2.5 Flash透过可设定的推理预算机制,提供开发者在成本、延迟与品质之间更灵活的控制方式,适用于处理语言理解、资料分析与决策辅助等具备不同複杂度的任务。

Gemini 2.5 Flash已于Google AI Studio与Vertex AI平台开放预览,开发者可透过新参数thinking_budget控制模型的推理深度,範围从0至24,576 Tokens,不仅支援API呼叫,也提供图形化控制介面调整,并可参考官方提供的Gemini Cookbook範例进行试验。Google表示,未来将持续改进Flash系列模型并扩展适用範围,预计在进入正式发布阶段前,还会释出更多版本更新与功能细节。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论