Google预览新模型Gemini 2.5 Flash，导入思考预算机制提升推理控制弹性

Google宣布推出新预览语言模型Gemini 2.5 Flash，主打具备可切换推理功能与思考预算（Thinking Budget）控制机制，协助开发者在速度、成本与结果品质之间取得更细緻的平衡。相较先前版本2.0 Flash，本次更新在保留高运算效率的前提，进一步强化对複杂任务的理解与处理能力，特别是可明显提升需要多步骤推理指令的回答準确度。

Gemini 2.5 Flash为Google第一个混合式推理模型，允许开发者透过API或Google AI Studio介面，依据使用场景决定是否启用模型的思考能力，并可设定Token上限作为推理预算。系统将依据提示字串的难度，自动判断是否进入推理程序以及推理的长度，避免资源浪费。开发者也可将预算设为0，跳过推理阶段，以最低延迟回应简单问题。

在推理能力评估方面，Gemini 2.5 Flash在开源测试平台LMArena的Hard Prompts测试表现接近旗舰级2.5 Pro模型，表示其已具备处理跨领域计算、逻辑推论与结构分析的能力，同时保有相对轻量的参数规模与运算成本。Google指出，Gemini 2.5 Flash透过可设定的推理预算机制，提供开发者在成本、延迟与品质之间更灵活的控制方式，适用于处理语言理解、资料分析与决策辅助等具备不同複杂度的任务。

Gemini 2.5 Flash已于Google AI Studio与Vertex AI平台开放预览，开发者可透过新参数thinking_budget控制模型的推理深度，範围从0至24,576 Tokens，不仅支援API呼叫，也提供图形化控制介面调整，并可参考官方提供的Gemini Cookbook範例进行试验。Google表示，未来将持续改进Flash系列模型并扩展适用範围，预计在进入正式发布阶段前，还会释出更多版本更新与功能细节。

CB科技站

Google预览新模型Gemini 2.5 Flash，导入思考预算机制提升推理控制弹性

与本文相关的文章