OpenRouter 推出 Fusion API:多模型协同兼顾性能与成本
AI 模型聚合平台 OpenRouter 上线了 Fusion API 服务。这套系统不依赖单一模型,而是把用户的查询同时发给多个模型并行处理。审查模型会先对各路回答做结构化分析,再由调用模型整合出最终结果。多模型互补的设计,主要为了拉高回答准确率。
官方基准测试显示,Claude Opus4.8 与 GPT-5.5 搭配,并由 Opus4.8 负责最终合成的方案,性能得分达到 69.0%,超过了 Claude Fable5。包含 Claude Opus4.8、GPT-5.5 和 Gemini3.1Pro 的三模型组合,综合表现同样排在 Claude Fable5 前面。
成本控制是这套方案的另一个重点。测试数据里,Gemini3Flash、Kimi K2.6 与 DeepSeek V4Pro 的组合,调用成本只有 Claude Fable5 的一半左右,分数差距控制在 1% 以内。
大模型应用场景变多,开发者需要更精细地算账。Fusion API 提供了一种多模型调度的技术路径。这种协同机制如果铺开,可能会改变企业选型时的成本核算方式。