中国AI初创企业月之暗面近日宣布开源新一代模型Kimi K2.5,并将其定位为“视觉型代理智能”,宣称是目前能力最强的开源模型之一。该模型具备原生多模态能力,能够在处理复杂任务时,自动生成并协调最多100个子代理,并行处理大规模工作流程。
月之暗面于2023年在北京创立,同年推出Kimi聊天机器人,主要致力于开发“能实际完成工作的AI”。去年曾开源Kimi K2模型。
新一代Kimi K2.5是在Kimi K2基础上持续预训练而成,并额外使用约15万亿个混合文本与视觉的Token进行训练。模型架构采用原生多模态设计,使其能够同时理解文字、图片与视频内容。月之暗面表示,在足够规模下,视觉与文本能力无需取舍,可同步提升,为真实应用场景提供稳定基础。
Kimi K2.5的最大特色是“代理群(Agent Swarm)”。当任务复杂度提升时,K2.5可自动拆解问题,动态生成最多100个子代理,并行执行搜索、编程、数据整理与验证等工作,最多可协调1500次工具调用。
整个代理群由模型自动建立与调度,无需事先定义角色或人工设计工作流程。相较于单一代理模式,代理群可将整体执行时间最多缩短4.5倍。
Kimi K2.5还具备结合视觉的编程能力,可根据自然语言指令直接生成完整的前端界面,包含交互式布局与动画效果,并能通过图片或视频进行程序生成与视觉调试。
Kimi K2.5已可通过Kimi.com、Kimi App、API和Kimi Code使用。Kimi.com与Kimi App目前提供K2.5 Instant、K2.5 Thinking、K2.5 Agent与K2.5 Agent Swarm四种模式,其中Agent Swarm仍处于测试阶段,仅向高级付费用户开放。研究人员和开发者也可通过Hugging Face下载Kimi K2.5模型的权重与配置。