Kimi 发布 K2.5 模型：强化视觉理解、代码复现与多智能体协同

Kimi K2.5 正式开源：能看图、能写代码、还能组队干活

月之暗面今天正式发布并开源 Kimi K2.5 —— 这不是一次普通的模型升级，而是一次让普通人也能用AI完成复杂工作的落地突破。它不再只是“能回答问题”的聊天机器人，而是能直接看懂你发来的截图、录屏、文档，然后动手帮你把事情做完。

你拍一张手机屏幕上的网页设计图，Kimi K2.5 能直接给你生成一套能跑的 HTML + CSS 代码；你录一段操作 Excel 的过程，它能复现整个数据处理流程，甚至自动写好公式和宏；你拖进一份 PPT，它能帮你优化排版、提炼要点，甚至重写演讲稿。这些不是演示片段，而是真实用户在测试中反复验证过的功能。

不用再截图发群里问了，它自己能看懂

过去我们遇到设计稿转代码、表格整理、PPT改稿，第一反应是截图发给同事、贴到群里问“谁会弄？”现在，你只需要把截图、录屏、甚至 Word 里的表格直接丢给 Kimi K2.5，它就能理解你想要什么。

一位前端开发者测试时，把手机录屏发给模型——画面里他手动点击了三个按钮，填了表单，提交后跳转到成功页面。Kimi K2.5 不仅还原了整个操作路径，还生成了对应的 React 组件代码，连错误处理和加载状态都考虑到了。他说：“这比让实习生学一周还快。”

不只是程序员。设计师、运营、行政、学生……只要是需要把“视觉信息”转成“可执行任务”的人，都能用上。你不用懂代码，也不用会写公式，只要你会截图、会录屏，Kimi 就能接住你的需求。

它不一个人干，它拉了个团队

Kimi K2.5 最让人意外的，是它突然“会分工”了。

过去的大模型，再强也是单打独斗。处理一个复杂任务，比如“分析100份销售报表，对比季度趋势，生成可视化图表，再写一份PPT汇报”，它容易卡住、出错、效率低。

现在，Kimi K2.5 会自己创建多个“分身”，每个分身负责一部分：一个专门读Excel，一个负责画图，一个写文案，一个排版PPT。它们互相校验、同步进度，最终把结果拼起来。实测中，原本要15分钟才能完成的多步骤任务，现在只要不到4分钟。

这不是科幻。它已经在企业内部的自动化流程中跑起来了——有人用它自动处理每月财务对账，有人用它批量生成客户报告。效率提升最高达到4.5倍，而且错误率更低。

办公软件，它真会用

很多人说AI能写文章、能写代码，但一碰到Word、Excel、PPT就哑火——因为这些软件太杂、太依赖操作细节。

Kimi K2.5 不是“描述”该怎么操作，而是真能“模拟”操作。它能：

自动识别Word里混乱的标题层级，一键重排目录
从一堆杂乱的销售数据中，找出异常值并标注原因
把一段文字转成PPT，自动匹配配色、图标、动画节奏
甚至能读取你本地的模板文件，按你的习惯格式输出

这不是调用API的“伪智能”，而是模型真正理解了这些软件的结构和逻辑。你不需要安装插件，也不用学习新工具——你用什么，它就适配什么。

开源了，还能集成到你的编辑器里

Kimi K2.5 不只是个App里的功能，它已经开源，代码和权重都在GitHub上公开。开发者可以本地部署，也可以基于它做二次开发。

同时，全新的 Kimi Code 编程助手也同步上线，支持 VSCode、Cursor、JetBrains 系列编辑器。安装后，你写注释，它自动生成代码；你选中一段报错日志，它直接告诉你怎么修；你画个界面草图，它给你生成前端结构。很多开发者反馈：“现在写代码，像在和一个懂行的搭档一起敲键盘。”

还有配套的 Agent SDK，让企业可以把自己的流程接入这个“智能团队系统”。比如客服系统自动处理工单、HR自动筛选简历、市场部自动生成周报——这些曾经需要专人处理的重复劳动，现在可以交给Kimi K2.5去跑。

现在就能用，别等了

你不需要等什么“内测资格”：

直接访问 Kimi官网，登录就能用
更新到最新版 Kimi App（iOS/安卓），截图、录屏功能已上线
开发者登录 Kimi API 平台，调用模型接口
VSCode 用户搜索 “Kimi Code” 安装插件，立刻启用

它不是未来的产品，是今天就能让你少加班、少发群消息、少被老板催的工具。如果你还在用AI只是问“今天天气怎么样”，那你可能错过了它真正能帮你做的事。

CB科技站