最新消息:关注人工智能 AI赋能新媒体运营

Kimi 发布 K2.5 模型:强化视觉理解、代码复现与多智能体协同

科技资讯 admin 浏览

Kimi K2.5 正式开源:能看图、能写代码、还能组队干活

月之暗面今天正式发布并开源 Kimi K2.5 —— 这不是一次普通的模型升级,而是一次让普通人也能用AI完成复杂工作的落地突破。它不再只是“能回答问题”的聊天机器人,而是能直接看懂你发来的截图、录屏、文档,然后动手帮你把事情做完。

你拍一张手机屏幕上的网页设计图,Kimi K2.5 能直接给你生成一套能跑的 HTML + CSS 代码;你录一段操作 Excel 的过程,它能复现整个数据处理流程,甚至自动写好公式和宏;你拖进一份 PPT,它能帮你优化排版、提炼要点,甚至重写演讲稿。这些不是演示片段,而是真实用户在测试中反复验证过的功能。

image.png

不用再截图发群里问了,它自己能看懂

过去我们遇到设计稿转代码、表格整理、PPT改稿,第一反应是截图发给同事、贴到群里问“谁会弄?”现在,你只需要把截图、录屏、甚至 Word 里的表格直接丢给 Kimi K2.5,它就能理解你想要什么。

一位前端开发者测试时,把手机录屏发给模型——画面里他手动点击了三个按钮,填了表单,提交后跳转到成功页面。Kimi K2.5 不仅还原了整个操作路径,还生成了对应的 React 组件代码,连错误处理和加载状态都考虑到了。他说:“这比让实习生学一周还快。”

不只是程序员。设计师、运营、行政、学生……只要是需要把“视觉信息”转成“可执行任务”的人,都能用上。你不用懂代码,也不用会写公式,只要你会截图、会录屏,Kimi 就能接住你的需求。

它不一个人干,它拉了个团队

Kimi K2.5 最让人意外的,是它突然“会分工”了。

过去的大模型,再强也是单打独斗。处理一个复杂任务,比如“分析100份销售报表,对比季度趋势,生成可视化图表,再写一份PPT汇报”,它容易卡住、出错、效率低。

现在,Kimi K2.5 会自己创建多个“分身”,每个分身负责一部分:一个专门读Excel,一个负责画图,一个写文案,一个排版PPT。它们互相校验、同步进度,最终把结果拼起来。实测中,原本要15分钟才能完成的多步骤任务,现在只要不到4分钟。

这不是科幻。它已经在企业内部的自动化流程中跑起来了——有人用它自动处理每月财务对账,有人用它批量生成客户报告。效率提升最高达到4.5倍,而且错误率更低。

image.png

办公软件,它真会用

很多人说AI能写文章、能写代码,但一碰到Word、Excel、PPT就哑火——因为这些软件太杂、太依赖操作细节。

Kimi K2.5 不是“描述”该怎么操作,而是真能“模拟”操作。它能:

  • 自动识别Word里混乱的标题层级,一键重排目录
  • 从一堆杂乱的销售数据中,找出异常值并标注原因
  • 把一段文字转成PPT,自动匹配配色、图标、动画节奏
  • 甚至能读取你本地的模板文件,按你的习惯格式输出

这不是调用API的“伪智能”,而是模型真正理解了这些软件的结构和逻辑。你不需要安装插件,也不用学习新工具——你用什么,它就适配什么。

开源了,还能集成到你的编辑器里

Kimi K2.5 不只是个App里的功能,它已经开源,代码和权重都在GitHub上公开。开发者可以本地部署,也可以基于它做二次开发。

同时,全新的 Kimi Code 编程助手也同步上线,支持 VSCode、Cursor、JetBrains 系列编辑器。安装后,你写注释,它自动生成代码;你选中一段报错日志,它直接告诉你怎么修;你画个界面草图,它给你生成前端结构。很多开发者反馈:“现在写代码,像在和一个懂行的搭档一起敲键盘。”

还有配套的 Agent SDK,让企业可以把自己的流程接入这个“智能团队系统”。比如客服系统自动处理工单、HR自动筛选简历、市场部自动生成周报——这些曾经需要专人处理的重复劳动,现在可以交给Kimi K2.5去跑。

image.png

现在就能用,别等了

你不需要等什么“内测资格”:

  • 直接访问 Kimi官网,登录就能用
  • 更新到最新版 Kimi App(iOS/安卓),截图、录屏功能已上线
  • 开发者登录 Kimi API 平台,调用模型接口
  • VSCode 用户搜索 “Kimi Code” 安装插件,立刻启用

它不是未来的产品,是今天就能让你少加班、少发群消息、少被老板催的工具。如果你还在用AI只是问“今天天气怎么样”,那你可能错过了它真正能帮你做的事。