最新消息:关注人工智能 AI赋能新媒体运营

Kimi K2.5上线:视觉体验与工具调用全面升级

科技资讯 admin 浏览

Kimi K2.5悄然上线,用户实测:能看图、能写代码、还能生成3D模型

没预告、没发布会,Kimi K2.5就这么悄无声息地出现在了kimi.com的网页端。不少用户一觉醒来,发现聊天框里的AI突然“变聪明了”——不仅能看图,还能根据截图画出房间布局,甚至直接生成可交互的3D模型。没人通知,但反馈已经刷屏。

有人上传了一张朋友公寓的平面图,不到一分钟,Kimi就给出了一个可旋转的Three.js 3D模型,连门窗位置、梁柱走向都对得上。还有开发者测试它写Python脚本处理Excel数据,结果不仅代码规范,还主动加了注释和异常处理。一位用户在社交媒体上写道:“这不是升级,是换了个脑子。”

image.png

能看图、能调工具,这次不只是“更听话”

过去Kimi的强项是写代码和长文本,但Kimi K2.5真正让人眼前一亮的是它“看得懂”和“做得了”。

现在你可以直接上传图片:一张餐厅菜单,它能帮你算出人均消费;一张手绘的电路图,它能还原成标准的Fritzing布局;甚至一张杂乱的办公桌照片,它也能列出“该整理的五件事”。这不是简单的图像识别,而是理解场景、推理意图。

更实用的是“工具调用”功能。它不再只是回答问题,而是能一步步“动手”:比如你问“帮我把上周的会议记录整理成待办清单”,它会先提取关键事项,再自动分类优先级,最后输出一个可复制的Markdown表格。有开发者实测它调用API查天气、查航班、甚至自动填表,整个过程像一个有思维的助手,而不是一个问答机器人。

有用户拿它和Gemini 3 Pro对比,说:“Kimi K2.5在实际任务里的反应,比某些大厂的旗舰模型更接地气。”

开源呼声高涨,API已开放,完整版还会远吗?

最让技术圈兴奋的,不是功能有多强,而是——它会不会开源?

目前,通过官方API,开发者已经能接入视觉识别和思考模式。GitHub上已有开发者用Kimi K2.5搭建了自动设计海报、解析PDF图表的小工具。不少人留言:“别藏了,放出来吧,我们帮你测bug。”

虽然Moonshot AI还没官宣开源计划,但内部消息显示,团队正在准备模型权重的合规审查。有知情人士透露,他们希望先让企业用户和核心开发者“用起来”,再决定是否开放完整版本。但社区的期待已经压不住了:Reddit上一条帖子“Kimi K2.5:下一个开源AI明星?”获得近2万点赞;国内某开源平台的讨论区,相关话题热度三天翻了五倍。

普通人也能用,它正在悄悄改变日常

别以为这些功能只对程序员有用。

一位妈妈用它上传孩子的手绘作业,AI帮她把涂鸦转成清晰的线稿,打印出来当装饰画;一个自由职业者上传了杂乱的发票照片,Kimi自动分类、标金额、生成Excel表格,省下三小时整理时间;甚至有人用它分析网购的穿搭图,给出“配色建议”和“相似单品推荐”。

没有炫技,没有术语,就是实实在在地帮你把麻烦事变简单。这才是最打动人的地方。

接下来会怎样?

Kimi K2.5的发布,不像一场产品发布会,更像一次“悄悄的进化”。没有喧嚣,但用户用行动投票:它好用,就值得继续用。

接下来,大家最关心的有三件事:

  • 会不会推出手机App?目前仅限网页端,很多人希望能在微信或钉钉里直接调用。
  • 有没有免费额度?现在API有限流,普通用户担心未来收费。
  • 开源时间表?如果真开放权重,它可能成为国产AI里最被广泛使用的模型之一。

我们不会预测未来,但可以肯定:当一个AI不需要你喊“请帮我”就能主动理解你的需求,它就不再是工具,而是伙伴。Kimi K2.5,也许就是那个开始。