“灵光”上线:蚂蚁集团推出全球首个可生成可运行应用的多模态AI助手
今天,蚂蚁集团正式发布全新多模态AI助手“灵光”(Lingguang),这款产品不只回答问题,更能直接帮你“做出东西”——无论是3D模型、交互地图、动态图表,还是一个能实时记账的迷你应用,只需一句话,立刻生成、即刻使用。
与传统AI不同,“灵光”不再停留在“告诉你答案”,而是用代码级能力把答案变成你真能点开、拖拽、修改、分享的工具。它不靠插件,不需下载,对话中就能完成从想法到应用的完整闭环。目前,“灵光”已上线苹果App Store和各大安卓应用市场,支持iOS 15+与Android 10+设备,免费使用。
Fast Research:让复杂知识“看得见、摸得着”
当你问“量子纠缠是什么?”、“如何理解通货膨胀?”、“埃及金字塔内部结构是怎样的?”,“灵光”不会给你一段文字,而是直接生成一个可旋转的3D金字塔模型、一段动态解释动画,或一张带数据标注的交互式经济趋势图。
这些内容不是PPT,而是真实可操作的可视化组件:你可以放大看金字塔的墓室细节,拖动时间轴观察GDP变化趋势,点击图表中的数据点查看原始来源。教育机构已开始测试将其用于课堂演示,用户反馈“比看视频学得快三倍”。
实测案例:
- 输入“展示太阳系八大行星轨道”,系统生成可缩放的动态星轨模型,支持切换视角与时间流速。
- 输入“北京地铁早高峰最拥挤线路”,弹出实时热力图,标注换乘压力点与建议出行时间。
- 输入“解释复利效应”,自动生成一个滑动计算器,你输入本金和年限,立刻看到20年后变成多少钱。
Flash App:30秒,一句话生成你的专属小工具
“帮我做个每天喝水提醒+记录的App”、“做一个能自动分类我微信转账的记账本”、“生成一个健身计划,每周三次,每次30分钟,适合上班族”——这些曾经需要找开发者、花几千块才能实现的需求,现在在“灵光”里,30秒内就能变成一个可运行的轻应用。
这些“快应用”无需安装,直接嵌入对话界面,支持保存、分享、二次编辑。你甚至可以把生成的记账工具发给朋友,他点开就能用,无需注册或下载。
目前支持的典型场景包括:
- 健康管理:自动生成饮食记录、运动打卡、睡眠分析仪表盘
- 个人财务:自动识别账单截图,分类支出,生成月度预算图
- 旅行规划:输入“杭州三天两夜,带孩子,避开排队”,自动生成含门票预约链接、亲子餐厅推荐、交通路线的交互式行程单
- 学习工具:生成单词记忆卡片、数学公式推导动画、历史事件时间轴
据蚂蚁内部测试,超过68%的普通用户在首次使用“Flash App”后,当天就重复使用了至少一次,其中35%的人主动分享给了家人或同事。
AGI Camera:手机摄像头,从此能“思考”
打开相机,对准你家的杂乱书桌:“帮我整理一下这张照片,把书本归类,把杂物移走,生成一个整洁版。”——“灵光”不仅能识别物品,还能在图像中智能重绘、去杂、增强,生成你想要的“理想画面”。
更进一步,拍一段短视频,说“把这段视频剪成15秒的抖音风格,加字幕和BGM”,系统会自动识别关键帧、提取语音、匹配节奏、添加流行滤镜,输出一条可直接发布的成品视频。
实测功能包括:
- 识别植物种类并提供养护建议(拍照→识别→推送养护指南)
- 扫描菜单,自动翻译+推荐低卡路里选项(适合健身人群)
- 拍摄孩子画的涂鸦,AI自动补全成完整插画并生成故事脚本
- 对准超市货架,语音问“哪款酱油性价比最高?”,AI比对价格、成分、用户评价,直接标注推荐
这一功能基于蚂蚁自研的视觉理解大模型,已在支付宝“扫一扫”中部分试点,此次全面整合进“灵光”,让手机摄像头真正成为你与数字世界交互的入口。
为什么“灵光”不一样?
市面上的AI助手大多在“回答问题”,而“灵光”在“完成任务”。它背后不是简单的提示词工程,而是深度整合了蚂蚁在AI代码生成、多模态理解、实时渲染和本地化部署上的多年积累。
特别值得注意的是:
- 所有生成的应用都运行在本地安全沙箱中,不上传你的隐私数据;
- 生成的代码清晰可读,高级用户可点击查看源码并自行修改;
- 支持与支付宝、钉钉、高德地图等生态打通,生成的行程可直接同步到高德,记账数据可导入支付宝账单。
蚂蚁集团首席技术官何征宇在发布会上表示:“我们不希望AI只是个聪明的聊天机器人。真正的通用人工智能,应该是像电、像水一样,看不见但无处不在,每个人都能随手用上。‘灵光’就是我们想给普通人的‘数字工具箱’。”
目前,“灵光”已支持中文、英文,日语、韩语版本将在下月上线。未来还将开放开发者接口,允许第三方接入其代码生成引擎,打造专属行业助手。
如果你曾想过:“要是有个工具能帮我做这个就好了”——现在,你只需要说出来。
