最新消息:关注人工智能 AI赋能新媒体运营

商汤发布SenseNova U1:原生统一AI模型,告别插件时代

科技资讯 admin 浏览

商汤开源“日日新SenseNova U1”,国产AI迈出关键一步

4月28日晚,商汤科技正式对外开源了其最新大模型产品——“日日新SenseNova U1”系列。这不是一次普通的模型发布,而是一次底层架构的重构。过去几年,市面上的多模态AI模型,无论是图像识别还是图文生成,基本都是“视觉模块+语言模块”硬拼在一起,像搭积木一样组合。结果往往是:看图时语义断层,描述时细节丢失,生成内容生硬不自然。

SenseNova U1 摆脱了这种“拼接模式”。它用商汤自研的 NEO-unify 架构,把视觉、语言、推理能力全部融合进一个统一的神经网络里。简单说,模型不再“分别看图、分别理解”,而是像人一样,一眼扫过去,图像和文字同时在脑子里形成整体认知。这带来的变化是实打实的:描述一张复杂场景图时,它能准确说出“左边穿红衣服的人正伸手去拿咖啡杯,杯子还冒着热气”;生成一张图时,也能根据“一个戴眼镜的老人在雨天撑伞等公交”这样的文字,还原出符合物理规律和生活常识的画面。

轻量版已上线,开发者可免费用

这次商汤没玩虚的,直接把“SenseNova U1 Lite”轻量版开源了。两个版本的模型——一个参数量适中,适合部署在边缘设备;另一个更轻,能在手机或嵌入式系统上跑起来——代码、权重、推理示例,全部公开在 GitHub 和 Hugging Face 上。你不用申请权限,不用等审核,下载就能用。

不少开发者已经在社区里测试了效果。有做智能摄像头的团队用它做实时场景理解,准确率比旧模型高出近20%;也有做教育App的开发者,用它生成带图的数学题讲解,孩子能看懂,家长也觉得自然。一位开源贡献者在论坛里留言:“以前调多模态模型像在修两台互不通信的机器,现在像在调一台完整的脑子。”

更大的模型在路上,国产AI开始“重构底层”

商汤表示,Lite版只是起点。接下来,更大参数、更强能力的完整版SenseNova U1正在内部测试,预计年内将面向行业开放。这不只是参数的堆砌,而是架构成熟后的自然延伸。

业内观察人士指出,过去国产AI常被说“功能多但不深”,比如能识图、能对话、能写诗,但每个功能都是独立模块,一联动就卡顿。而这次SenseNova U1的统一架构,意味着我们开始从“功能拼凑”转向“结构进化”——就像智能手机从按键机进化到触屏一体机,不是加了几个新按钮,而是整个交互逻辑变了。

这背后的影响可能远超想象。在自动驾驶领域,车辆能更准确地理解“前方行人突然横穿+喇叭鸣响+红灯闪烁”的综合信号;在工业质检中,AI能同时分析设备振动数据、红外热成像和操作日志,判断故障根源;甚至在家庭机器人上,它能听懂“把沙发上那件皱了的衬衫拿去洗”,而不只是识别“衬衫”或“沙发”两个词。

这不是一场秀技术的发布会,而是一次真正把能力交给开发者的行动。开源,意味着更多人能参与优化;统一架构,意味着未来AI应用不再被“模块割裂”拖后腿。国产AI,这次走的路,有点不一样了。