最新消息:关注人工智能 AI赋能新媒体运营

腾讯云发布音视频AI品牌WAND:内置六大自研模型

科技资讯 admin 浏览

腾讯云音视频发布AI原生底座WAND,转向Agent调度模式

6月5日,2026 AI产业应用大会期间,腾讯云音视频正式发布AI原生能力底座WAND。基于超过20年的技术积累,此次升级涵盖底层模型、媒体能力及接入方式。音视频AI能力将以Agent-Native模式对外开放。这标志着腾讯云从提供单点媒体处理工具,转向构建面向AI应用与Agent的底层媒体基础设施。

WAND采用三层架构,包含模型引擎、能力层与场景方案。底层内置编解码、增强、擦除、生成、理解、音频六款自研媒体专用模型,用于填补主流生成式大模型在媒体生产环节的空白。

WAND现场展示图

能力层将60多项媒体AI能力按生成、理解、处理、编码重新划分。腾讯云通过API、Agent预编排工作流及Skills三种方式提供接口。Agent无需人工切换工具,即可端到端自动执行完整链路。

实际业务测试显示,该架构能直接对接具体需求。在电商场景,生成模型针对不同品类匹配处理策略,降低了系统报错率,提升了图片可用度。短漫剧制作中,系统把剧本生成、角色一致性控制串联为自动链路,平均生产效率提升90%。国内80%以上的头部漫剧平台已接入该能力。AI增强与无痕擦除技术双双获得NAB Show2026年度产品奖。

赛事直播需要应对高并发与极低延迟。WAND通过自研模型协同调度,把识别、生成、合成、编码整合进一套全自动化流程。相比传统方案,该流程节省超50%的码率,并已支撑数千场全球顶级赛事直播。

WAND能力架构图

腾讯云音视频已连续11次保持中国及出海市场份额第一。推出WAND的直接目的,是加速把音视频能力转化为可被Agent统一调度的生产级工具,为AI Agent时代的视听应用提供底层支持。