腾讯云发布音视频AI品牌WAND：内置六大自研模型

腾讯云音视频发布AI原生底座WAND，转向Agent调度模式

6月5日，2026 AI产业应用大会期间，腾讯云音视频正式发布AI原生能力底座WAND。基于超过20年的技术积累，此次升级涵盖底层模型、媒体能力及接入方式。音视频AI能力将以Agent-Native模式对外开放。这标志着腾讯云从提供单点媒体处理工具，转向构建面向AI应用与Agent的底层媒体基础设施。

WAND采用三层架构，包含模型引擎、能力层与场景方案。底层内置编解码、增强、擦除、生成、理解、音频六款自研媒体专用模型，用于填补主流生成式大模型在媒体生产环节的空白。

能力层将60多项媒体AI能力按生成、理解、处理、编码重新划分。腾讯云通过API、Agent预编排工作流及Skills三种方式提供接口。Agent无需人工切换工具，即可端到端自动执行完整链路。

实际业务测试显示，该架构能直接对接具体需求。在电商场景，生成模型针对不同品类匹配处理策略，降低了系统报错率，提升了图片可用度。短漫剧制作中，系统把剧本生成、角色一致性控制串联为自动链路，平均生产效率提升90%。国内80%以上的头部漫剧平台已接入该能力。AI增强与无痕擦除技术双双获得NAB Show2026年度产品奖。

赛事直播需要应对高并发与极低延迟。WAND通过自研模型协同调度，把识别、生成、合成、编码整合进一套全自动化流程。相比传统方案，该流程节省超50%的码率，并已支撑数千场全球顶级赛事直播。

腾讯云音视频已连续11次保持中国及出海市场份额第一。推出WAND的直接目的，是加速把音视频能力转化为可被Agent统一调度的生产级工具，为AI Agent时代的视听应用提供底层支持。

音视频 AI原生腾讯云 wand

CB科技站

腾讯云发布音视频AI品牌WAND：内置六大自研模型

腾讯云音视频发布AI原生底座WAND，转向Agent调度模式

与本文相关的文章