最新消息:关注人工智能 AI赋能新媒体运营

xAI 发布 Voice Agent Builder 测试版,两分钟上手生产级语音智能体

科技资讯 admin 浏览

xAI 发布 Voice Agent Builder 测试版,两分钟搭出语音智能体

xAI 正式放出了 Voice Agent Builder 的测试版本,目标是大幅压低企业级语音智能体的搭建门槛。这是一个零代码平台,基于自研的 Grok Voice 模型,开发者和运营人员用两分钟就能配置出一套可用的语音服务系统。

Voice Agent Builder 的核心思路是走端到端的统一路径。传统的语音方案通常要把语音转文字、大模型处理、文字转语音等多个环节拼起来,不仅成本叠加,延迟和故障点也更多。xAI 把电话通信、知识库检索、自动化工具接口、MCP 服务器连接以及全流程合规防护(Guardrails)全部打包在一起,开箱即用。

Voice Agent Builder 功能界面

在 τ-voice Bench 评测体系下,核心模型 Grok Voice Think Fast1.0 的得分达到 67.3%,明显高于 Gemini3.1Flash Live(43.8%)和 GPT Realtime1.5(35.3%)。这一表现,得益于针对复杂通话场景——背景噪音、浓重口音、突发性打断——所做的强化训练。

用户只需用自然语言描述通话目标,并上传各类格式的文档,智能体就能自动完成知识整合。在业务执行层面,开发者可以调用各种 API 连接器,实现预约安排、订单状态查询,甚至触发外部系统的工作流。平台内置 80 多种音色,还允许通过两分钟的音频样本进行个性化声音克隆。

定价方案

定价上,xAI 保持着“透明且极简”的原则。平台不收取额外使用费,只按 API 用量计费,每分钟音频 0.05 美元。如果使用平台提供的电话服务,每分钟额外加收 0.01 美元。每个账户附赠一个免费电话号码,开发到生产之间的门槛被进一步压低。

Voice Agent Builder 上线后,xAI 试图通过技术集成与透明的计费模式,重塑语音智能体的商业价值链,为希望快速部署语音服务的企业提供了一个高效率的竞争选择。