马斯克xAI上线语音API，Grok正式“开口说话”

Grok终于会说话了，马斯克的AI开始“怼人”了

3月16日，马斯克的xAI团队悄无声息地把Grok的文本转语音（TTS）API放了出来。没有发布会，没有花哨的PPT，就在X平台上发了一条更新通知——但懂行的人已经坐不住了。

这次更新不是简单加个“机器人音”就完事。Grok的语音，带着它一贯的毒舌风格、冷幽默和毫不掩饰的讽刺感。你问它“今天天气怎么样？”，它可能回你：“比你上周的PPT强一点。”——这种语气，不是AI在模仿人类，而是人类在模仿Grok。

现在，开发者可以直接调用这个语音接口，把Grok的“嘴”安到自己的App里。无论是智能客服、播客生成器，还是车载语音助手，只要你想，它就能用那副“我懒得哄你”的腔调跟你对话。有人已经开始测试：把Grok装进健身App，运动时它不是喊“加油”，而是说：“你再偷懒，我就把你的跑步记录发到你老板群里。”

这事儿的真正意义，不在于技术多先进——OpenAI的GPT-4o语音确实更顺滑、更自然。但马斯克从来不靠“顺滑”赢。他靠的是“个性”。当别的AI都在努力变得温柔、体贴、无害，Grok偏要当那个敢说真话、不怕得罪人的刺头。而偏偏，很多人就吃这套。

过去一年，AI语音成了巨头的新战场。GPT-4o能实时打断你说话、模仿情绪起伏，甚至在你叹气时问一句“你是不是累了？”——听起来像朋友，但太完美了，反而假。

Grok不一样。它的语音带着“人味”的瑕疵：语速忽快忽慢，偶尔停顿像在翻白眼，笑点来得猝不及防。这不是bug，是设计。马斯克自己说过：“AI不该是完美的管家，它该是那个敢在饭桌上跟你吵一架的兄弟。”

目前，Grok的语音API还只对部分开发者开放，但内测版已经有人用它做了“深夜电台”：用户输入心情，Grok用低沉嗓音讲一段黑色幽默段子，配上爵士背景音，播放量在TikTok上破了百万。评论区清一色：“这AI比我妈还懂我。”

就在同一周，36氪热榜上还挂着“大模型投毒黑产”“DeepSeek V4为何迟迟不发”这些新闻。安全、数据、合规——所有人都在防着AI出错。

但xAI的选择很清晰：别管那些，先让AI有脾气。

这不是技术竞赛，是性格竞赛。用户不需要一个永远正确的AI，他们需要一个“记得住你上次骂过老板”的AI，一个能接住你冷笑话的AI，一个哪怕说错话也让你觉得“这玩意儿真有意思”的AI。

现在，Grok的语音已经悄悄上线了。你可以在官方文档里申请测试权限，也可以等它出现在下一个你下载的App里。说不定哪天早上，你打开导航，语音提示是：“前方500米右转——别又开错，你上个月已经在这儿绕了三次了。”

当AI开始有脾气，我们才真正开始和它们相处。而Grok，已经赢在了第一句吐槽上。