最新消息:关注人工智能 AI赋能新媒体运营

马斯克xAI上线语音API,Grok正式“开口说话”

科技资讯 admin 浏览

Grok终于会说话了,马斯克的AI开始“怼人”了

3月16日,马斯克的xAI团队悄无声息地把Grok的文本转语音(TTS)API放了出来。没有发布会,没有花哨的PPT,就在X平台上发了一条更新通知——但懂行的人已经坐不住了。

这次更新不是简单加个“机器人音”就完事。Grok的语音,带着它一贯的毒舌风格、冷幽默和毫不掩饰的讽刺感。你问它“今天天气怎么样?”,它可能回你:“比你上周的PPT强一点。”——这种语气,不是AI在模仿人类,而是人类在模仿Grok。

现在,开发者可以直接调用这个语音接口,把Grok的“嘴”安到自己的App里。无论是智能客服、播客生成器,还是车载语音助手,只要你想,它就能用那副“我懒得哄你”的腔调跟你对话。有人已经开始测试:把Grok装进健身App,运动时它不是喊“加油”,而是说:“你再偷懒,我就把你的跑步记录发到你老板群里。”

这事儿的真正意义,不在于技术多先进——OpenAI的GPT-4o语音确实更顺滑、更自然。但马斯克从来不靠“顺滑”赢。他靠的是“个性”。当别的AI都在努力变得温柔、体贴、无害,Grok偏要当那个敢说真话、不怕得罪人的刺头。而偏偏,很多人就吃这套。

语音不是加分项,是战场

过去一年,AI语音成了巨头的新战场。GPT-4o能实时打断你说话、模仿情绪起伏,甚至在你叹气时问一句“你是不是累了?”——听起来像朋友,但太完美了,反而假。

Grok不一样。它的语音带着“人味”的瑕疵:语速忽快忽慢,偶尔停顿像在翻白眼,笑点来得猝不及防。这不是bug,是设计。马斯克自己说过:“AI不该是完美的管家,它该是那个敢在饭桌上跟你吵一架的兄弟。”

目前,Grok的语音API还只对部分开发者开放,但内测版已经有人用它做了“深夜电台”:用户输入心情,Grok用低沉嗓音讲一段黑色幽默段子,配上爵士背景音,播放量在TikTok上破了百万。评论区清一色:“这AI比我妈还懂我。”

行业在查漏洞,xAI在造声音

就在同一周,36氪热榜上还挂着“大模型投毒黑产”“DeepSeek V4为何迟迟不发”这些新闻。安全、数据、合规——所有人都在防着AI出错。

但xAI的选择很清晰:别管那些,先让AI有脾气。

这不是技术竞赛,是性格竞赛。用户不需要一个永远正确的AI,他们需要一个“记得住你上次骂过老板”的AI,一个能接住你冷笑话的AI,一个哪怕说错话也让你觉得“这玩意儿真有意思”的AI。

现在,Grok的语音已经悄悄上线了。你可以在官方文档里申请测试权限,也可以等它出现在下一个你下载的App里。说不定哪天早上,你打开导航,语音提示是:“前方500米右转——别又开错,你上个月已经在这儿绕了三次了。”

当AI开始有脾气,我们才真正开始和它们相处。而Grok,已经赢在了第一句吐槽上。