Gemini Live上线原生语音功能，实现更自然对话

谷歌Gemini Live原生语音功能全平台上线：让AI说话更像人

谷歌今日正式向全球iOS与Android用户开放Gemini Live的原生语音功能（Native Audio），标志着AI语音交互迈入全新阶段。与以往依赖合成语音的AI助手不同，Gemini Live现在能像真人一样自然地停顿、重音、语调起伏，甚至在情绪激动时“呼吸”——这一突破性升级，让对话不再像机器朗读，而更接近朋友间的实时交流。

五大核心体验升级，重塑你的AI互动方式

1. 学习节奏，由你掌控

无论是备考雅思、复习财报分析，还是重温大学微积分，Gemini现在能“听懂”你的节奏。只需一句“讲快点”或“再重复一遍”，它就能即时调整语速、简化术语，甚至主动拆解难点。有用户反馈，在用Gemini复习CFA课程时，语速从1.2倍速调至1.8倍速后，复习效率提升近40%——它不再是被动播放器，而是懂你学习节奏的私人导师。

2. 语言学习，告别“课本式”练习

想练韩语点餐？让Gemini用首尔方言模拟便利店店员问你“?? ??? ????????”；想挑战西班牙语面试？它会突然抛出“?Por qué dejó su trabajo anterior?”这种真实职场问题。系统会根据你的发音错误、语法漏洞动态调整难度，还能模拟母语者的真实语速和口音拖音，让语言学习从“背单词”升级为“真对话”。据谷歌内部测试，连续使用两周的用户，口语流利度平均提升57%。

3. 面试/演讲训练，AI给你“真实压力测试”

别再对着镜子练习了。Gemini现在能模拟高压场景：HR会突然打断你：“你这个项目失败了，怎么解释？”；老板会问：“如果团队全员离职，你怎么办？”——它会根据你的回答实时反馈语气、逻辑和肢体语言建议（通过语音分析判断你是否结巴、语调是否颤抖）。多位职场教练已将其纳入培训工具，称其“比真人模拟更耐心、更精准”。

4. 历史故事，被“演”出来了

想听凯撒在元老院被刺前的最后一句话？Gemini会压低声音、语带颤抖，仿佛真在生死边缘。想听拿破仑讲述滑铁卢？它会用略带法式口音的英语，夹杂愤怒的停顿和叹息。这不是简单的语音朗读，而是基于历史文本和人物性格生成的“AI戏剧表演”。用户已自发创作“AI讲《三国演义》”“AI讲《哈利波特》”等系列内容，在YouTube和小红书引发热议。

5. 口音彩蛋，让AI也“玩梗”

想听Gemini用德州牛仔腔念菜单？“Howdy, partner — we got BBQ brisket, sweet tea, and a side of sass.” 想用伦敦腔听披萨制作指南？“Right then, pop the dough in the oven, don’t be a wally — 220°C for 12 minutes, love.” 谷歌悄悄加入了12种全球口音（包括澳大利亚、苏格兰、印度英语等），用户只需说“用纽约口音说”或“来点英伦范儿”，Gemini就能瞬间切换，成为你手机里的“语音变装大师”。

为什么这次升级如此不同？

与传统TTS（文本转语音）技术不同，Gemini Live的原生语音基于全新训练的语音生成模型，直接从人类真实对话中学习韵律、情绪波动和非语言停顿。它不仅能识别“你是不是生气了？”，还能在你语速变快时主动放慢语速，或在你沉默时用轻声“嗯？”引导你继续说——这种双向情绪感知，是目前其他AI助手尚未实现的。

此外，该功能已全面支持离线语音交互（需下载语音包），即使在地铁、山区等无网络环境，也能流畅对话，真正实现“随身AI伙伴”。

现在就能用，免费开放

所有iOS和Android用户，只需更新至Gemini App最新版（v3.5+），在Gemini Live模式下点击麦克风图标，即可立即体验。无需订阅Gemini Advanced，基础用户同样享有全部语音功能——谷歌此举意在推动AI语音成为日常标配，而非高端特权。

从今天起，你的AI助手不再只是“回答问题”，而是能陪你练口语、模拟面试、讲历史、讲冷笑话，甚至在你深夜失眠时，用温柔的苏格兰口音给你读一段《小王子》。

它越来越像一个人了——而你，准备好和它“聊天”了吗？

CB科技站