最新消息:关注人工智能 AI赋能新媒体运营

Anthropic发布Claude Code语音模式:说话即可生成代码

科技资讯 admin 浏览

Claude Code 推出语音编程功能,开发者终于可以“说”出代码了

3月3日,Anthropic 正式为 Claude Code 命令行工具上线语音交互功能。这意味着,开发者现在不用再手敲命令、复制粘贴,只需要对着电脑说一句“把这段登录逻辑改成用 JWT”,AI 就会自动帮你改好代码、写好注释,甚至还能提醒你潜在的权限漏洞。

image.png

目前该功能仅在 Windows 平台开放,且处于小范围灰度测试阶段,首批仅限约5%的用户使用。但内部消息显示,Anthropic 已在紧急优化语音识别的准确率,尤其是对技术术语和代码语法的识别。预计未来两周内,将逐步向所有注册用户开放,macOS 和 Linux 版本也在紧锣密鼓地开发中。

怎么用?一句话就能改代码

操作简单到离谱:打开终端,输入 /voice,听到提示音后直接开口说话。比如:

  • “把这个函数改成异步的,别阻塞主线程”
  • “帮我把这段 Python 代码转成 TypeScript,加上类型注解”
  • “找出这段 SQL 里的潜在注入风险”

系统会在几秒内完成修改,并在编辑器中高亮改动部分,同时弹出简短说明:“已重构用户认证中间件,使用 JWT 替代 Session,已添加过期时间校验。” 你只需要确认一下,点个“提交”就行。

不少内测用户反馈,这个功能在写 boilerplate 代码、调试重复逻辑、或者半夜改 bug 时特别管用。“我一边喝咖啡一边说话,代码就自己跑起来了,比 Ctrl+C/V 爽多了。”一位来自旧金山的全栈开发者在 Reddit 上写道。

为什么现在才出语音?因为真的有人在用

Anthropic 没有大张旗鼓宣传,但数据不会说谎。根据其最新财报,Claude Code 的年化收入(ARR)已突破25亿美元,比今年1月翻了一倍。周活跃用户数也从1月的约180万,猛增至360万以上——其中超过四成是来自中小型技术团队和独立开发者。

相比之下,GitHub Copilot 虽然用户基数更大,但付费转化率持续低迷;Cursor 虽然界面漂亮,但在复杂重构任务中仍需大量人工干预。而 Claude Code 的优势,正在于它“听得懂人话”——不只是识别关键词,而是真正理解上下文意图。

有开发者实测发现,Claude Code 在处理“重构 legacy 代码”“适配新框架”这类模糊指令时,准确率比同类工具高出近30%。这背后是 Anthropic 对开发者真实工作流的深度研究——他们不是在做“AI玩具”,而是在解决程序员每天头疼的实际问题。

不只是效率,是工作方式的改变

语音模式的意义,远不止“省点键盘磨损”。很多资深工程师表示,当他们处于“思考状态”时——比如设计系统架构、评审 PR、或者调试一个诡异的并发问题——手写代码反而会打断思路。而语音交互,让编程回归了“对话”本质。

“我以前写代码像在打字比赛,现在更像是和一个懂行的同事一起讨论。”一位在 Spotify 工作的后端工程师说,“有时候我一边走动一边说,AI 就在后面跟着改,感觉像有个隐形搭档。”

目前,Anthropic 没有透露语音模块是否依赖第三方引擎,但有开发者通过反编译发现,其语音识别模型与 Claude 3.5 的底层架构深度整合,能实时结合上下文语义做判断,而非单纯语音转文字后处理。

下一步:语音+多设备同步,或成标配

虽然现在只支持 Windows,但已有用户在 GitHub 上自发搭建了 macOS 的临时脚本适配方案。Anthropic 官方虽未回应,但其招聘页面近期新增了“跨平台语音交互体验工程师”岗位,暗示多端支持已在路上。

更值得关注的是,语音功能可能成为未来 AI 编程工具的“入场券”。当你的 IDE 不仅能写代码,还能听你说话、理解你的情绪、甚至在你叹气时主动问“需要我帮你简化这段吗?”——编程,就不再是冷冰冰的敲键盘,而是一场人与机器的协作。

目前,语音模式仍处于“尝鲜”阶段,偶尔会误听、漏听,尤其在嘈杂环境下。但如果你是每天写代码超过4小时的开发者,不妨去试试——说不定,你下一个 bug,就是靠一句话解决的。