ChatGPT 语音模型 Bidi1 开启测试,支持实时打断与并行交互
OpenAI 正在为 ChatGPT 网页端与 App 端筹备更大规模的测试。此次测试的核心是一个名为 Bidi1 的新型语音模型。它改变了过去语音助手必须等上一轮回答彻底结束才能接受新指令的线性逻辑。
Bidi1 采用了双向并行处理机制。模型在发声的同时保持实时监听。用户可以在对话中途直接打断,或者抛出新的指令。系统会立即切断当前逻辑并执行新任务。演示中,模型正在执行从 1 数到 10 的指令,用户中途插话要求倒数,模型瞬间切换并继续。这种边听边回的模式,去掉了以往的等待周期。
切换到该模型后,语音交互界面会有明显变化。原有的气泡会变为黄色。目前 OpenAI 尚未正式发布,但测试反馈显示功能上线已进入倒计时。对于依赖语音处理事务的用户,更敏锐的交互响应正在成为现实。