发生了什么

Realtime API 让语音到语音和流式工具调用落在同一会话里。团队现在问的是:转写存哪、什么时候升级到人、语音路径怎么测得像 REST。新鲜感过了,剩下的是合规和稳定性。

为什么重要

线上出问题常常是工具权限说不清、限流没有、出事不知道谁背锅。Slack、浏览器 MCP、调试流程已经铺好的团队,会把语音当成同一套运维上的新入口,而不是单独搞个 demo。

对目录的影响

跟 ChatGPT、v0 做壳、以及 MCP 落地都有关系。延迟一低,小错也容易放大成客户可见故障,系统化调试和事故响应技能就更值钱。

接下来观察什么

录制策略、音频放哪国、口语评测有没有标准。若厂商能讲清「每会话工具预算」,企业好上量;各组自造政策语言,就慢。