语音模型是什么？探索AI语音技术原理与应用场景

2025-09-06

OpenAI杀入语音模型大战，祭出最强GPT-RealTime，加量还降价

最强实时语音模型支持笑声捕捉、无缝切换语言。智东西8月29日消息，今天凌晨，OpenAI发布为开发人员打造的语音转语音模型GPT-RealTime，并同步更新了包括远程MCP服务器支持、图像输入和SIP（通过会话发起协议）电话呼叫支持的API功能。 OpenAI称这是其迄今为止最先进的语音合成模型，GPT-RealTime在遵循复杂指令、精确调用工具以及生成更自然、更具表现力的语音方面有所改进。该模型可以自然朗读重复的字母、数字，无缝切换语...