深入探讨多说话人对话系统原理与应用,涵盖语音分离、说话人日志和对话生成技术,助力开发更智能的自然语音交互体验。
VibeVoice 是一个前沿的开源文本转语音模型,专为生成富有表现力的长篇多说话人对话音频(如播客)而设计。
返回顶部