VibeVoice 是一个前沿的开源文本转语音模型,专为生成富有表现力的长篇多说话人对话音频(如播客)而设计。