扫码查看

VibeVoice 是一个前沿的开源文本转语音模型，专为生成富有表现力的长篇多说话人对话音频（如播客）而设计。

VibeVoice

2025-09-01AI娱乐 / AI音频344 次浏览

简介

欢迎来到VibeVoice，一个突破性的开源文本转语音（TTS）模型。它专为生成高质量、富有表现力的长篇多说话人对话音频而精心打造，旨在彻底改变播客、有声书和对话式内容的创作方式。

VibeVoice的核心优势在于其卓越的自然度和表现力。与传统单调的TTS系统不同，它能够理解上下文并赋予语音情感色彩，极大地缩小了合成语音与真人录音之间的差距。其开源特性也意味着它将持续得到社区的支持和改进，始终保持技术前沿。

问：VibeVoice是免费的吗？
答：是的，作为一个开源项目，VibeVoice可以免费使用和修改。

问：它支持哪些语言？
答：目前主要优化支持中文（zh_CN），未来计划扩展更多语言。

问：我需要专业的编程知识才能使用它吗？
答：基础使用可以通过提供的接口实现，但深度定制和部署需要一定的技术背景。

问：生成的音频可以用于商业用途吗？
答：可以，但请务必遵守其开源许可证的具体条款。