HunyuanVideo-Foley 是由腾讯混yuan团队开发的​​专业级视频音效生成模型​​,通过多模态扩散对齐技术实现高保真音效合成。专为视频创作者设计,支持根据​​视频画面+文本描述​​自动生成同步、逼真的环境音效(Foley Audio),适用于影视制作、游戏开发、广告创意等场景。

Llama 4提供高性能、多模态、低成本的领先AI模型Scout和Maverick。

Kwai-Keye是快手科技推出的一个开源模型项目,旨在为开发者提供强大的多媒体处理能力,包括但不限于图像识别、视频分析等领域。该项目托管于GitHub平台,允许全球的开发者下载源代码并根据自己的需求进行二次开发或直接应用。

LangChain provides a comprehensive suite of products to support developers throughout their entire development workflow.

Dify 是一个面向团队的无代理 AI 开发平台,支持自主代理、RAG 管道等的开发、部署和管理,适用于任何规模。

AutoGPT是一个用于创建智能助手以简化数字工作流程的人工智能平台。

VibeVoice 是一个前沿的开源文本转语音模型,专为生成富有表现力的长篇多说话人对话音频(如播客)而设计。