扫码查看

LongCat-Video 是美团“长猫团队”推出的 13.6B 参数基础视频生成模型，支持文本生成视频（Text-to-Video）、图像生成视频（Image-to-Video）和视频续写（Video Continuation）三大任务。该模型原生支持分钟级长视频生成，且在生成过程中无色彩漂移或画质下降问题。其采用粗到精（coarse-to-fine）的时空生成策略和块稀疏注意力机制，兼顾生成质量与推理效率，适用于对长视频生成有高要求的研究者与开发者。

LongCat-Video

2025-10-28AI开源 / AI视频226 次浏览

简介：
LongCat-Video 是美团“长猫团队”推出的 13.6B 参数基础视频生成模型，支持文本生成视频（Text-to-Video）、图像生成视频（Image-to-Video）和视频续写（Video Continuation）三大任务。该模型原生支持分钟级长视频生成，且在生成过程中无色彩漂移或画质下降问题。其采用粗到精（coarse-to-fine）的时空生成策略和块稀疏注意力机制，兼顾生成质量与推理效率，适用于对长视频生成有高要求的研究者与开发者。

亮点：

行业领先的原生长视频生成能力，支持720p/30fps视频分钟级输出，无质量衰减
统一架构支持多模态视频生成任务，单一模型覆盖三大主流视频生成场景
采用多奖励强化学习（GRPO）优化，综合性能媲美主流开源与商业模型

主要功能：
LongCat-Video 提供开箱即用的多任务视频生成能力，支持本地部署与GPU加速推理。

文本生成视频：输入自然语言描述，生成高质量动态视频
图像生成视频：基于单张图像生成连贯动态内容，保留原始图像细节
视频续写：对已有视频进行时序延展，保持风格与动作一致性
长视频生成：原生支持生成时长数分钟的连续视频，适用于叙事类内容创作

适用场景：

短视频/AIGC内容创作与自动化生产
游戏、影视、广告行业的动态素材生成与预演

推荐理由：
LongCat-Video 代表了当前开源视频生成模型在长视频能力上的重要突破，其统一架构大幅降低多任务部署成本。模型采用MIT许可证，对学术与商业应用友好，适合希望快速集成高质量视频生成能力的团队。随着AIGC向“世界模型”演进，LongCat-Video 的长时序建模能力契合未来内容生成的核心趋势，为开发者提供前瞻性技术储备。

2026-01-31

OpenClaw（原Clawdbot）：2026年引领潮流的本地AI编排层与超级助理

引言随着人工智能技术的快速发展，个人和企业对AI助手的需求日益增长。传统的云端AI服务虽然强大，但在隐私保护、响应速度和离线可用性方面存在局限性。OpenClaw（原Clawdbot）应运而生，作为一个革命性的本地AI编排平台，为用户提供了一个全新的AI助手体验模式。 OpenClaw的核心理念 OpenClaw的设计哲学建立在"本地优先"的基础上，它允许用户在自己的设备上运行AI模型，同时提供强大的编排能力来协调多个AI工具和服务。这种架...

2025-12-22

Nano Banana使用场景大全

AI 图像生成领域正随着 Nano Banana 的出现步入新纪元，以其为代表的技术突破预示着 AI 将从 2D 图像生成向 3D 建模、视频生成拓展。未来，AI 创作工具的商业生态会更完善，AI 创作也将成为数字时代的基础技能，推动各行业向智能化、高效化发展。 1. Nano Banana 概述什么是Nano Banana Nano Banana 是 Google 于 2024 年推出的革命性 AI 驱动图像生成与编辑模型，正式名称为 **Gemini 2.5 Flash Image**。这款模型...

2025-10-04

机器人灵巧手破局：从"不可能三角"到300美元的开源革命

核心洞察：为什么灵巧手比行走更难？通过观察2023-2025年机器人行业实践，我们发现：机器人行走需要解决的是"稳定性"问题，而灵巧手需要解决的是"精细操作"问题。人手拥有27个自由度，而机器人灵巧手通常需要6个以上，高端产品可达20-27个。灵巧手的控制难度是机器人行走的10倍以上，这也是为什么灵巧手价格远高于机器人整机的原因。 "不可能三角"的行业实践解读在机器人灵巧手领域，一直存在一个"不可能三角"：性能、成本、...

2025-09-27

谷歌AI Nano Banana 深度测评

Gemini 2.5 Flash横空出世，图像生成速度与质量双双跃升，引发行业关注。本文通过Nano Banana项目的深度测评，全面解析该模型在创意生成、响应效率与用户体验上的表现，为AI产品经理提供一份实战参考。一、引言与概述产品定位与核心论点本报告旨在对Google推出的革命性AI图像生成与编辑模型——Gemini 2.5 Flash Image进行全方位、深度的实用性与创新性评估。该模型在正式发布前，曾以神秘代号“Nano Banana”在业界掀起轩然大...

2025-09-25

「一页纸」吃透产业链之：人形机器人，Figure链与特斯拉Optimus链

人形机器人2025量产，特斯拉、Figure AI领跑，B端工业应用加速。（1）人形机器人：孕育下一个百倍机会的温床人形机器人产业正处在从研发演示向量产落地的关键拐点。基于当前头部企业如特斯拉（ Optimus 计划 2026 年量产）、 Figure AI 及国内优必选等的量产规划， 2025-2026 年被视为产业规模化验证与商业化加速的关键窗口期。当前人形机器人呈现出“ 硬件降本 ”&...

2025-09-23

GO-1 – 智元机器人推出的首个通用具身基座模型

GO-1是什么 GO-1（Genie Operator-1，智元启元大模型）是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action（ViLLA）架构，由VLM（多模态大模型）和MoE（混合专家）组成。VLM借助海量互联网图文数据，赋予模型通用场景感知和语言理解能力；MoE中的Latent Planner（隐式规划器）通过大量跨本体和人类操作视频数据，获得通用的动作理解能力；Action Expert（动作专家）则基于百万真机数据，实现精细...

Aoyii

工具异常反馈

LongCat-Video

工具异常反馈

LongCat-Video

分享：

相关AI产品

LongLive - 英伟达联合MIT开源新SOTA

Wan 2.6

ClawHub - Openclaw Skill社区

Openclaw(clawdbot) - Presonal AI Assistant

Sora2

MotionControlAI – Motion Control AI Video Generator (Kling 2.6 workflow)

AISora2

AI Best - Create Anything with AI

Wan 2.6 AI Video Generator for Multi-Shot Stories

Grok Video

相关AI资讯

OpenClaw（原Clawdbot）：2026年引领潮流的本地AI编排层与超级助理

Nano Banana使用场景大全

机器人灵巧手破局：从"不可能三角"到300美元的开源革命

谷歌AI Nano Banana 深度测评

「一页纸」吃透产业链之：人形机器人，Figure链与特斯拉Optimus链

GO-1 – 智元机器人推出的首个通用具身基座模型