美团LongCat-Video模型原生支持5分钟级连贯视频生成

2025-10-27 11:38:50 AI动态 5 次阅读

美团近日重磅发布其最新研发的视频生成模型——LongCat-Video，这一创新成果标志着美团在人工智能领域取得了突破性进展。LongCat-Video的核心使命在于赋能AI更精准地感知和理解真实世界的运行机制，从而推动世界模型研究的深入发展。作为一款能够模拟物理规律与场景逻辑的智能系统，LongCat-Video赋予AI”洞察”世界本质的强大能力，为人工智能技术开辟了新的应用维度。

该模型基于先进的Diffusion Transformer（DiT）架构设计，展现出卓越的多任务处理能力，可同时胜任文本生成视频、图像生成视频以及视频续写三大核心任务。其最突出的创新点在于实现了不同生成任务间的无缝切换，无需任何额外模型适配即可形成完整的任务闭环。以文本生成视频功能为例，该模型能够精准解析用户指令，生成720p分辨率、30fps帧率的超高清视频，其语义理解能力和视觉呈现效果均达到行业领先水平。在图像生成视频中，模型严格保留参考图像的所有关键特征，确保动态转换过程完全符合物理规律。而视频续写功能作为LongCat-Video的核心竞争力，能够基于多帧前序内容智能延续视频叙事，为长视频创作提供了革命性的技术支持。

LongCat-Video在长视频生成方面表现尤为突出，可连续输出长达5分钟的高质量视频，且在整个生成过程中始终保持画质稳定，无任何质量衰减现象。通过创新的技术手段，模型有效解决了传统长视频生成中常见的色彩漂移和画质降解问题，实现了跨帧时序的高度一致性和物理运动的合理性。此外，LongCat-Video还整合了块稀疏注意力机制和条件token缓存技术，显著提升了长视频生成的效率，成功破解了时长与质量难以兼顾的行业难题。在高分辨率、高帧率的视频生成场景中，模型通过多重优化策略实现了推理速度与生成质量的完美平衡。

经过美团内部严格测试和多项公开基准评测，LongCat-Video的综合性能表现达到开源领域顶尖水平，展现出强大的通用适用性。这款模型的推出为内容创作者打开了长视频制作的新纪元，让视频生成过程变得前所未有的简单高效。目前，LongCat-Video已全面开放，用户可通过以下渠道获取更多信息和使用权限：

GitHub: https://github.com/meituan-longcat/LongCat-Video
Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Video
项目官网: https://meituan-longcat.github.io/LongCat-Video/

划重点：
🌟 LongCat-Video是美团倾力打造的AI视频生成解决方案，致力于提升AI对真实世界的认知能力
🎥 支持文本生成、图像生成和视频续写三大核心功能，实现全方位高质量视频内容创作
⚡ 在长视频生成领域具备显著优势，可稳定输出5分钟以上连贯流畅的高清视频

2025年10月27日

17:24

美团LongCat-Video模型原生支持5分钟级连贯视频生成

最新快讯

2025年10月27日

第138届广交会第二期闭幕展示家居新趋势助力中国制造走向全球

国内油价下调每升省0.21元加满省10.5元

震裕科技21.1亿投建浙江机器人精密部件项目

格力博智元机器人合作落地商用清洁机器人领域新进展

新型氮化硼量子传感器突破极端压力探测极限

格力京东合作销售破200亿双十一再推新品深化合作

前英伟达工程师：AI时代实践理论并重提升竞争力

神舟二十一号全系统合练成功 10月发射条件具备

广和通XREAL强强联手开创消费级AI眼镜新篇章

同兴科技钠离子电池材料赋能多种电源产品储能启停UPS

ChatGPT变身全能生活助手一键连通八大平台轻松搞定日常

Sora重磅升级宠物成主角视频剪辑社交功能即将上线安卓版加速到来