人工智能视频生成技术迎来革命性突破!Lightricks旗下LTX Studio近日震撼发布全新开源视频生成模型LTX-Video13B,凭借其130亿参数规模、30倍于同类模型的生成速度以及创新的多尺度渲染技术,迅速引爆行业热议。该模型不仅在消费级GPU上实现高效运行,更在视频连贯性与细节表现上实现显著飞跃,为创作者带来前所未有的控制力与创作自由度。
技术革新:多尺度渲染技术引领行业变革LTX-Video13B采用独创的多尺度渲染技术,通过先以低分辨率构建视频的粗略运动轨迹和场景框架,再逐步迭代细化细节的创新路径,在大幅提升生成速度的同时确保画质。该技术使模型在保持卓越输出质量的前提下,渲染速度比同类模型快30倍,仅需2秒即可完成5秒视频的渲染,且能在NVIDIA RTX4090等消费级GPU上流畅运行。相比传统模型,其内存占用更低,为创作者打造了更高效的创作环境。模型基于先进的DiT(Diffusion Transformer)架构,融合内核优化技术和bfloat16数据格式,进一步强化了性能表现。LTX-Video13B支持1216×704分辨率、30帧/秒的实时生成,涵盖文本到视频、图像到视频以及视频到视频等多种生成模式,完美满足多元化创作需求。
核心功能:精准操控与无限创意空间LTX-Video13B在动作连贯性、场景结构构建和镜头关系理解方面展现出卓越能力,能够生成逻辑严密、细节丰富的视频内容。模型支持关键帧控制、角色动作与镜头运动精细调节以及多镜头组合,为用户提供全方位的创作掌控权。例如,创作者可通过文本提示或参考图像精确调整视频中的角色姿态、场景转换或镜头角度,轻松实现电影级视觉效果。此外,LTX-Video13B还具备视频延展和风格/动作替换功能,用户可将现有视频时长延长至最长60秒,或对视频进行风格化处理,如将现实场景转换为动画风格。这种高度灵活性使其在短片制作、广告创意和社交媒体内容创作领域具有巨大应用价值。
开源生态:赋能全球开发者与创作者作为开源模型,LTX-Video13B在GitHub和Hugging Face平台免费开放,为开发者与创作者提供自由修改和定制的空间。Lightricks还推出LTX-Video-Trainer工具,支持2B和13B模型的完整微调以及LoRA(低秩适配)训练,方便用户开发定制化控制模型,如深度检测、姿势识别或边缘增强等。模型兼容ComfyUI工作流,新增的Looping Sampler节点可生成任意长度的视频,确保运动轨迹的连贯性。为进一步降低使用门槛,Lightricks发布了一系列辅助工具,包括8位量化版本(ltxv-13b-fp8)和IC-LoRA Detailer,显著优化了低内存设备上的运行性能。模型对初创企业和年收入低于1000万美元的组织免费开放,彰显Lightricks推动AI技术普惠的坚定承诺。
行业里程碑:AI视频生成技术迈入新纪元AIbase权威机构认为,LTX-Video13B的问世标志着开源视频生成技术进入全新发展阶段。其多尺度渲染技术与消费级硬件的完美适配,彻底打破了传统AI视频生成对高性能设备的依赖,为中小型团队和个人创作者提供了专业级的创作利器。结合开源社区的协同创新,LTX-Video13B有望推动视频生成技术在影视、游戏、广告和教育等领域的广泛应用。目前,LTX-Video13B已集成至LTX Studio平台,用户可通过官方网站(https://ltx.studio)或GitHub(https://github.com/Lightricks/LTX-Video)获取模型及详细文档。Lightricks还计划持续优化模型,支持更多控制维度和多模态功能,为创作者打造更强大的创作工具。
未来展望:开启AI视频创作新纪元Lightricks表示,LTX-Video13B的开发得益于与Getty Images等合作伙伴提供的高质量数据集,确保了输出内容的商业合规性与视觉品质。未来,团队将深入探索时间变化提示和多模态生成技术,以支持更复杂的创作需求。AIbase期待LTX-Video13B在开源社区的推动下,成为AI视频生成领域的标杆性作品。试用:https://app.ltx.studio/gen-workspace模型下载:https://ltxv.video/#get-started