昆仑万维集团重磅发布旗下最新技术力作——SkyReels-A3模型,这款基于DiT(Diffusion Transformer)视频扩散模型的音频驱动数字人创作工具,将数字内容创作领域推向全新高度。SkyReels-A3的问世,不仅实现了任意时长全模态音频驱动数字人创作,更以革新性的技术为用户带来前所未有的创作体验。
SkyReels-A3的核心功能在于赋予静态图像或视频生命,用户只需上传人像图片并配上相应语音,即可让图片中的人物根据语音内容实现开口说话或唱歌的动态效果。不仅如此,该模型还支持全新视频内容的创作,用户只需提供人像图片、语音和文字提示,即可生成符合要求的表演视频。更令人惊叹的是,SkyReels-A3能够为现有视频进行”改台词”操作,自动匹配新口型、表情和表演,确保画面连贯自然。
在技术层面,SkyReels-A3在文本提示词输入、动作交互自然度、运镜控制以及视频输出时长等方面均实现了显著优化。支持长达60秒的单分镜视频输出,多分镜支持无限时长,充分满足不同创作场景的需求。昆仑万维还针对线上直播等实际应用场景进行了专项优化,大幅提升了视频生成的一致性以及特定交互动作的自然度和清晰度。
SkyReels-A3的推出,为广告、直播带货等商业应用提供了强大的技术支撑,同时也为音乐MV、电影片段或演讲视频等艺术创作开辟了更多可能。通过引入基于ControlNet结构的镜头控制模块,SkyReels-A3实现了帧级别精准运镜控制,预设了8种常见运镜参数,用户可根据需求选择相应运镜,且每个运镜的强度可0–100%连续调节,轻松生成专业级运镜效果。
这一创新技术标志着数字内容创作将变得更加高效便捷。昆仑万维以SkyReels-A3为载体,为电影制作、虚拟直播、游戏开发与教育内容创作等领域提供了低门槛、低成本、高保真的AI技术制作方案。SkyReels-A3的问世,完美诠释了”声音即影像”的核心理念,为个性化、交互式内容的创作提供了前所未有的高效与便捷,或许下一个刷屏的爆款视频就源于您的灵感。
SkyReels-A3项目主页:https://skyworkai.github.io/skyreels-a3.github.io/SkyReels官网地址:https://www.skyreels.ai/homeSkyReels系列开源模型地址:https://huggingface.co/Skywork