昆仑万维SkyReels-A3模型：语音对口型照片变视频

2025-08-11 10:19:23 AI动态 105 次阅读

昆仑万维集团重磅发布旗下最新技术力作——SkyReels-A3模型，这款基于DiT（Diffusion Transformer）视频扩散模型的音频驱动数字人创作工具，将数字内容创作领域推向全新高度。SkyReels-A3的问世，不仅实现了任意时长全模态音频驱动数字人创作，更以革新性的技术为用户带来前所未有的创作体验。

SkyReels-A3的核心功能在于赋予静态图像或视频生命，用户只需上传人像图片并配上相应语音，即可让图片中的人物根据语音内容实现开口说话或唱歌的动态效果。不仅如此，该模型还支持全新视频内容的创作，用户只需提供人像图片、语音和文字提示，即可生成符合要求的表演视频。更令人惊叹的是，SkyReels-A3能够为现有视频进行”改台词”操作，自动匹配新口型、表情和表演，确保画面连贯自然。

在技术层面，SkyReels-A3在文本提示词输入、动作交互自然度、运镜控制以及视频输出时长等方面均实现了显著优化。支持长达60秒的单分镜视频输出，多分镜支持无限时长，充分满足不同创作场景的需求。昆仑万维还针对线上直播等实际应用场景进行了专项优化，大幅提升了视频生成的一致性以及特定交互动作的自然度和清晰度。

SkyReels-A3的推出，为广告、直播带货等商业应用提供了强大的技术支撑，同时也为音乐MV、电影片段或演讲视频等艺术创作开辟了更多可能。通过引入基于ControlNet结构的镜头控制模块，SkyReels-A3实现了帧级别精准运镜控制，预设了8种常见运镜参数，用户可根据需求选择相应运镜，且每个运镜的强度可0–100%连续调节，轻松生成专业级运镜效果。

这一创新技术标志着数字内容创作将变得更加高效便捷。昆仑万维以SkyReels-A3为载体，为电影制作、虚拟直播、游戏开发与教育内容创作等领域提供了低门槛、低成本、高保真的AI技术制作方案。SkyReels-A3的问世，完美诠释了”声音即影像”的核心理念，为个性化、交互式内容的创作提供了前所未有的高效与便捷，或许下一个刷屏的爆款视频就源于您的灵感。

SkyReels-A3项目主页:https://skyworkai.github.io/skyreels-a3.github.io/SkyReels官网地址:https://www.skyreels.ai/homeSkyReels系列开源模型地址:https://huggingface.co/Skywork