昆仑万维SkyReels-A3模型:语音对口型照片变视频

昆仑万维集团重磅发布旗下最新技术力作——SkyReels-A3模型,这款基于DiT(Diffusion Transformer)视频扩散模型的音频驱动数字人创作工具,将数字内容创作领域推向全新高度。SkyReels-A3的问世,不仅实现了任意时长全模态音频驱动数字人创作,更以革新性的技术为用户带来前所未有的创作体验。

SkyReels-A3的核心功能在于赋予静态图像或视频生命,用户只需上传人像图片并配上相应语音,即可让图片中的人物根据语音内容实现开口说话或唱歌的动态效果。不仅如此,该模型还支持全新视频内容的创作,用户只需提供人像图片、语音和文字提示,即可生成符合要求的表演视频。更令人惊叹的是,SkyReels-A3能够为现有视频进行”改台词”操作,自动匹配新口型、表情和表演,确保画面连贯自然。

在技术层面,SkyReels-A3在文本提示词输入、动作交互自然度、运镜控制以及视频输出时长等方面均实现了显著优化。支持长达60秒的单分镜视频输出,多分镜支持无限时长,充分满足不同创作场景的需求。昆仑万维还针对线上直播等实际应用场景进行了专项优化,大幅提升了视频生成的一致性以及特定交互动作的自然度和清晰度。

昆仑万维SkyReels-A3模型:语音对口型照片变视频插图1

SkyReels-A3的推出,为广告、直播带货等商业应用提供了强大的技术支撑,同时也为音乐MV、电影片段或演讲视频等艺术创作开辟了更多可能。通过引入基于ControlNet结构的镜头控制模块,SkyReels-A3实现了帧级别精准运镜控制,预设了8种常见运镜参数,用户可根据需求选择相应运镜,且每个运镜的强度可0–100%连续调节,轻松生成专业级运镜效果。

这一创新技术标志着数字内容创作将变得更加高效便捷。昆仑万维以SkyReels-A3为载体,为电影制作、虚拟直播、游戏开发与教育内容创作等领域提供了低门槛、低成本、高保真的AI技术制作方案。SkyReels-A3的问世,完美诠释了”声音即影像”的核心理念,为个性化、交互式内容的创作提供了前所未有的高效与便捷,或许下一个刷屏的爆款视频就源于您的灵感。

SkyReels-A3项目主页:https://skyworkai.github.io/skyreels-a3.github.io/SkyReels官网地址:https://www.skyreels.ai/homeSkyReels系列开源模型地址:https://huggingface.co/Skywork

最新快讯

2025年08月13日

18:10
微新创想8月13日讯 腾讯控股近日正式发布了截至2024年6月30日的2025年第二季度财务报告,展现出强劲的增长势头。财报数据显示,本季度腾讯营收达到1845亿元人民币,同比增长15%,经营利润(Non-IFRS)更是高达692.5亿元,同比增幅达到18%。这一亮眼业绩的背后,是腾讯在人工智能领域的持续深耕与创新突破。 在研发投入方面,腾讯本季度支出达20...
18:10
近日,广州一名13岁少年小铭(化名)经历了一场令人揪心的健康危机。这位年轻的生命在一场意外中险些遭遇不幸,幸运的是,在医护人员的及时救治下,他最终转危为安。这一事件也为我们敲响了警钟,提醒人们在享受户外活动时,务必提高安全意识。 小铭的遭遇始于一次普通的骑单车活动。那天,他在骑行过程中不慎摔跤,导致腿部出现几处破损。虽然伤口看似不严重,但并未得到及时处理。第...
18:10
微新创想8月13日电 8月9日,印度恰蒂斯加尔邦发生惊险一幕,一名女子在乘坐摩天轮时意外坠落,悬挂在约9米高空,幸运的是她及时抓住栏杆。这一幕被目击者拍下并曝光于网络,引发广泛关注。据了解,事发时摩天轮运行至第二圈,女子安全带突然松脱导致意外发生。危急关头,一名勇敢的男子攀爬至摩天轮顶部,将女子安全转移至稳固座舱内。目前,当地当局已启动调查程序,将对涉事游乐...
18:10
8月13日最新消息显示,全球气候变暖加速导致冰川大规模消融,这一自然现象正将尘封的历史片段重新带回人类视野。今年1月,一支波兰科考团队在南极洲一处冰原上意外发现了一具保存完好的遗骸,其身旁散落着超过200件个人物品,包括衣物、工具和科研设备等。这一重大发现迅速引起国际关注,英国当局立即介入,将遗骸及物品运回伦敦进行科学鉴定。经过严谨的DNA比对分析,专家们最...
18:10
微新创想8月13日讯 央视新闻报道了一起令人震惊的交通事故,肇事者年仅13岁,却实施了偷车、无证驾驶、撞人逃逸等一系列恶劣行为,引发社会广泛关注。这起事件不仅暴露了青少年法制观念的缺失,更敲响了交通安全教育的警钟。 据悉,今年4月某日,广西防城港市发生一起骇人听闻的交通事故。当时,一名13岁男孩与朋友在街头闲逛时,发现路边停放的一辆货车竟然未拔钥匙。这个年...
18:10
在人工智能领域,Token数量限制始终是一个亟待突破的技术瓶颈。最近一项由华人团队完成的突破性研究,为这一难题带来了曙光。研究证实,扩散语言模型在Token数量受限的条件下,其数据学习潜力竟是传统自回归模型的整整三倍。这一发现不仅可能颠覆现有语言模型训练范式,更预示着AI领域即将迎来新的技术革命。 这项研究的核心是一个参数规模达10亿的扩散模型。研究团队采用...
18:10
腾讯控股近日发布了截至2025年6月30日的第二季度财报,数据显示公司在本季度实现了1845亿元营收,同比增长15%,经营利润(Non-IFRS)更是达到了692.5亿元,同比增幅高达18%。这一亮眼业绩背后,是腾讯对技术创新的坚定投入。公司研发投入达到202.5亿元,同比增长17%,这一数据充分彰显了腾讯在技术创新领域的决心与力度。特别是在人工智能(AI)...
18:10
华峰化学与全球化工巨头美国伊士曼化工公司于8月13日正式宣布达成战略合作协议,双方将携手成立合资企业,专注于研发与生产伊士曼Naia™醋酯纤维素长丝纤维这一高端材料。此次合作标志着该创新纤维将首次在中国本土实现规模化生产,不仅将极大完善亚太地区的供应链体系,还将有效提升对区域内高端材料需求的响应速度与质量保障能力。作为醋酯纤维素纤维领域的领先技术,Naia™...
18:10
8月13日,江特电机正式发布最新经营状况公告,确认近期公司内部运营及外部市场环境均保持稳定,未出现任何需要披露而尚未公开的重大事项。公告中特别强调,江特电机在江西宜春地区已成功获取并持有多个采矿权和探矿权,其控制的锂矿资源总量已突破1亿吨大关,为公司的持续发展奠定了坚实的资源基础。 在产业布局方面,江特电机正积极把握人形机器人这一新兴产业的巨大发展机遇。公司...
18:10
2025年8月13日收盘后,龙虎榜数据揭示出机构资金流向的显著变化,共有29只个股吸引了机构的关注并参与交易。从机构净买入角度来看,创新医疗以1.01亿元的净买入额位居榜首,展现出机构对该股的强烈信心;紧随其后的是江特电机,净买入金额达到8933万元,同样显示出机构的积极布局;沪电股份则以7292万元的净买入额位列第三,反映出机构对该股未来发展的看好。 而在...
18:10
2025年8月13日,哈投股份正式发布其2025年半年财务报告,数据显示公司上半年经营表现亮眼。报告期内,哈投股份实现营业总收入14.75亿元,相较于去年同期增长1.12%,虽然增速相对温和,但归母净利润却大幅攀升至3.8亿元,同比增长率高达233.08%,展现出强劲的盈利能力。 在子公司方面,江海证券的业绩表现尤为突出。报告期内,江海证券实现营业总收入7....
18:10
2025年8月13日,备受瞩目的半导体设备制造商屹唐股份正式对外发布重要公告,揭露了一起严重的知识产权侵权事件。公告指出,全球领先的半导体设备供应商应用材料公司,在未获授权的情况下,通过不正当手段非法获取了屹唐股份的核心技术秘密,具体涉及等离子体源及晶圆表面处理等关键领域。更为严重的是,应用材料公司不仅窃取了技术,还在中国境内进行了专利申请,公然侵犯屹唐股份...