微新创想:传统的 AI 配音在面对影视、动画等高标准场景时,常因难以匹配复杂的情绪爆发和精准口型而遭遇瓶颈。针对这一痛点,通义实验室正式发布并开源了首个影视级多场景配音多模态大模型——Fun-CineForge。该模型致力于解决影视制作中长期存在的“声画脱节”问题,通过四大严苛维度的协同,实现更高质量的配音效果。

突破“声画脱节”:四大严苛维度的协同不同于仅依赖文字转语音的传统模型,Fun-CineForge 旨在攻克影视制作中的四大核心挑战。首先是口型同步,实现合成语音与画面唇部运动的高度一致。其次是情绪表达,结合面部形象与指令描述,赋予声音拟人化的情感深度。第三是音色一致性,在复杂的多角色对话中保持特定人物的音色稳定。最后是时间对齐,即使说话人被遮挡或不在画内,语音也能在毫秒级精确的时间点切入。

核心技术:引入“时间模态”与高质量数据集Fun-CineForge 的技术突破在于其独有的 “数据+模型”一体化设计。通义实验室配套开源了 CineDub 高质量数据集,该数据集通过自动化构建流程,利用思维链纠错机制,将中英文文本转录错率降至 1% -2% 左右,说话人分离错误率也大幅降至 1.2%。这为模型的训练提供了更可靠的数据基础。

通义实验室发布Fun-CineForge开创AI影视配音新时代插图

四模态融合架构: 模型首次引入 “时间模态”,配合视觉(唇形表情)、文本(台词情感)和音频(音色参考)共同建模。这使得模型即便在“看不到”人脸的复杂场景下,也能依靠时间监督目标实现精准同步。这种多模态融合的方式,极大提升了配音的自然度和表现力。

表现卓越:填补多人对话配音空白实验数据显示,Fun-CineForge 在词错率(WER/CER)、唇部同步度(LSE-C/D)及音色相似度上均显著优于 DeepDubber-V1 等基线模型。尤其值得关注的是,该模型首次实现了对双人及多人对话场景的精准支持,在30秒以内的视频片段中表现出极强的鲁棒性。无论是单人独白还是多人对话,Fun-CineForge 都能提供高质量的配音体验。

该模型的发布不仅为影视制作提供了新的技术工具,也为AI语音合成领域带来了重要的突破。通过开源,开发者和研究者可以进一步探索和优化其性能,推动多模态语音技术的发展。

最新快讯

2026年03月16日

17:47
微新创想:3月16日,阿里云与达能亚太宣布达成AI战略合作。合作地点覆盖亚太地区,双方将聚焦‘AI+健康’愿景,在全栈AI、大数据及区域公共云等领域深度协同。此举旨在共建面向AI时代的数智化平台与敏捷组织,提升健康消费品领域的智能化决策与运营效率。合作即日起启动,无具体项目截止时间。
17:47
微新创想:索尼在AWE2026展会现场全球首次公开展示其新一代真彩RGB电视 索尼此次带来的新品是其在显示技术领域的重要创新成果。这款电视采用先进的RGB LED背光系统,能够实现更广的色域覆盖和更精准的色彩表现。通过这一技术,电视在高亮度环境下依然能保持色彩的饱满与通透,显著改善了传统电视在明亮场景下可能出现的色彩断层现象 该电视还具备精密灰阶控制功能,使...
17:47
微新创想:2026年3月,东吴证券发布研报,维持藏格矿业(000408.SZ)“买入”评级。公司2025年营收达到35.8亿元,同比增长10.0%。归母净利润更是实现38.5亿元,同比增长49.3%。这一业绩表现得益于锂、钾、铜三大核心产品的价格持续高位运行。同时,麻米措锂盐湖的复产以及产能的逐步释放,进一步增强了公司的盈利能力。 微新创想:在市场需求不断增...
17:47
微新创想:2026年3月,杭州——由网易《阴阳师》原事业部负责人金韬于2025年创办的游戏公司芥子信息,近日完成数千万美元融资。公司目前处于产品研发阶段,尚未推出正式产品。本轮融资将用于核心团队扩建、技术研发及首款游戏的深度打磨。 芥子信息注册地为杭州,专注于高品质原创移动游戏的研发。公司强调美术表现与叙事体验,致力于打造具有市场竞争力的游戏作品。此次融资不...
17:47
微新创想:2026年3月16日,一加中国区总裁李杰宣布,一加15T、15、Ace 6、Ace 6T及Turbo 6共5款机型将首批适配《无畏契约手游》原生165Hz高帧率模式。该功能随新赛季更新同步上线,为玩家带来更极致的视觉与操作体验。 一加15T已于3月11日晚发布,这款手机主打小屏旗舰设计,配备6.32英寸屏幕,机身宽度仅为71.82mm,整体尺寸紧凑...
17:47
微新创想:2026年3月16日,DEKRA德凯正式授予中汽研汽车检验中心(广州)有限公司新能源试验室两项国际资质。这两项资质分别涵盖全球首个工业镍氢电池IEC 63115全系列标准CB测试实验室(CBTL)以及覆盖安规、通信协议等关键项目的充电桩国际检测资质。这一认证不仅体现了实验室在新能源领域技术实力的认可,也标志着其具备依据国际电工委员会标准开展权威检测...
17:47
微新创想:2026年3月15日 第98届奥斯卡金像奖在美国洛杉矶正式揭晓 《阿凡达:火与烬》(即《阿凡达3》)成功斩获最佳视觉效果奖 这部由詹姆斯·卡梅隆亲自执导的电影 自从2026年春节档期上映以来 就持续引发观众热议 微新创想:影片的主演阵容包括了佐伊·索尔达娜和萨姆·沃辛顿 他们再次化身纳美人杰克与奈蒂莉 为观众带来全新的冒险故事 电影讲述了杰克家族在...
17:47
微新创想:当地时间2026年3月13日 据韩媒报道 ASML正推进混合键合设备开发 合作方包括EUV磁悬浮系统供应商Prodrive与VDL-ETG 这一举措表明ASML正在从传统前端光刻设备向后端先进封装领域拓展 公司CTO Marco Pieters表示 已将封装与键合所需设备基座纳入长期技术研判 他强调了先进封装技术在未来半导体制造中的重要性 并指出公...
17:46
微新创想:2026年3月,宝马集团宣布持续推进电动化转型,同时保留燃油发动机业务。公司计划到2030年实现燃油车与电动车销量持平,即电动车占全球总销量50%。该目标覆盖宝马、MINI和劳斯莱斯三大品牌。 目前电动车销量占比已从2021年的4.1%升至2025年的17.9%。这一增长趋势表明宝马在新能源领域的布局正在加速。为了支持电动化战略,宝马集团投入巨资研...
17:46
微新创想:2026年3月,中文旅游服务平台东游记宣布完成900万美元天使轮融资,释放总股本6%。此次融资吸引了多个重要投资方的关注,其中包括英国BY Block基金会、香港某机构以及一位个人天使投资人。投资方的加入不仅为东游记提供了充足的资金支持,也为其未来的发展方向注入了新的活力。 本轮融资将重点用于平台技术的持续迭代,以提升用户体验和系统稳定性。同时,公...
17:46
微新创想:2026年3月16日,香港创新科技及工业局局长孙东在公开活动中表示,鉴于开源AI体OpenClaw存在权限过高、数据外泄及系统入侵等潜在安全风险,数字政策办公室已紧急提醒各部门,现阶段不得在连接政府网络的电脑上安装该程序 此举旨在防范不确定性安全威胁,保障政府信息系统稳定与数据安全 相关评估将持续进行,后续安排将视风险研判结果而定
17:46
微新创想:3月16日,挪威水电公司Statkraft首席执行官克里斯蒂安·瓦尔达尔在公开声明中指出,为实现2030年可再生能源目标,欧盟亟需加速部署储能电池与升级输配电网。此举旨在应对风电、光伏间歇性挑战,提升系统灵活性与稳定性。 瓦尔达尔强调,当前基础设施投资仍滞后于能源转型速度,呼吁政策制定者加大跨区域电网互联与电池制造支持。该表态反映欧洲电力行业对新型...