马里兰大学与Meta AI研究人员联合推出突破性视频抠图新方法——OmnimatteRF,通过创新性地融合2D前景图层与3D背景模型,显著提升了视频抠图的精准度和适用范围。这一技术突破为视频处理领域带来了革命性进展,特别是在处理复杂动态场景时展现出卓越性能。

2D前景图层专门用于捕捉运动物体及其动态影响,而3D背景模型则完美适配具有复杂几何结构和非旋转摄像运动的场景。这种双模型协同工作方式极大地扩展了可处理视频类型的多样性,从日常记录到专业制作都能实现高质量抠图效果。研究人员在两个权威视频数据集上的对比实验表明,OmnimatteRF的表现远超传统方法,且无需针对每个视频进行单独参数调整,真正实现了通用化解决方案。

Omnimatte技术之所以备受瞩目,源于其巧妙融合了现有两种领先方法的优点。传统Omnimatte方法基于单应性建模背景,仅适用于平面或纯旋转运动场景;而D2NeRF通过独立建模动态与静态成分,采用双辐射场架构,在处理大范围运动场景时表现出色,且无需任何遮挡输入即可实现完全自监督。OmnimatteRF则创新性地将两者结合,既保留了对复杂几何形状的精准处理能力,又增强了2D指导信息的融合机制,真正实现了技术突破。

具体实现流程中,OmnimatteRF首先运用传统视频遮罩技术精准分离动态前景层,随后结合单目深度估计训练TensoRF神经辐射场模型构建静态背景,最终通过联合优化算法实现前景与背景的无缝融合。实验数据显示,在各类真实视频测试中,OmnimatteRF的重建效果比仅依赖二维层的方法提升超过30%,特别是在处理复杂场景时优势更为明显。这一技术不仅为视频制作专业人员提供了强大工具,可用于添加特效或进行场景重构,更在构建沉浸式虚拟环境领域展现出巨大潜力,有望推动数字内容创作进入全新阶段。项目源代码已开源至GitHub,为业界提供宝贵研究资源。

最新快讯

2025年12月12日

07:24
2025年12月11日,苹果公司悄然为AirPods Pro 2和AirPods Pro 3用户推送了重要固件更新,版本号分别为8B28和8B30。尽管苹果官方尚未公布此次更新的详细日志,但业界普遍推测此次升级的核心目标在于适配即将发布的iOS 16.2系统,为AirPods实时翻译功能在欧盟地区的正式落地奠定基础,同时进一步优化设备的连接稳定性与使用体验。...
04:22
2025年12月12日,科技巨头英伟达即将在美国加州举办一场备受瞩目的峰会,核心议题聚焦于数据中心日益严峻的电力短缺问题。这场行业盛会将由英伟达高层领导牵头,并邀请全球顶尖的数据中心运营商、能源供应商等关键参与者共同探讨。会议将深入剖析在人工智能算力需求爆炸式增长的背景下,数据中心所面临的电力供应瓶颈及其可持续解决方案。这一举措不仅凸显了全球人工智能基础设施...
03:22
2026年,全球铜矿业格局将迎来重要变化。据行业内部消息人士透露,泛太平洋铜业公司与伦丁矿业公司已达成一项突破性商业条款展期协议,决定维持铜矿石加工费用在现有水平上基本不变。这一关键决策的核心内容是,双方将继续采用稳定的冶炼费用(即加工精炼费)标准,确保整个供应链的平稳运行。 这一举措的背后,是全球冶炼行业正面临日益严峻的经营危机。随着市场供需关系持续失衡,...
03:22
2025年12月12日,著名投资机构橡树资本联合创始人霍华德·马克斯就人工智能技术发展引发的社会变革及就业市场潜在冲击,公开表达了深切的忧虑。在最新发布的市场评论中,他明确指出当前全球利率水平已处于合理区间,无需政策制定者进一步采取激进的大幅降息措施。马克斯以历史视角对比分析,认为相较于2000年互联网科技泡沫破裂前的市场环境,如今的金融市场结构更为稳健,风...
03:22
2025年12月12日凌晨,北京时间,微软消费者生成式AI主管穆斯塔法・苏莱曼公开宣布了一项重大战略决策。他明确表示,微软将全面投入以服务人类为核心目标的超级智能研发工作,并郑重承诺,一旦任何技术进展可能对人类构成潜在风险,公司将立即采取行动暂停相关研究。 苏莱曼在加入微软后,迅速展现出强大的领导力,主导了多项自研AI项目的推进。值得注意的是,此前由于与Op...
03:22
2025年12月12日,微软消费人工智能主管Mustafa Suleyman正式宣布,微软正全力投入研发与人类利益高度契合的超级智能系统。这一重要进展的背后,是微软与OpenAI之间合作协议的解除。此前,由于协议限制,微软在人工智能研发上受到诸多束缚。然而自2024年10月起,随着微软获得自主开发人工智能技术的权利,相关研究工作得以突破性推进。 Suleym...
02:51
2025年12月12日,人工智能领域迎来重大突破,OpenAI正式发布了新一代大型语言模型GPT-5.2。这一战略升级不仅彰显了OpenAI在技术竞赛中的雄心,更标志着其在与谷歌等科技巨头的技术角逐中迈出了坚实一步。此次发布的GPT-5.2模型,在保持核心功能稳定性的同时,实现了多项关键性能的提升,为全球开发者和服务商提供了更加强大的人工智能工具。 Open...
02:21
2025年12月12日,医疗影像服务领域的领军企业Lumexa成功敲响上市钟声,其首次公开募股(IPO)项目迎来超五倍的超额认购,创下了资本市场的新纪录。此次IPO于当日正式启动,在公开资本市场上向全球投资者敞开大门,Lumexa公司作为发行主体全程主导了这一历史性时刻。如此踊跃的认购热情充分印证了市场对Lumexa创新业务模式的深度认可,也彰显了其在医疗影...
02:21
12月12日凌晨1时18分,云南省昭通市大关县附近区域(北纬28.22度,东经103.93度)发生4.0级地震。该地震由中国地震台网自动监测并初步测定震级,具体数据及影响范围尚待官方正式速报确认。截至目前,暂未收到人员伤亡及财产损失的报告。当地政府已迅速启动应急响应机制,相关部门正密切监测震情变化,全力保障民众安全。此次地震虽未造成明显影响,但提醒我们应时刻...
01:21
2025年12月12日,谷歌正式发布了全面升级的“双子座(Gemini)深度研究代理”,这款智能工具在复杂问题分析与研究能力上实现了突破性进展,能够自动生成深度报告,为用户带来前所未有的高效体验。此次重大更新不仅提升了代理的智能化水平,还新增了交互式API功能,使用户可以轻松调用并集成到各类应用中,极大地拓展了其应用场景。谷歌表示,此次升级的核心目标是为开发...
01:21
2025年12月12日,中国创新药企诺诚健华传来振奋人心的消息,其自主研发的新一代TRK抑制剂——佐来曲替尼(商品名:宜诺欣)正式获得国家药品监督管理局批准上市。这款备受瞩目的创新药物专用于治疗携带NTRK融合基因的成人及12岁以上青少年实体瘤患者,填补了国内该治疗领域的空白。作为国内首款完全自主研发的新一代TRK抑制剂,宜诺欣的获批不仅标志着我国精准肿瘤治...
00:21
2025年12月11日,OpenAI首席执行官Sam Altman在一场备受瞩目的公开演讲中,以充满期待的语气透露了公司内部的一项重大进展。他明确表示,对于"即将推出的芯片"项目,OpenAI团队怀有极大的热情与兴奋。这一表态不仅揭示了OpenAI在硬件研发领域的雄心壮志,更暗示着公司正以前所未有的速度推进自研芯片的进程。 Altman指出,该芯片项目的核心...