马里兰大学与Meta AI研究人员联合推出突破性视频抠图新方法——OmnimatteRF,通过创新性地融合2D前景图层与3D背景模型,显著提升了视频抠图的精准度和适用范围。这一技术突破为视频处理领域带来了革命性进展,特别是在处理复杂动态场景时展现出卓越性能。

2D前景图层专门用于捕捉运动物体及其动态影响,而3D背景模型则完美适配具有复杂几何结构和非旋转摄像运动的场景。这种双模型协同工作方式极大地扩展了可处理视频类型的多样性,从日常记录到专业制作都能实现高质量抠图效果。研究人员在两个权威视频数据集上的对比实验表明,OmnimatteRF的表现远超传统方法,且无需针对每个视频进行单独参数调整,真正实现了通用化解决方案。

Omnimatte技术之所以备受瞩目,源于其巧妙融合了现有两种领先方法的优点。传统Omnimatte方法基于单应性建模背景,仅适用于平面或纯旋转运动场景;而D2NeRF通过独立建模动态与静态成分,采用双辐射场架构,在处理大范围运动场景时表现出色,且无需任何遮挡输入即可实现完全自监督。OmnimatteRF则创新性地将两者结合,既保留了对复杂几何形状的精准处理能力,又增强了2D指导信息的融合机制,真正实现了技术突破。

具体实现流程中,OmnimatteRF首先运用传统视频遮罩技术精准分离动态前景层,随后结合单目深度估计训练TensoRF神经辐射场模型构建静态背景,最终通过联合优化算法实现前景与背景的无缝融合。实验数据显示,在各类真实视频测试中,OmnimatteRF的重建效果比仅依赖二维层的方法提升超过30%,特别是在处理复杂场景时优势更为明显。这一技术不仅为视频制作专业人员提供了强大工具,可用于添加特效或进行场景重构,更在构建沉浸式虚拟环境领域展现出巨大潜力,有望推动数字内容创作进入全新阶段。项目源代码已开源至GitHub,为业界提供宝贵研究资源。

最新快讯

2026年02月27日

09:22
2026年2月27日,武汉大学物理科学与技术学院王植平教授课题组在《科学》在线发表成果。研究团队提出‘原子尺度界面键合’技术,采用原子层沉积工艺,在钙钛矿太阳能电池空穴与电子传输层界面引入可调控的氧化铪(HfOx)中间层,实现双界面同步稳定。该技术显著提升热稳定性和机械附着力,抑制离子迁移。所制备p-i-n型电池获27.1%光电转换效率(第三方认证26.6...
09:22
微新创想:2026年2月27日 发行商Epic宣布《装机模拟器2》正式登陆PS5与Xbox Series X|S平台 游戏定价24.99美元(约合171.2元人民币) 与PC版一致 本作于2022年10月12日首发 涵盖超40个真实硬件品牌 1200余组件 支持职业生涯与自由模式 提供装配 超频 RGB定制及水冷系统搭建等拟真体验 此次主机移植为首次跨平台扩...
09:21
微新创想:2026年2月27日,美格智能技术股份有限公司宣布启动香港IPO计划。公司拟发售3500万股新股,发行价上限设定为每股28.86港元,预计最高可筹集资金达10亿港元。此次IPO将为公司带来重要的资本支持,助力其在全球市场中的进一步拓展。 此次上市不仅标志着美格智能在资本市场的进一步布局,也体现了公司在5G与AIoT技术领域的持续投入。通过此次融资,...
09:21
微新创想:2月26日18时21分 秘鲁利马大区卡涅特省奇尔卡以西36公里处发生5.0级地震 此次地震的震源深度为53公里 地震信息由秘鲁地球物理研究所国家地震中心测定 首都利马市区居民普遍感受到明显的震感 地震波及范围较广 引起广泛关注 目前官方尚未发布人员伤亡和财产损失的具体报告 地震发生后相关部门已启动应急响应机制 此次地震提醒人们关注地震预警和防灾减灾...
09:21
微新创想:2026年2月27日,湖南省印发实施《进一步促进民间投资发展的若干措施》,从优化审批、拓展领域等5方面推出19条举措。措施明确:对农业水利、能源、交通等具备收益的省级审批项目,支持民间资本持股超10%;市场化程度高的项目持股比例不设上限。同时鼓励民企参与低空经济、北斗应用、重大科研设施共享及数字化升级,并推动与外资股权合作。旨在稳定预期、激发活力,...
09:21
微新创想:2026年2月27日,中信证券发布研报指出,阿里、腾讯正积极推进网络物理层优化(NPO)架构落地与标准化。NPO技术因在信号完整性、功耗和可维护性间实现良好平衡,成为突破AI算力网络带宽瓶颈的关键方案。 NPO技术在光通信领域展现出显著优势。它不仅提升了数据传输的稳定性,还有效降低了能耗,同时提高了系统的可维护性。这些特性使其在高性能计算和大规模数...
09:21
微新创想:谷歌今日正式发布新一代图像生成模型Nano Banana 2,该模型以更快、更便宜、更易用的高质量图像生成能力为核心卖点。Nano Banana 2将逐步接入多个重要平台,包括Gemini、Google搜索、AI Studio、Flow、付费API以及Google Ads,全面替代旧版模型。这一更新标志着谷歌在AI图像生成领域迈出了重要一步,为用户...
09:21
微新创想:近日,贵阳一家食品企业推出的脆哨产品因独特的食用方法说明在网络引发热议。这款产品的瓶身标注着“大喊‘妈’,然后等着就行了”的诙谐提示,迅速成为社交平台上的热门话题。不少网友调侃称:“原来贵州脆哨要这样吃!中国人秒懂,喊完只听见房间回音。” 作为贵州传统风味小吃,脆哨以猪肉为原料,通过不同部位和加工方式衍生出多样品类。五花肉熬制的软哨口感酥糯,纯肥肉...
09:21
微新创想:全球 AI 市场在2月迎来关键转折点,中国开源模型首次在全球 Token 使用量上全面反超美国模型。这一变化由在线 AI 托管平台 OpenRouter 的最新数据所揭示,成为衡量全球 AI 开发活跃度的重要风向标。OpenRouter 聚合了谷歌、Anthropic 以及中国头部厂商的各类大模型,其数据显示,2月9日至15日期间,中国模型的周调用...
09:21
微新创想:OpenAI的全球扩张版图迎来了里程碑式的跨越。2026 年 2 月 27 日 据36 氪援引新浪财经消息 ChatGPT 开发商OpenAI正式宣布 将把 伦敦 打造为其在 美国本土以外规模最大的研究中心。这一决策不仅是OpenAI全球化人才战略的核心一环 更被视为对英国科技生态系统的一次重量级“信任投票”。 核心驱动:为什么选择伦敦?在Open...
09:21
微新创想:翻译软件的“机翻味”正被 AI 彻底洗去 2026 年 2 月 27 日 据IT之家报道 谷歌翻译宣布迎来史诗级升级 正式引入其最强 AI 模型 Gemini 此次更新的核心在于赋予了翻译工具“理解语境”的能力 让跨语言沟通不再仅仅是词汇的堆砌 而是文化的精准对齐 核心亮点 你的翻译自带“注释”与“方案” 得益于Gemini强大的多语言处理能力 谷...
09:21
微新创想:全球知名社交应用Bumble于周四正式发布了一系列由人工智能驱动的全新功能,旨在通过自动化反馈与个性化指导优化用户个人资料,从而提升平台匹配效率与社交成功率。此次更新的核心在于全球上线的“AI个人资料指导”工具(Profile Guidance),该工具能够对用户的个人简介及提示信息提供可操作的改进建议。同时,针对美国市场推出了“AI照片反馈”功能...