马里兰大学与Meta AI研究人员联合推出突破性视频抠图新方法——OmnimatteRF,通过创新性地融合2D前景图层与3D背景模型,显著提升了视频抠图的精准度和适用范围。这一技术突破为视频处理领域带来了革命性进展,特别是在处理复杂动态场景时展现出卓越性能。

2D前景图层专门用于捕捉运动物体及其动态影响,而3D背景模型则完美适配具有复杂几何结构和非旋转摄像运动的场景。这种双模型协同工作方式极大地扩展了可处理视频类型的多样性,从日常记录到专业制作都能实现高质量抠图效果。研究人员在两个权威视频数据集上的对比实验表明,OmnimatteRF的表现远超传统方法,且无需针对每个视频进行单独参数调整,真正实现了通用化解决方案。

Omnimatte技术之所以备受瞩目,源于其巧妙融合了现有两种领先方法的优点。传统Omnimatte方法基于单应性建模背景,仅适用于平面或纯旋转运动场景;而D2NeRF通过独立建模动态与静态成分,采用双辐射场架构,在处理大范围运动场景时表现出色,且无需任何遮挡输入即可实现完全自监督。OmnimatteRF则创新性地将两者结合,既保留了对复杂几何形状的精准处理能力,又增强了2D指导信息的融合机制,真正实现了技术突破。

具体实现流程中,OmnimatteRF首先运用传统视频遮罩技术精准分离动态前景层,随后结合单目深度估计训练TensoRF神经辐射场模型构建静态背景,最终通过联合优化算法实现前景与背景的无缝融合。实验数据显示,在各类真实视频测试中,OmnimatteRF的重建效果比仅依赖二维层的方法提升超过30%,特别是在处理复杂场景时优势更为明显。这一技术不仅为视频制作专业人员提供了强大工具,可用于添加特效或进行场景重构,更在构建沉浸式虚拟环境领域展现出巨大潜力,有望推动数字内容创作进入全新阶段。项目源代码已开源至GitHub,为业界提供宝贵研究资源。

最新快讯

2025年12月16日

14:20
2025年12月15日,商汤科技在备受瞩目的产品发布周上正式推出了全新升级的Seko2.0版本,为AI视频创作领域带来了革命性突破。此次升级不仅全面优化了用户界面,更在智能体调度功能上实现了重大突破,现在支持在百集以内完成连续剧本的创作,极大提升了内容生产的连贯性与效率。 Seko2.0版本的核心亮点在于集成了先进的SekoIDX与SekoTalk技术。...
14:20
2025年12月16日,备受瞩目的韦氏词典正式揭晓年度词汇——"slop",这一词汇精准捕捉了人工智能批量制造的低质数字内容现象。词典机构之所以选择该词,源于其近年来在搜索引擎中的指数级增长和广泛传播,深刻反映了AI技术滥用导致网络空间充斥着大量虚假、粗糙且毫无价值的信息内容。韦氏词典总裁格雷格・巴洛在官方声明中强调:"slop这个词完美诠释了当下令人忧虑的...
14:20
12月16日,阿里巴巴重磅推出新一代视频生成模型——万相2.6,为专业影视制作与图像创作领域带来革命性突破。该模型在原有基础上全面升级,新增支持角色扮演、音画同步、多镜头生成及声音驱动等核心功能,凭借其强大的综合能力,已跻身全球功能最全的视频生成模型行列。值得一提的是,万相2.6作为中国首款具备角色扮演功能的视频模型,将极大提升内容创作的灵活性与表现力。目前...
14:20
2025年12月16日,重庆市正式发布《加氢站行业发展规划(2025—2035年)》,标志着成渝氢走廊建设进入全新发展阶段。该规划以构建绿色高效物流体系为核心,重点推进以渝蓉、成渝、成遂渝高速为主干的交通走廊建设,将重庆两江新区汽车产业园、果园港、成都国际航空枢纽等关键物流节点紧密串联。据统计,这条走廊年货运量突破2.2亿吨,物流车保有量超过5万辆,为氢能应...
14:20
2025年12月16日,全球能源巨头壳牌公司传来重要人事变动消息,其并购团队负责人Greg Gut正式宣布离职。这一决定与近期备受瞩目的壳牌收购英国石油公司(BP)的并购计划直接相关。据悉,Gut曾作为核心决策者主导了此次收购要约的提出,然而该方案最终遭到公司首席执行官的明确否决,导致整个并购进程被迫终止。作为壳牌战略部门的中坚力量,Gut的离职无疑反映出公...
14:20
2025年12月16日,成都土地市场迎来一场备受瞩目的土拍活动,共计出让3宗住宅用地,最终总成交金额高达13.39亿元,呈现出鲜明的区域分化特征。其中,位于核心区域的锦江区地块成为焦点,由渝太集团旗下成都瞻辰置业凭借9.04亿元的天价竞得,折合楼面价达到21500元/㎡,溢价率虽仅为5.91%,但依然彰显出核心地段的价值吸引力。而在东部新区和新津区,两宗地块...
14:20
2025年1月至11月期间,江西省规模以上工业增加值展现出强劲的增长势头,同比增长率达到7.6%。这一成绩的取得,主要得益于制造业的显著拉动作用,其增长率高达8.4%,成为推动整体工业增长的核心动力。与之形成对比的是,采矿业在这一时期出现了5.1%的负增长,显示出该行业面临的挑战。而电力、热力等供应业则实现了2.7%的稳健增长,为工业体系的稳定运行提供了有力...
14:20
2025年12月11日,微软正式宣布将彻底淘汰其Windows身份验证系统中已沿用25年的RC4加密算法。这一决定源于该算法长期存在的严重安全漏洞。RC4算法因缺乏必要的加盐机制,且其依赖的MD4哈希函数已被证明存在设计缺陷,使其极易遭受Kerberoasting攻击。这些安全隐患不仅威胁着企业数据安全,更可能造成大规模信息泄露。 微软原计划在今年内完成RC...
14:20
2025年12月16日,科技圈传来重磅消息,知名数码博主独家爆料,三星正在积极研发一项革命性技术——将折叠屏与可变光圈技术相结合,旨在为即将到来的2026年新款iPhone正面挑战。这一举措被业界视为三星在高端手机市场应对苹果创新策略的关键一步。 与此同时,苹果公司也展现出惊人的研发速度。据内部消息,苹果计划在2027年将屏下前摄技术成功应用于直板机型,并同...
14:20
安顾中国携手普华永道重磅发布《低利率环境下寿险公司资产负债管理思路》深度白皮书。这份权威报告全面剖析了欧美及亚洲主要寿险市场在长期低利率背景下的应对策略与实践经验,通过深度结合中国寿险行业的具体现状与企业实地调研数据,系统性地提出了覆盖资产配置与负债管理、财务表现与资本运作、全生命周期规划等多维度的管理建议。该白皮书旨在为中国寿险企业构建科学有效的资产负债管...
14:18
12月16日,阿里巴巴重磅发布新一代万相2.6系列视频生成模型,凭借在专业影视制作和图像创作领域的全面升级,被业界誉为**"全球功能最全的视频生成模型"**。该模型已同步登陆阿里云百炼平台和万相官网,为创作者提供更强大的视觉创作支持。 万相2.6系列模型的最大创新在于国内首创的"角色扮演"功能,同时集成了音画同步、多镜头生成及声音驱动等先进技术。此次升级在画...
14:18
谷歌搜索近日悄然上线了一项令人瞩目的新功能——**“+”按钮**,它赋予用户上传图片与文档的能力,并借助谷歌的 Gemini AI 模型进行深度内容分析。尽管谷歌尚未正式公布相关公告,但这一功能很可能仍处于内部测试阶段,目前仅对部分幸运用户开放。 用户只需通过“+”按钮上传所需图片或文档,即可轻松激活 Google AI 模式。Gemini AI 将迅速...