在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月06日

12:24
2月5日,HBO宣布推进《博德之门》电视剧项目,故事承接《博德之门3》游戏世界观。该剧由《最后生还者》联合主创克雷格·马津担任主创、编剧及执行制片人。剧集将启用全新主角,同时保留游戏中的标志性角色,并计划邀请原班配音演员参与。拉瑞安工作室不参与制作,播出时间尚未公布。马津表示已深度体验游戏超1000小时,并完成高难度“荣誉模式”。
12:24
2026年2月,宠物AI智能硬件企业灵尾纪元宣布完成数千万元A轮融资,由天空工场创投基金与地方政府引导基金联合投资。公司聚焦宠物全生命周期管理,依托多模态传感器、持续学习AI算法及海量用户数据,整合智能硬件、软件服务、耗材、食品及宠物医疗等环节。本轮融资将用于技术研发、产品迭代及市场拓展,加速构建智能化宠物生态体系。
11:53
2026年2月6日,德国生物制药公司AgomAb Therapeutics在美国纳斯达克交易所正式上市,证券代码AGMB,募资总额2亿美元。该公司专注于开发靶向再生受损组织的激动剂抗体,主攻纤维化、炎症、自身免疫及退行性疾病领域,相关候选药物已进入临床试验阶段。此次融资将主要用于推进核心管线临床开发、扩大研发团队及加速全球化布局。
11:53
2026年2月6日,据日媒报道,中国系电视品牌(海信、TCL及索尼与TCL合资后整合部分)在日本国内市场占有率将升至60%。以43英寸4K液晶电视为例,TCL售价约5万日元,显著低于索尼的10万日元。日本企业依赖外购面板,技术优势减弱。BCN综研数据显示,2025年中国系已占50%,合资落地后将达60%。分析指出,中国厂商成本与技术双提升,‘便宜没好货’印...
11:53
2026年2月,央山医疗完成数千万元人民币Pre-A轮融资,由山蓝资本、远毅资本联合领投,蓝驰创投跟投。该公司聚焦口腔及颌面外科领域,以手术机器人、人工智能和无源创新器械为核心,提供全流程解决方案。其自主研发的无遮挡口腔手术机器人采用全新导航技术,具备零配准、抗干扰、快速手术及短学习曲线等优势,即将应用于临床种植手术。
11:53
2月4日,Reddit用户O_MORES完成一项跨20年技术代差的硬件实验:在未焊接改造前提下,通过M.2转PCIe扩展卡与PCIe转PCI适配器两级转接,将现代PCIe 3.0 NVMe固态硬盘接入1992年标准的古董PCI插槽。实验地点为个人PC平台,主体为一台搭载传统PCI主板的老式系统。此举验证了物理接口兼容性突破的可能性,但受限于PCI总线带宽(...
11:53
2026年2月6日上午,吉利银河M7在意大利米兰完成全球首秀。该车为插电混动中型SUV,搭载1.5L发动机与磷酸铁锂电池,纯电续航225km,满油满电综合续航达1730km。车身尺寸为4770×1905×1685mm,轴距2785mm,采用‘飞檐虎视’设计语言及双贯穿式灯组。内饰配备1.2㎡全景天窗、Flyme Sound 23扬声器及256色AI氛围灯。...
11:53
2026年2月,深圳普尚电子科技有限公司宣布完成A轮融资,由电控产投独家投资。该公司专注于无线通信与射频微波领域,自主研制中高端矢量网络分析仪、信号分析仪及信号源等测试测量仪表。本轮融资将用于加大核心芯片研发、产线升级及高端人才引进。公司总部位于深圳,已推出多个系列、数十款型号产品,服务通信、军工及科研客户。
11:53
据德媒Hardwareluxx近日访问英伟达慕尼黑分部获悉,DLSS 4.5中的六倍多帧生成与动态多帧生成功能将于2026年4月正式发布。两项技术为GeForce RTX 50系列显卡独占,旨在优化路径追踪游戏性能。在4K分辨率下,六倍多帧生成可提升帧率最高达35%;动态多帧生成则智能匹配显示器刷新率,兼顾帧率、画质与响应速度。此前,DLSS 4.5第二代...
11:53
2026年2月6日,巨量引擎发布《2025商业信任与安全治理报告》。报告显示,2025年平台全年前置拦截违规广告素材超100亿条,关停风险账户逾400万个,单日黑产账户处置峰值达20万个。此举旨在强化电商及广告生态安全,应对新型违规手段。治理覆盖内容审核、账户风控、模型识别等多环节,依托AI与人工协同机制实现精准防控。
11:53
2月6日,A股贵金属概念局部回暖,湖南黄金连续10个交易日7次涨停。潮宏基触及涨停,萃华珠宝、晓程科技、中国黄金等跟涨。当日现货白银涨超2%,现货黄金重返4800美元/盎司上方。此前白银曾单日跌近10%,市场情绪修复带动板块反弹。资金聚焦避险属性强化的贵金属标的,短期交易热度显著提升。
11:53
2026年2月4日(美东时间),美国联邦通信委员会(FCC)正式受理并公示SpaceX提交的非地球静止轨道卫星系统申请。该公司计划发射最多100万颗卫星,构建“轨道数据中心”网络,旨在拓展卫星互联网能力。FCC主席布伦丹·卡尔称该构想或为“迈向卡尔达舍夫II级文明的第一步”。同日稍晚,马斯克在社交媒体明确否认“SpaceX正在开发手机”的传闻,强调公司当前...