在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年03月01日

09:14
微新创想:2026年3月2日至5日,红魔将在西班牙巴塞罗那Fira Gran Via 3号馆3F30展位亮相MWC 2026。此次参展,红魔游戏手机产品总经理姜超提前公布了参展阵容,涵盖了多款备受期待的产品。其中包括红魔11 Pro系列、鸣潮限定版、11 Air手机,以及电竞平板3 Pro、GOLDEN SAGA臻金典藏版和首款开放式头戴电竞耳机等。这些产品...
09:14
微新创想:2025年,伦敦警方对废品商大流士·汗的住所进行了突袭,查获了他所持有的世嘉开发机、原型机以及游戏卡带。据大流士·汗表示,这些设备是从世嘉办公室的清运废品中合法购得,并计划出售给电子游戏保存博物馆。警方在审讯了8小时后并未对其提起正式起诉,但仍然以涉嫌盗窃和洗钱等罪名对其施加压力。 调查过程中,警方发现这些设备的流失并非出于大流士·汗的主观故意,而...
09:14
微新创想:2026年2月27日,北京五和博澳药业股份有限公司正式向港交所递交上市申请,华泰国际担任其独家保荐人。公司自2010年成立以来,始终专注于天然药物创新及药物递送系统(DDS)的研发领域。凭借在该领域的深厚积累,五和博澳已成功推出一款商业化产品桑博恩®,该产品主要用于治疗2型糖尿病。同时,公司还拥有八款在研药物,涵盖多个治疗方向,展现出较强的创新能力...
09:14
微新创想:小米汽车在3月1日宣布,其2026年2月整车交付量已突破20000台。这一成绩标志着小米在智能电动汽车领域迈出了坚实的一步。此次交付主要以小米SU7单一车型为主,该车型自2025年4月正式上市以来,市场反响热烈,销量持续攀升。 小米汽车的交付范围已覆盖全国30个省市,重点区域集中在一线及新一线城市。这表明小米汽车在市场拓展方面取得了显著进展,逐步建...
09:14
微新创想:2026年3月1日,江西崇义章源钨业股份有限公司宣布调整硬质合金产品价格。公司表示由于钨原材料价格持续上涨,导致生产成本大幅增加,为维持正常的生产经营秩序,决定自当日零时起全面执行新价格。此次调价涉及公司所有硬质合金产品,旧价格将同步停止使用。 微新创想:此次价格调整是公司在面对原材料市场波动时采取的重要措施。钨作为重要的战略资源,其价格的变动直接...
09:14
微新创想:3月1日至2日我国中东部地区将出现大范围雨雪天气 此次天气过程影响范围广泛,涉及我国多个省份。北方多地预计将有较强降雪,给出行带来较大不便。同时,江南及华南地区降雨频繁,部分地区甚至可能出现暴雨,需特别关注天气变化带来的影响 冷空气与暖湿气流的交汇是此次雨雪天气的主要成因。冷空气自北向南移动,与南方的暖湿气流相遇,形成明显的降水系统。这种天气变化不...
08:39
微新创想:2026年3月1日,一项研究揭示了GPT-5及后续大语言模型在处理多轮分片式对话任务时出现显著性能下降的问题 研究人员菲利普·拉班团队对代码、数据库等六个任务进行了测试发现当使用分片式输入方式时模型的平均性能相比拼接式输入下降了33%这一结果在更新模型后依然存在 Python任务的表现相对较为稳定这表明不同任务类型对分片式输入的敏感度存在差异 性能...
08:01
微新创想:2月27日,《宝可梦》迎来30周年纪念日。为了庆祝这一重要时刻,宝可梦公司特别推出了黑白配色初代Game Boy风格的皮卡丘毛绒玩偶。这款限时周边产品在东京湾、横滨及大阪等地的宝可梦中心一经发售,便引发了巨大的抢购热潮。 现场出现了无序涌入、推搡争抢、儿童哭喊等混乱场面。有报道称,一些顾客甚至为了抢购而发生肢体冲突,整个场景被形容为“战争”。工作人...
08:01
微新创想:2026年2月,微软通过可选更新KB5077241,向更多Windows 11设备推送任务栏彩色电池图标及新版开始菜单。此次更新带来了更加直观的电池状态显示,使用户能够更清楚地了解设备的电量情况。 该图标在设备充电时会显示为绿色并伴有闪电图案,当电量低于30%时会切换为橙色,电量低于6%时则变为红色。这种颜色变化设计有助于用户快速判断设备的电力状况...
08:01
微新创想:2026年2月24日,美国薇拉·C·鲁宾天文台的自动预警系统正式上线。该系统基于时空遗产巡天(LSST)相机,具备强大的观测能力。每晚可以拍摄大约1000张高分辨率图像,通过与基准图像进行比对,快速识别出天体变化。一旦发现新的暂现源,系统将在数分钟内将预警信息发送给全球的天文学家。 微新创想:预警信息涵盖多种天体事件,包括小行星、超新星以及活动黑洞...
07:29
微新创想:2026年2月,加拿大林产品创新研究院(FPInnovations)联合交通部发布了一项为期12个月的真实道路测试报告。该测试覆盖超过20万公里的行驶里程,旨在评估福莱纳卡斯卡迪亚柴油版与电动版8级卡车在实际运营中的表现。 测试地点位于蒙特利尔地区,研究团队采用了两支独立车队进行对比运营,确保测试结果的客观性和公正性。整个测试过程中未对使用方式进行...
03:50
微新创想:卡塔尔航空宣布将于多哈时间3月1日19:00正式恢复航班运营 此次复航涵盖所有国内外航线,覆盖全球超过160个目的地 公司表示复航决策基于航空安全评估的完成以及空管系统的全面恢复运行 运营过程中将严格按照既定的防疫与安全标准执行 旅客需遵守最新的出入境规定以确保顺利出行 此举旨在逐步恢复正常客运服务并促进区域间的联通与经济复苏