在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年01月23日

20:30
2026年1月23日,北汽蓝谷子公司北汽新能源召开董事会,审议通过享界超级工厂高端平台车型产业化及产线数智化提升项目。项目选址北京,总投资19.91亿元,旨在升级冲压、焊接、涂装、总装等关键工艺,并推进数智化改造,以支持BE22 3.0高端平台车型量产。改造后工厂将具备柔性化、高效率、高质量和智能化生产能力,更好满足新能源车型迭代及个性化定制需求。该项目无...
20:30
近日,关于特斯拉完全自动驾驶系统(FSD)在中国可能获批的消息引发广泛关注。然而,据可靠消息源证实,这一传闻并不属实。特斯拉CEO埃隆·马斯克在达沃斯世界经济论坛上公开表示,他期待特斯拉能够先后在欧洲和中国获得FSD的监管批准,并暗示两者获批的时间可能相近。 目前,特斯拉在欧洲的FSD发展正面临严峻挑战。由于当地安全法规极为严格,该系统的推进进程相对缓慢。荷...
20:30
2026年1月23日,全球知名游戏引擎开发商Epic Games与科技巨头谷歌正式宣布达成一项为期六年、总价值高达8亿美元的战略合作协定。这一重磅消息不仅彰显了双方在游戏与科技领域的强大实力,更预示着一场跨界合作的全新篇章即将开启 此次合作将围绕三大核心领域展开:首先聚焦于Android平台的深度优化,通过技术协同提升虚幻引擎在移动设备上的运行效能与用户...
20:30
2026年1月23日,特斯拉中国面向Model S/3/X/Y车型推送2025.44.25.12版本软件更新。本次更新为BUG修复型升级,未新增功能。更新采用分批推送机制,部分车辆可能延迟数天收到提示。主要修复两项问题:一是2D导航在特定场景下无法正确显示实时路况;二是Web应用程序在部分情况下渲染素材未能及时更新。车主可通过车机系统设置检查并安装更新。
20:30
1月23日,长安汽车正式上市Lumin宝藏版“205km纯爱米”车型,定位入门级微型纯电车,指导价4.69万元。该车采用萌系设计语言,配备封闭式前脸与圆形大灯,车身尺寸3293×1700×1545mm,轴距1980mm。搭载35kW前置单电机、17.65kWh磷酸铁锂电池,CLTC续航205km,最高车速101km/h。配置大幅精简,取消ESC、TCS、E...
20:30
2026年1月23日,俄罗斯蓝色航空一架从泰国普吉飞往巴尔瑙尔的波音757客机(航班号ZF2998),因右侧发动机故障宣布紧急状态,设置应答机代码7700,于16时51分安全备降兰州中川国际机场。机上246人(旅客239人、机组7人)无人受伤。目前机场已启动应急保障程序,专家正评估飞机技术状况。
20:30
2026年1月23日,通宇通讯(002792.SZ)公告称,公司以3000万元自有资金参与鸿擎科技A1轮融资,直接获得其1.8293%股权。随后,公司作为有限合伙人认缴上海浩瀚力行企业管理合伙企业3000万元出资额,并由该合伙企业以同等金额受让其所持鸿擎科技全部股权。此举使通宇通讯由直接持股转为通过合伙企业间接持股。交易不改变公司对鸿擎科技的实际权益比例,...
20:30
1月23日,全球知名投资银行花旗集团在美国纽约正式宣布对英特尔公司股票目标价进行调整,将此前50美元的预测下调至48美元。这一决策由花旗研究团队基于严谨的市场分析制定,主要考量了英特尔近期营收增长面临压力、先进制程技术进展未达市场预期以及数据中心业务复苏步伐缓慢等多重因素。通过发布专业研报的形式公布此番调整,充分体现了机构对英特尔短期盈利能力及市场份额恢复速...
20:30
1月23日,南昌三瑞智能科技股份有限公司IPO审核状态在深交所官网更新为“注册生效”。该公司拟于深圳证券交易所上市,成为注册制下又一家获准发行的企业。注册生效意味着证监会已同意其公开发行股票,后续将进入发行承销阶段。公司主营智能传感与工业物联网解决方案,本次募资拟投向研发中心建设及产能扩充项目。
20:30
2026年1月23日,壳牌CEO魏思旺表示,公司正与尼日利亚合作伙伴共同研究Bonga South West大型油田项目的开发可行性。该项目位于尼日利亚海域,若通过最终投资决策,预计吸引约200亿美元外国直接投资。目前各方仍在评估技术、经济及环境因素,尚未作出投产决定。该举措旨在加强能源供应并推动区域经济发展。
19:29
2026年1月23日,双良节能(股票代码600481.SH)正式发布年度业绩预告,透露出公司2025年度的经营状况。公告显示,受多重因素影响,公司预计归属于上市公司股东的净利润将在-7.8亿元至-10.6亿元之间,呈现亏损态势。这一结果反映出光伏行业在高速发展的背后所面临的阶段性挑战。 报告期内,尽管光伏新增装机规模实现了同比增长,整个行业展现出蓬勃的发展势...
19:29
2025年12月31日,全国乘用车行业库存数据揭示出市场面临的严峻挑战。当期库存总量达到365万辆,较2024年同期大幅攀升60万辆,库存周转天数则增至66天,较去年同期的46天增加了整整20天。这一显著变化反映出汽车厂商在年末去库存方面力度不足,整体库存压力持续加大。值得注意的是,尽管本月库存环比减少了14万辆,但同比增幅依然惊人,凸显出行业亟待解决的库存...