在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月05日

22:38
2026年2月5日,丹麦药企诺和诺德欧洲股市股价下跌7.5%。美国数字医疗公司Hims&Hers Health当日宣布上线Wegovy(司美格鲁肽)口服仿制药片,定价49美元/月,显著低于原研药月均数百美元售价。此举引发市场对诺和诺德减肥药全球定价权及市场份额的担忧。事件发生于美国,涉事方为Hims&Hers Health与诺和诺德。分析指出,该仿制药虽尚...
22:38
2月3日,新丝路(北京)模特管理有限公司与数字华夏公司联合宣布启动全球首届机器人模特大赛。赛事由新丝路董事长苏文滨(哈工大机器人专业背景)与数字华夏创始人沈健共同发起。大赛突破传统机器人竞技模式,聚焦技术新形态,涵盖纯机器人走秀及人机协同表演,强调节奏、情绪与叙事的深度融合。主办方将依托新丝路32届模特赛事经验及数字华夏‘夏澜’人形机器人技术——具备高仿外...
22:37
2026年2月5日,ARM在2026财年第三季度财报电话会上宣布,未来2至3年其数据中心业务规模有望达到与智能手机业务相当水平。该公司指出,受益于AI芯片需求激增及云服务商定制化授权模式扩展,数据中心IP授权收入增速显著提升。ARM未透露具体营收数字,但强调该领域已成为战略增长核心。此举标志着ARM正加速从移动主导转向“移动+云”双引擎驱动格局。
22:37
微新创想2月5日消息,近日有多家媒体报道称,多名小米汽车销售在社交平台发帖称,SU7 Ultra车型的专属销售团队已于1月底正式解散。针对此事,小米汽车社区大管家”在官方社区发布《关于小米SU7 Ultra专业团队解散不实信息的澄清》。小米方面称,为优化SU7 Ultra的销售服务体验,对销售策略进行了调整升级。自1月底起,SU...
22:37
微新创想2月5日消息,全新一代理想L9预热已经开启,今日下午,许久不聊车的理想汽车CEO李想发布长微博。李想表示:全新理想L9,不仅是一台好车,更是具身智能机器人的开山之作,我们准备了十年,就等这一刻。众所周知,近两年来,李想一直强调all in AI,那这是否意味着他不再关心汽车了呢?对于这样的观点,他予以了否认。李想称,我们...
22:07
2026年2月5日,天津市正式施行《互联网诊疗监管实施办法(试行)》。该办法明确要求,互联网诊疗处方须由接诊医师本人开具并签署电子签名,经药师审核后生效,严禁使用人工智能等技术自动生成处方。病历资料须按门诊电子病历标准管理,保存不少于15年;图文、音视频过程记录保存不少于3年。为6岁以下儿童开具用药处方时,须确认有监护人及专业医师在场。此举旨在强化医疗安全...
22:07
2026年2月5日,欣旺达在互动平台披露,公司人形机器人专用电池正处于研发与客户对接阶段。该公司已具备相关电池技术及产品开发能力,现有电池产品已应用于扫地机器人、服务机器人等场景。因涉及保密协议,具体合作厂商及项目细节暂未公开。此举旨在把握新兴市场机遇,推动电池技术在智能机器人领域的产业化落地。
22:07
传音公司宣布,旗下新款智能手机Pova Curve 2将于2026年2月13日在印度正式发布。该机采用6.78英寸1.5K曲面屏,支持144Hz高刷新率,搭载天玑7100处理器,配备7750mAh电池与45W快充。机身提供银、黑、紫三色,后盖为四曲面磨砂设计,集成光学屏下指纹、红外遥控、杜比全景声及独立AI键,整机达IP64防护等级。运行基于Android...
21:36
2月3日,埃隆·马斯克母亲梅耶·马斯克在上海社交平台发布四宫格照片,称“看到好多特斯拉”。其中左上角黑色轿车实为国产新能源品牌深蓝汽车。2月4日,深蓝汽车CEO姜海荣转发回应,称这是“美丽的误会”,并强调中国智造正走向世界。事件发生于上海,涉及公众人物误认、国产品牌曝光与正面互动。此举意外提升深蓝汽车国际辨识度,展现中国新能源汽车出海新态势。
21:06
2月5日,生数科技宣布完成超6亿元人民币A+轮融资。本轮融资由中关村科学城公司与星连资本领投,万兴科技、视觉中国、拓尔思等上市公司战略投资,启明创投等原有股东跟投。公司成立于2023年3月,系全球最早布局多模态生成算法的团队之一,2024年发布对标Sora的文生视频大模型Vidu,并首创“参考生视频”技术;2025年Vidu用户与收入实现超10倍增长。
21:06
2026年2月5日,摩根大通发布预测称,全球石油需求将显著增长,主因新兴市场复苏及航空业持续回暖;但同期非OPEC+国家增产及库存高位,致全球供应预计超出需求。该行未披露具体差额,但指出供需失衡或压制油价上行空间。分析覆盖全年,适用于国际原油市场研判。
21:06
2026年2月5日,摩根大通发布最新研判指出,全球铜市场供需错配趋势正在加剧。该行认为,在新能源基建与制造业复苏带动需求、叠加供应端扰动持续的背景下,未来数月铜价有望迎来更强劲的上涨行情。分析涵盖主要生产国供应约束、库存低位及绿色能源转型带来的结构性需求增长等因素。机构强调,当前价格尚未充分反映基本面紧张程度。