在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月04日

00:21
2026年2月4日,星期三,我们将迎来中国农历二十四节气中的第一个节气——立春。作为春天的序幕,立春不仅意味着气温逐渐回暖,更预示着全国范围内的春耕活动即将拉开帷幕。在古代,立春被视为农事的起点,因此朝廷会举行盛大的迎春仪式,包括鞭打土牛、祭祀句芒神等传统活动,以祈求丰收。而民间则流传着丰富多彩的习俗,如报春、赠送春牛图以及品尝萝卜等"咬春"美食,还有吃春饼...
00:21
2026年2月2日,中国铁路总公司科学研究院专家在公开场合详细披露了12306反刷票系统的强大效能。该系统在春运这一购票高峰期,凭借其先进的智能化技术,实现了对异常访问的毫秒级实时甄别。通过综合分析访问频率、用户操作行为、设备特征等多元数据维度,系统能够精准识别并拦截日均高达数千万级别的异常访问行为,有力保障了春运期间旅客购票的公平性和顺畅性。 据悉,123...
00:21
2026年2月3日,西部数据在创新日活动上正式发布了其前瞻性的HDD技术发展路线图,为全球数据中心市场描绘了未来存储技术的清晰蓝图。公司透露,计划于2026年下半年率先推出基于ePMR技术的40TB UltraSMR硬盘,目前该产品已进入两家超大规模数据中心客户的认证阶段,标志着其商业化进程已进入关键收尾阶段。 在技术演进方面,西部数据展现了其分阶段推进...
00:21
2026年2月3日,科技爱好者们的期待再添新火苗,三星Galaxy Buds 4与Buds 4 Pro的官方渲染图首次公开亮相。这两款备受瞩目的无线耳机预计将在2月25日,于韩国首尔举行的Galaxy S26系列发布会上正式揭面,为市场注入全新活力。 Buds 4的全新设计理念令人耳目一新,它摒弃了传统硅胶耳塞,转而采用更为轻盈舒适的开放式结构,这一变革...

2026年02月03日

23:21
2026年2月3日,美国医疗器械巨头美敦力公司宣布将以5.85亿美元收购以色列心血管影像分析技术公司CathWorks。此次收购发生于美国明尼阿波利斯总部决策、交易标的位于以色列特拉维夫。美敦力旨在强化其在冠状动脉功能学评估领域的数字化解决方案能力,整合CathWorks的FFRct(无导丝血流储备分数)平台。交易预计将于2026年内完成,尚需通过常规监管...
23:21
2月3日,上海证券交易所针对良品铺子控股股东收到法院执行通知书的事件,正式向公司及相关方发出监管工作函。此次监管函的发出,不仅涉及上市公司本身,还涵盖了董事、高级管理人员、控股股东以及实际控制人等多方主体。这一举措的核心目的在于,督促良品铺子能够及时、准确地披露相关风险信息,并详细阐述执行事项可能对公司的控制权稳定性、日常生产经营活动以及整体财务状况产生的具...
23:21
2026年2月3日,Xbox官方公布当月Game Pass游戏库更新计划。《最终幻想II》《如龙8外传:Pirates in Hawaii》于当日上线;《麦登橄榄球26》《汪汪队立大功》等10款新作将于2月5日至17日分批加入,涵盖云、主机、PC及掌机平台。国产游戏《星砂岛》与《天国:拯救》均定于2月12日—13日上线。此外,《怪物火车2》已上线,《麦登橄...
23:21
2026年2月3日,全球知名游戏开发商动视暴雪正式宣布,将在备受期待的《使命召唤:黑色行动7》第二赛季更新中全面启用新一代反作弊机制。这一重大举措旨在严厉打击游戏中日益猖獗的作弊行为,特别是针对XIM、Cronus Zen及ReaSnow S1等第三方硬件设备。这些设备通过非法篡改输入信号,使键鼠玩家能够伪装成手柄操作,从而获得辅助瞄准等不公平优势,严重破坏...
22:50
2月1日,由江西江新造船有限公司在江西湖口县建造的740TEU纯电动敞口集装箱船“宁远电鲲”号解缆离厂,开启海试。该船总长127.8米,配置10个箱式电池及光伏系统,支持高压岸电充电与快速换电,实现营运及靠泊全程零排放。海试涵盖电池供电、推进负荷、船体性能及自主航行等项目,预计2月6日抵上海试航区,2月13日结束。该船为全球规模最大、国内首制万吨级纯电动智...
22:21
微新创想2月3日消息,近日,豆包输入法iOS版迎来了更新,让打字这件事变得前所未有的顺滑。现在用户只需长按空格键,就能唤起全新的语音面板,并支持一键发送功能。这一改动极大缩短了沟通路径,在开车、走路等不便打字的场景下,语音转文字的连贯性得到了质的飞跃。同时,针对复杂的网络环境,豆包也优化了异常状态下的语音输入稳定性,断网或信号差...
22:20
2026年1月28日,一场针对科技巨头戴尔的重大法律诉讼在美国德克萨斯州联邦法院正式拉开帷幕。五名前戴尔员工作为原告,共同提起集体诉讼,指控戴尔公司未能履行其作为401(k)计划受托人的信托责任,导致该计划约6.3万名参与者遭受高达3.18亿美元的巨额损失。 原告在诉讼中详细指出,戴尔长期保留了一系列表现远逊于市场基准的内部基金,包括混合目标日期组合基金...
22:20
2026年2月3日,北京冕巢航天科技有限公司成功完成2000N液氧乙醇挤压循环轴塞式试验型发动机静态热试车。该发动机采用一体化3D打印制造,整机仅含2个集成部件,具备高结构集成度与优异热管理性能;轴塞采用再生冷却设计,点火系统为自研可复用火炬式多向同步点火装置。试验各项指标达预期,仿真与实测数据吻合,验证了技术方案可行性,为可复用火箭末级工程化奠定关键基础...