在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年01月27日

23:41
2026年1月23日凌晨1时34分,Myethos合作制造工厂遭遇一起人为纵火事件,导致部分当月计划出货的产品受损。经过初步调查,涉事人员为合作劳务公司派遣的临时搬运工,幸运的是,此次事件未造成任何人员伤亡。目前,相关案件已正式移交至公安机关进行深入调查。 此次意外事件对Myethos的生产计划造成了直接影响,特别是备受期待的「阮·梅镜中故我 Ver.」等四...
23:41
1月27日,美股光通信板块迎来强劲反弹,整体呈现普涨态势。在纽约证券交易所交易时段,行业龙头康宁股价暴涨超13%,其背后主要得益于媒体报道其与Meta达成一项价值高达60亿美元的长期光通信器件供货协议。受此利好刺激,Lumentum股价同样劲升近9%,Coherent也录得涨幅超6%的佳绩。此次板块集体上涨,不仅反映出头部科技企业对高速光互联基础设施建设的加...
23:41
1月27日,备受瞩目的零食连锁品牌鸣鸣很忙正式揭开港股上市序幕,其香港公开发售环节更是创下惊人纪录,认购倍数高达1899.49倍,足见市场热忱。这家深耕下沉市场的零食巨头计划在近期敲定发行价格并正式登陆港股,此次IPO由中金公司和中信证券联合担任主承销商,彰显了其强大的资本运作能力。据悉,鸣鸣很忙此次IPO拟全球发售约1.2亿股股份,其中约10%将面向香港公...
23:41
2026年1月27日,全球知名的图片分享平台Pinterest正式宣布实施大规模裁员计划,将全球员工数量削减15%,涉及约700名员工。根据公司公告,此次裁员预计将于2026年9月底前全面完成。此次重组的核心目标在于显著降低运营成本,并将有限的资源更加集中地投入到以人工智能(AI)为核心驱动的产品研发中。Pinterest特别强调,通过开源AI模型的应用,不...
23:41
2026年1月,亚马逊宣布就2023年引发的集体诉讼达成一项历史性拟议和解协议,涉及金额高达10亿美元以上。这起诉讼的核心指控是亚马逊在处理消费者退款和扣款事宜时存在严重疏漏,未能及时执行退款指令或导致重复扣款,从而系统性地侵犯了广大消费者的合法权益。根据双方达成的和解方案,亚马逊将向受影响的消费者支付6亿美元现金退款,并额外提供3.095亿美元作为惩罚性赔...
23:41
2026年1月19日,南昌三瑞智能科技股份有限公司正式宣布其创业板IPO注册申请获得正式批准并生效。这家成立于2009年10月的高新技术企业,专注于无人机与机器人电动动力系统的研发、生产及销售,并前瞻性地布局了eVTOL(电动垂直起降飞行器)动力系统领域。凭借卓越的技术实力和市场表现,三瑞智能在2024年全球民用无人机电动动力系统(不含电池)市场占有率中排名...
23:41
1月27日,东方电气集团旗下东方重机承制的全球功率最高的溶液型医用同位素试验堆反应堆容器从广东成功发运。这一重大装备由中核动力院负责设计采购,最终将落户四川夹江县,预计在2027年正式建成投产。作为医用同位素试验堆的核心装置,该设备的投运将极大提升我国医用同位素的自主生产能力,预计年产量可达钼-99 10万居里、碘-131 2万居里,从而有效缓解我国长期依赖...
23:41
2026年1月27日,中国黄金行业领军企业紫金矿业旗下紫金黄金国际正式宣布了一项重大战略投资计划,将以每股44加元的现金报价,全面收购加拿大知名矿业公司Allied Gold的全部普通股,此次交易的总对价高达55亿加元,折合人民币约280亿元。这一举措标志着紫金黄金国际在海外黄金资源布局上的又一重要突破,为其持续巩固全球黄金产业领先地位奠定了坚实基础。 Al...
23:41
2026年1月27日,音频巨头森海塞尔正式发布了旗下全新升级系列——CX 80U入耳式耳机与HD 400U头戴式耳机,分别作为CX 80S和HD 400S的继任者,为用户带来更出色的听觉体验。这两款产品均采用了当下主流的USB Type-C接口设计,支持高达24bit/96kHz的高解析音频输出,完美兼容各类主流智能手机、平板电脑、掌机以及PC设备,为用户打...
23:41
2026年1月,Windows 11桌面系统的市场份额遭遇显著下滑,跌至50.73%的阶段性低点,较2025年10月创下的峰值回落了超过4.4个百分点。与此同时,Windows 10的份额逆势上涨,攀升至44.68%。这一市场转折点恰逢Windows 10官方支持于2025年10月14日正式终止之后,叠加2026年1月因“补丁星期二”引发的严重系统故障,以及...
23:41
2026年1月26日,谷歌Project Zero安全团队向全球揭示了WhatsApp安卓版的一项重大安全漏洞,引发广泛关注。该漏洞允许攻击者通过精心设计的恶意操作,实现对用户的远程攻击,而无需任何用户交互。攻击者首先创建一个WhatsApp群组,然后将受害者及其联系人添加为群组成员,并刻意将受害者设为群组管理员。随后,攻击者发送一个看似无害的恶意文件,一旦...
23:41
2026年1月27日,苹果公司正式向多款旧款iPhone及蜂窝版Apple Watch推送iOS 26.2.1、iOS 18.7.2等关键系统更新。此次升级的核心目标在于彻底修复iPhone 12及更早机型在澳大利亚地区无法拨打紧急电话"000"的历史性故障。该问题源于去年12月当地网络出现的异常状况,如今通过新系统补丁得以全面解决。值得注意的是,此次更新甚...