在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2025年12月12日

14:02
距离2026年1月1日全面禁产含汞体温计不足月余,一场由政策调整引发的市场异动正在上演。原本单价4-8元的水银体温计,在电商平台普遍涨至17-50元,部分稀缺款式溢价超10倍,武汉市民反映的网购价从4元暴涨至33元且断货的现象,已成为全国多地的缩影。这场抢购潮中,甚至出现消费者一次性囤货100支、二手平台单支炒至40元的极端案例...
14:02
近日,一位因“煮蛋”走红的网络博主引发全民关注,其发布的煮蛋教学视频累计播放量突破2亿次,个人账号粉丝量激增350万。这场看似意外的流量爆发,实则是生活美学与短视频时代碰撞的典型案例。据观察,该博主最初仅在社交平台分享日常饮食记录,其中一段“5分钟煮出溏心蛋”的短视频意外走红。画面中,博主用普通蒸锅演示不同火候、水量对鸡蛋口感的...
14:02
近日,山东潍坊青州市发生一起因密闭空间用火引发的一氧化碳中毒事件,所幸一名老员工通过“踢脚”试探及时发现异常,将昏迷的老板从生死边缘拉回。这起充满温情的职场故事经网络传播后,引发公众对冬季安全用火及职场关系的热议。12月9日傍晚,青州某企业老板徐先生在办公室内用炭火盆烤制红薯时,因门窗紧闭导致炭火燃烧不充分,大量一氧化碳在室内积...
14:02
2025年12月12日,索尼Alpha 1全画幅无反相机发布4.00版本固件。本次更新主要新增横竖屏拍摄界面旋转显示、对焦点尺寸XS/XL及自定义选项,支持FTP传输中取消选中照片、回放时显示文件名与文件夹名,并优化连拍响应与操控稳定性。用户需通过存储卡安装,升级前须确保当前版本不低于2.01。部分新功能需配合最新App或付费证书使用,且服务范围受限于地区...
14:02
2025年12月11日,英国信息专员办公室(ICO)宣布对密码管理公司LastPass处以120万英镑罚款,因其在2022年8月至10月间未能采取足够安全措施,导致黑客通过员工家用设备漏洞入侵,窃取约160万英国用户的姓名、邮箱、电话及加密密码库备份。攻击者利用Plex软件漏洞获取高管主密码,绕过多因素认证,最终复制客户数据库。尽管采用“零知识架构”,但弱...
14:02
2025年第三季度全球半导体营收达2163亿美元,首次突破单季2000亿。机构Omdia最新数据显示,该季度环比增长14.5%。基于当前增长趋势,预计2025全年半导体营收将首次站上8000亿美元。此增长得益于市场需求回升及技术升级推动芯片价格与销量双升。
14:01
2025年12月12日,日本东京——一场意义深远的半导体产业合作在东京拉开帷幕,超过20家国内外知名企业宣布将联合投资日本本土半导体制造商Rapidus,共同推动其在先进芯片制造领域的突破性发展。此次大规模投资的核心目标,是加速Rapidus在2纳米及以下制程技术的研发进程,并全力推进其商业化落地,为全球半导体市场注入强劲动力。 据悉,参与此次联合投资的成员...
14:01
2025年,我国粮食生产再创佳绩,全国粮食总产量成功突破14298亿斤大关,较上年实现1.2%的稳步增长。这一显著成就的取得,离不开国家农业政策的持续加码和粮食生产条件的显著改善。国家统计局最新发布的数据显示,此次增产成果覆盖了我国主要粮食产区,小麦、玉米和水稻等核心作物均呈现出稳中有升的良好态势,全面实现稳产增产目标。 粮食丰收不仅为我国国家粮食安全筑起坚...
13:56
美国电动汽车制造商 Rivian 近期传来振奋人心的消息,正式宣布在人工智能领域取得重大突破,成功研发出自主研发的人工智能芯片、新一代车载电脑以及配套的 AI 模型。这一创新举措标志着 Rivian 正式迈出摆脱对英伟达芯片系统依赖的关键一步,未来计划将其全面应用于新车型中,从而显著提升自动驾驶功能的性能与可靠性。备受期待的 R2款 SUV 将成为首款搭载这...
13:31
2025年12月12日,备受全球玩家期待的动作角色扮演游戏《暗黑破坏神4》正式登陆中国服务器,并同步入驻战网平台。这款作为《暗黑破坏神》系列第四部正统续作的重量级作品,以震撼的暗黑风格ARPG体验为核心,采用创新的开放世界设计,为玩家带来前所未有的自由探索与装备收集乐趣。更令人惊喜的是,国服基础版售价仅为128元,刷新了全球市场最低价记录,让更多中国玩家能够...
13:31
2025年12月11日,微软正式在Excel网页版中上线了革命性的“网格内”公式生成工具,这一创新功能深度整合了Copilot的强大AI能力,旨在彻底改变用户处理复杂公式的传统方式。通过引入自然语言交互模式,该工具让非专业用户也能轻松生成和修改复杂的Excel公式,极大地降低了数据处理的门槛。据悉,该功能目前仅对拥有Microsoft 365 Copilot...
13:31
2025年12月12日,中国知名电影娱乐集团万达电影正式宣布完成对智能自拍互动娱乐品牌“拍立方”的战略投资。这一举措标志着万达电影在拓展影院场景互动娱乐体验方面迈出了重要一步,同时也展现了其对于IP衍生与线下消费融合发展的战略布局。 拍立方作为广州方图科技旗下核心品牌,专注于自助影像领域的技术研发与市场运营。该品牌以创新的“大头贴+IP经济”模式为核心,通过...