在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2025年12月04日

01:38
12月3日,微软公司就近期流传的销售目标调整传闻正式作出官方回应。针对部分市场猜测中关于公司可能因业绩压力下调销售人员销售配额或业绩指标的传言,微软方面明确表示目前并未对销售团队考核体系进行任何调整。 此前有消息源指出,由于近期业绩表现未达预期,微软可能对销售团队的目标指标进行重新设定。然而微软在声明中强调,公司始终坚守既定的业务增长战略,并将继续严格执...
00:38
2025年12月4日,科技巨头谷歌母公司Alphabet旗下的自动驾驶出行品牌Waymo正式宣布,其尖端无人驾驶服务已成功拓展至美国东部四座重要城市——巴尔的摩、圣路易斯、匹兹堡和费城。这一战略布局不仅将显著提升上述地区的公共交通便利性,更标志着自动驾驶技术在全球多样化城市环境中的大规模应用验证迈出了关键一步。根据官方介绍,用户可通过Waymo专属应用程序轻...
00:38
2025年11月以来,银行业信贷资产登记流转中心成为不良贷款转让的活跃平台,多家商业银行在此密集挂牌处置资产。据统计,仅此期间已公布超过200条转让公告,其中零售类不良资产占据主导地位,主要涵盖信用卡、消费贷和经营贷等领域。特别引人注目的是,民生银行信用卡中心一笔高达50亿元的不良贷款转让项目,成为此次浪潮中的焦点交易。这一系列动作不仅体现了银行优化资产结构...
00:37
2025年12月3日,东方甄选正式拉开其全国扩张序幕,在北京中关村启动了首家电商旗舰店店长的招募工作,这标志着其雄心勃勃的百家门店计划正式启航。这家位于北京核心商圈的旗舰店占地约400平方米,将创新性地融合“餐饮+零售”的复合业态模式,为消费者提供一站式购物体验。其经营范围涵盖生鲜食品、休闲零食、日用百货等多个品类,同时设有简餐区和咖啡饮品区,满足顾客多样化...
00:37
2025年11月,吉利汽车交出亮眼答卷,单月销量强势突破31万辆大关,不仅连续两个月站稳30万辆以上平台,更创下连续九个月同环比双增长的辉煌纪录。在新能源汽车领域,吉利表现尤为抢眼,当月新能源车销量高达18.8万辆,同比增长率高达53%,推动国内新能源市场渗透率进一步提升至64%。这一成绩也印证了吉利汽车在新能源赛道上的强劲动力,为其全年目标的达成奠定了坚实...

2025年12月03日

23:37
2025年12月3日,汇丰银行发布了一份引人注目的行业分析报告,揭示了生成式AI技术正在为全球多数企业带来切实可见的投资回报。这份报告有力地驳斥了近期流传甚广的“95%机构无回报”的悲观论调,指出这一数据缺乏严谨的实证依据,更像是一种市场恐慌情绪的放大。汇丰银行在报告中特别引用了沃顿-GBK的权威研究数据,该研究显示,高达74%的企业已经在提升生产效率、优化...
23:37
12月3日,华夏航空C909客机在执行喀什至伊宁的G54969航班任务时,迎来了第3000万名旅客,标志着这款机型自2016年6月28日商业首航以来,已累计安全运送旅客突破3000万人次。这一里程碑不仅彰显了C909机型的卓越性能与可靠品质,更体现了华夏航空在新疆地区航空运输领域的深耕细作与卓越贡献。 当日,为了庆祝这一特殊时刻,华夏航空特别向一名31岁的维...
23:37
2025年12月3日,抖音集团副总裁李亮就豆包手机助手被指“越权获取权限”一事公开发声,就公众关切的问题作出权威回应。他明确指出,豆包助手在提供地图导航、语音聊天等核心功能时,确实需要调用位置、麦克风及通讯录等权限,但所有操作均建立在用户明确授权的基础上,不存在任何形式的隐私侵犯行为。李亮强调,用户对于个人信息的掌控权始终得到充分尊重,权限获取流程完全符合用...
23:37
2025年12月3日,北京时间,全球短视频巨头TikTok正式宣布一项雄心勃勃的投资计划,将在巴西塞阿拉州打造其拉丁美洲地区的首个超大规模数据中心。该项目斥资超过2000亿雷亚尔(折合约377亿美元),不仅彰显了TikTok对巴西数字市场的坚定信心,更标志着其在全球数据中心布局战略中的重要一步。 此次数据中心项目将由TikTok携手巴西本地企业Omnia和C...
23:37
2025年12月3日,备受瞩目的七彩虹iGame X870E VULCAN OC V14主板正式登陆官网,为游戏玩家和发烧友带来全新的高性能选择。这款主板严格遵循ATX规格设计,采用先进的18+2+2相110A DrMOS供电系统,确保为锐龙8000系列处理器提供澎湃动力,支持超频性能稳定达到10000+ MT/s的惊人速度。 在内存配置方面,iGame X...
23:37
2025年12月3日深夜,日本全日空航空公司一架执飞NH819航班的波音787-9型客机(注册号JA925A)在从东京成田国际机场起飞后不久,遭遇了左侧发动机的异常振动问题。这一突发状况迫使机组人员迅速启动紧急预案,将航班状态由正常飞行调整为紧急状态。原计划飞往菲律宾马尼拉的这趟国际航班,在确认安全风险后,果断决定折返日本本土,最终于当夜安全降落在东京羽田国...
23:37
2025年12月3日,微软正式发布Windows版Word的重大无障碍功能升级,此次更新专为2511版及以上版本用户量身打造,旨在全面提升视障用户的操作体验。本次升级聚焦于键盘导航与屏幕朗读功能的优化,通过一系列创新设计显著提升了视障用户在批注处理环节的工作效率。 在键盘导航方面,新增Alt+F12快捷键可直接跳转到当前文档的批注列表,智能化的Home/En...