在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年03月16日

13:14
微新创想:2026年3月16日,J.S. Held公司正式发布AI争议监测器(AI Disputes Monitor) 该工具面向全球法律专业人士,实时追踪人工智能相关诉讼案件 覆盖技术类型、行业细分及司法辖区,为用户提供全面的法律风险信息 数据源自公开第三方渠道,并经J.S. Held专家团队分析整合 旨在为诉讼律师提供动态、可操作的AI法律风险情报 通过...
13:14
微新创想:3月15日,全球首个藏语大语言模型DeepZang在西藏拉萨正式发布。该模型由西藏觉罗数字产业管理有限公司自主研发,是我国首个完成国家生成式AI算法与模型备案的藏语大模型,填补了全球技术空白。 模型支持藏、中、英三语智能交互,具备AI对话、实时翻译和语音转写功能,已积累国家标准藏语平行语料近7000万条及三大方言语音语料超30500小时。这标志着藏...
13:14
微新创想:丘钛科技于3月16日公布了2025年的业绩数据,显示公司全年实现营业收入208.8亿元人民币,超过了市场预期的201.4亿元。这一成绩充分体现了公司在行业中的稳步发展和市场认可度的不断提升。 净利润方面,丘钛科技达到了14.9亿元人民币,远高于此前预测的11.3亿元。这一显著增长不仅反映了公司的盈利能力增强,也展示了其在成本控制和运营效率方面的优化...
13:14
微新创想:3月16日,上海AWE展会期间,奇点图谱总裁李晓通与追觅科技创始人俞浩在展台进行了深入交流。此次会面不仅展现了双方在智能科技领域的共同愿景,也标志着奇点图谱在构建未来算力网络方面迈出了坚实一步。 奇点图谱宣布将按照每季度发射一颗卫星的节奏,推进天地一体化算力网络的建设。这一计划突破了传统卫星通信的局限,采用自研通讯模块实现“手机直连算力”的创新技术...
12:42
微新创想:Meta公司宣布自2026年5月8日起Instagram将停止支持端到端加密消息功能 这一消息一经公布便引发了广泛关注和讨论。Instagram作为全球用户量庞大的社交媒体平台之一,其隐私保护措施一直是用户关心的重点。此次调整意味着用户在使用Instagram发送消息时将不再享受端到端加密带来的安全保障。端到端加密技术能够确保只有消息的发送者和接收...
12:42
微新创想:美国联邦调查局(FBI)于3月13日(上周五)启动对一名黑客的刑事调查 该黑客涉嫌两年内在Steam平台发布《BlockBlasters》《Chemia》等7款嵌入恶意程序的游戏 事件发生地为全球Steam用户覆盖区域 受害者为下载安装上述游戏的玩家 FBI称这些游戏系‘特洛伊木马’诱饵 旨在植入恶意软件 Steam已将涉事游戏全部下架 但此前已有...
12:42
微新创想:英矽智能计划于2026年3月30日北京时间发布2025年度业绩报告并同步召开线上业绩会议。此次会议将采用中英文双语形式,面向全球投资者和媒体开放。公司希望通过此次会议全面展示其在研发领域的最新成果以及业务发展的重要进展。同时,英矽智能也将公布其商业化策略,为市场提供更清晰的业务方向和未来规划。 此次业绩发布不仅有助于提升公司信息透明度,也将为投...
12:42
微新创想:2026年3月16日,美国加州纽瓦克,Lucid Group宣布全面财务与产品战略。公司计划推出Midsize平台及新一代Atlas电动驱动单元,进一步拓展其在电动汽车市场的布局。同时,Lucid还预览了车载AI助手与自动驾驶技术的发展路线图,为未来智能化出行提供坚实基础。 Lucid正与Uber敲定协议,拟大规模部署基于Midsize平台的自动驾...
12:42
微新创想:3月9日,澳门某商业区的一条街道上,一名女子在通话时被后方突然靠近的自主行走测试机器人惊吓,随即高声呵斥,引发周围群众的关注。该事件发生在澳门繁忙的商业地段,涉事机器人由一名50余岁的本地男子拥有,正在用于店铺宣传的测试用途。据现场描述,机器人并未与女子发生任何肢体接触,女子在送医检查后已确认无碍并出院,警方也未对事件进行进一步追责。 治安警人员在...
12:42
微新创想:据渠道消息,三星显示(SDC)计划于2027年量产第四代QD-OLED显示器面板。这一新产品的推出标志着三星在显示技术领域迈出了重要一步,不仅延续了其在OLED技术上的领先地位,还进一步拓展了QD-OLED的应用范围。 新面板将采用第四代电致发光(EL)材料,相较于前几代产品,这种材料在发光效率和色彩表现上都有显著提升。同时,三星显示还引入了QD ...
12:42
微新创想:最近“3·15晚会该曝光我妈”成了网络上的热门话题 这背后反映的是不少家庭里爸妈冰箱的“特殊状况” 随着3·15国际消费者权益日越来越近 一场关于“冰箱安全”的大讨论在社交平台上热闹起来了 好多网友都在喊话 “快来查查我家冰箱” 不少网友都在网上晒出了自家爸妈冰箱的照片 那场面真是让人惊叹 有网友在丈母娘的冰箱里发现了23年摘的槐花 放了好几年的香...
12:42
微新创想:3月13日,河南郑州一对携手走过54年婚姻岁月的老夫妻,凭借他们独特的相处模式在网络上引发了大家的关注。这对老夫妻结婚这么多年,一直坚持同床共枕,从未分过床睡。 爷爷回忆起这么多年的婚姻生活,满脸幸福地说道:“我们结婚都54年啦,从来没有分床睡过。我老伴儿打呼噜声音可大了,晚上那呼噜声,有时候都能把我吵醒。”说到这儿,爷爷嘴角上扬,眼神里满是宠溺。...