在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年03月28日

03:36
微新创想:2026年3月28日 据多方消息 谷歌正接近达成协议 将为人工智能公司Anthropic的数据中心建设提供融资支持 事件发生于美国 涉事方为谷歌与Anthropic 此举旨在强化双方在AI基础设施领域的合作 提升大模型训练与推理所需的算力保障 融资将专项用于Anthropic新建或扩建数据中心 具体金额与条款尚未披露 该合作凸显科技巨头对AI底层硬...
02:05
微新创想:3月28日 教育部和国家语委正式发布了《机器合成普通话水平测评等级标准及测评大纲》以及《人工智能 语料库 基础术语》两项重要规范。这两项新标准的出台标志着我国在人工智能与语言文字标准化领域迈出了坚实的一步。 《机器合成普通话水平测评等级标准及测评大纲》明确了机器合成语音在普通话水平测评中的分级标准和具体测评方法。该标准不仅适用于语音合成技术的研发工...
00:58
微新创想:2026年3月,天岳先进(688234.SH)与四家合作方签署碳化硅产业链战略合作框架协议。此次合作旨在推动新能源汽车、半导体、先进制造及产业投资等关键领域的协同发展。各方将共同推进8英寸碳化硅芯片生产线项目的建设与实施,进一步强化在碳化硅材料领域的布局。 该协议属于框架性安排,不涉及具体交易金额,也不需要经过董事会或股东大会的审议程序。因此,预计...

2026年03月27日

23:49
微新创想:任天堂近期公布了多项重磅游戏计划,引发玩家广泛关注。据消息人士Nate the Hate在2026年3月27日透露,任天堂将在今年夏季推出全新3D动作游戏《星际火狐》。这款游戏将回归经典玩法,同时支持线上多人模式,为玩家带来更加丰富的互动体验。 任天堂还计划在同年假期档前后推出《塞尔达传说:时之笛》的重制版。这一版本将作为纪念该系列诞生40周年的特...
23:49
微新创想:2026年3月26日 微软向Windows 11推送了KB5079391预览更新 该更新旨在修复自2025年5月28日KB5058499版本起存在的WUSA路径错误问题 该问题主要影响企业环境 表现为管理员在通过网络共享安装多个.msu文件时 触发ERROR_BAD_PATHNAME错误 这一错误可能导致更新安装失败 从而影响系统的正常运行 微软此...
23:49
微新创想:俄罗斯国家航天集团副总裁谢尔盖·克里卡列夫于3月27日宣布,俄新一代载人飞船将在2028年实现首次飞行。这一消息标志着俄罗斯在载人航天领域迈出了重要一步。目前,该飞船已完成静态与动态测试,正在推进降落伞系统的飞行测试以及前往俄罗斯轨道服务站的相关准备。 新一代载人飞船的设计目标是承担地月等深空任务,而非取代现役的“联盟”飞船。这意味着俄罗斯将拓展其...
23:18
微新创想:苹果公司近日向使用iOS 13至iOS 17.2.1等旧版本系统的iPhone和iPad用户推送了一条关于锁屏安全的重要通知 该通知通过“设置”应用向用户发出,提醒他们注意潜在的安全威胁。苹果指出,黑客正在利用某些漏洞进行网页攻击,这些攻击可能造成用户数据被窃取的风险 苹果已于3月11日发布了多个系统更新,包括iOS 15.8.7和iOS 16.7...
23:18
微新创想:3月27日,智利国家铜业公司(Codelco)首席执行官在圣地亚哥举行的公开会议上表示,全球铜需求依然保持稳定,这将为铜价和市场提供有力支撑。此次表态聚焦于全球最大国有铜企对当前市场的看法,显示出公司对未来走势的积极预期。面对近期市场对铜供应过剩以及需求放缓的担忧,Codelco的发言被视作一种市场信心的传递。虽然公司并未公布具体的数据支持这一观点...
23:18
微新创想:2026年3月27日,广汽集团发布2025年年报。全年营业总收入达到965.42亿元,同比下降10.43%。归母净利润出现亏损,金额为87.84亿元,同比下滑1166.51%。公司表示,这一业绩变化主要受到国内汽车市场竞争加剧以及投资收益减少的影响。 与此同时,广汽集团在国际化方面取得了显著进展。自主品牌海外终端销量同比增长48%,业务覆盖国家数量...
23:18
微新创想:3月27日,亿纬锂能发布公告,宣布拟与惠州仲恺高新区管委会签署协议,投资约60亿元建设一个60GWh的储能(动力)电池生产项目。项目选址位于惠州,预计用地面积约为500亩。目前,该项目仍需提交至公司股东大会进行审议,且不构成关联交易或重大资产重组的情形。 此次投资计划的核心目标在于进一步扩大公司产能,优化现有产业结构,以增强在新能源领域的竞争力。随...
23:18
微新创想:3月27日,TCL科技发布2025年年度报告 公司全年营收达到1840.6亿元,同比增长11.7% 归母净利润为45.2亿元,同比增长188.8% 经营现金流为440.2亿元,同比增长49.1% 资产负债率降至64.2%,显示出公司财务结构的优化 现金及等价物达到505.7亿元,为公司稳健运营提供了坚实基础 旗下TCL华星实现营收1052.4亿元,...
23:18
微新创想:艾利和于3月27日正式推出AK Cradle扩展底座,这款新品专为SP4000、PD10、PD20等便携播放器设计,旨在提升用户的音频体验与设备使用便利性。AK Cradle不仅具备充电功能,还能够扩展音频系统,满足更多专业或高端音频需求。 该底座配备双Neutrik XLR输出接口,为用户提供了更稳定的信号传输方式,适用于监听耳机、专业音响设备等...