在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月20日

11:29
2026年2月,中国信息通信研究院正式发布《制造业数字化转型发展报告(2025年)》。报告基于工信部制造业数字化转型综合信息服务平台数据,分析全国规上工业企业数字化转型总体水平。截至2025年12月,开展数字化改造企业占比达89.6%,数字化设备普及率57.7%。报告指出,我国制造业数字化已进入规模化普及阶段,并正向智能化、绿色化、韧性化纵深发展。报告强调...
11:29
2026年2月,网络安全公司ESET发现安卓平台首款运行时集成生成式AI的恶意软件PromptSpy。该软件于2月上传至VirusTotal,此前其雏形VNCSpy已于1月出现。PromptSpy调用谷歌Gemini模型,实时分析设备屏幕XML数据并获取操作指令,利用无障碍服务锁定自身以实现持久化。其内置VNC模块可远程控制设备,窃取PIN码、解锁图案、屏...
11:29
微软宣布,自2026年3月31日起,将在桌面端、移动端及Web端全面停用Outlook“联系人屏蔽”(Contact Masking)功能。该功能允许用户点击自动建议列表中联系人旁的“X”号以隐藏其后续推荐,但因操作后果超出预期(同步影响Teams、M365搜索等全生态),引发大量用户困惑与投诉。微软明确表示不提供替代方案,所有此前屏蔽的联系人将于4月起恢...
11:29
微新创想:2月18日至19日(大年初二至初三)全国民航出行迎来节中高峰。同程旅行数据显示该时段民航出行热度较2025年春节同期提升38%。整个春节九天假期中乘坐民航2次及以上出行的旅客数量同比增幅超50%。数据显示出行需求呈现显著增长趋势。 微新创想:随着‘分段式过年’逐渐成为主流趋势,越来越多的旅客选择在假期中进行多段行程安排。这种出行方式不仅满足了探亲需...
11:29
微新创想:2026年2月20日,皮克斯正式发布《玩具总动员5》预告片。影片定于2026年6月19日在北美上映,暑期全球公映。故事聚焦智能平板Lilypad(由Greta Lee配音)入侵童年生活,胡迪、巴斯光年等经典玩具面临新挑战。该片探讨科技迭代下陪伴意义的变迁,延续系列情感内核。制作方未透露中国内地具体上映日期。
11:29
微新创想:2025年12月TCL以10%的同比增幅首次超越三星成为全球电视出货量第一品牌 TCL在全球电视市场的表现持续亮眼 TCL在2025年12月实现了显著的市场突破 市场增长推动TCL登顶全球电视出货量榜首 三星虽保持增长但市占率有所下降 三星在当月的出货量同比增长8% 但西欧和中东非市场出现大幅下滑 TCL的市场份额稳步提升 Counterpoint...
11:29
微新创想:2026年2月19日,微软面向macOS预览体验成员推送OneDrive Build 26.017更新 本次更新全面重构用户界面,采用macOS原生对话框与液态玻璃设计语言,带来更符合macOS系统的视觉体验 基于SwiftUI构建全新“活动中心”,使OneDrive在macOS上的交互更加流畅和直观 新功能支持媒体缩略图预览,用户可以直接在文件列...
10:44
微新创想:2026年2月19日,微软宣布正在内部测试一项新功能,即将在Windows 11的记事本中加入图片插入功能。这一功能已经在预览版中有所体现,用户可以在工具栏中看到新增的“图片按钮”。该更新标志着微软对传统文本编辑工具的持续优化,旨在弥补WordPad被移除后所留下的轻量级富文本编辑空白。 微新创想:记事本作为Windows系统中一款历史悠久的文本编...
10:44
微新创想:2026年2月20日 特斯拉官网宣布 其电动皮卡Cybertruck Cyberbeast版本在美国市场售价由11.499万美元下调至9.999万美元 此次调价即日起生效 面向全美消费者 降价幅度达1.5万美元 约合人民币10.7万元 特斯拉未公开说明具体原因 但业内分析认为此举旨在提升该高配车型的市场竞争力 加速交付节奏 Cyberbeast为C...
10:44
微新创想:2月20日至21日,我国中东部地区受到一股强冷空气的影响,天气将出现明显变化。内蒙古东部和东北地区预计将有显著降雪,局部地区甚至可能出现暴雪天气。与此同时,华北和西北地区则会伴随6到8级的大风及沙尘天气,给当地居民的生活带来不便。 此次冷空气活动导致气温迅速下降,部分地区在48小时内气温降幅超过12℃。这种急剧的降温使得原本偏暖的天气迅速转为显著偏...
10:44
微新创想:2026年2月20日,微软在美国正式启动新一轮AI PC营销活动,将今年定义为“AI PC爆发元年”。此次营销活动以Windows 11 AI+ PC为核心,全面展示其在人工智能领域的最新成果。微软希望通过这一系列举措,推动AI技术在个人电脑上的广泛应用,为用户提供更加智能和高效的使用体验。 活动重点聚焦于两项核心技术功能,分别是Recall屏幕快...
10:01
微新创想:2026年2月20日,光荣特库摩宣布《仁王3》全球销量突破100万套,系列累计销量达1000万套。这一成绩标志着《仁王》系列在全球范围内持续受到玩家喜爱。《仁王3》于2月6日正式登陆PS5与PC平台,Steam国区标准版售价为348元。游戏延续了前作的高水准制作,采用开放地图设计,让玩家能够自由探索广阔的世界。同时,游戏融合了武士与忍者双战斗体系,...