在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月17日

12:21
微新创想:2026年2月,北京砹尔法纽克莱科技有限公司宣布完成数千万人民币A+轮融资,由海创汇、方正多策、源创多盈及沿海基金共同投资。此次融资标志着公司在核素药研发领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 微新创想:该公司专注诊疗一体化核素药研发,以阿尔法核素生产与标记技术为核心,致力于为多种癌症提供精准的诊断与治疗方案。目前,公司聚焦肝癌、肺...
12:21
微新创想:2026年2月,电动出行产品研发商派电科技宣布完成数亿元人民币战略融资,由邛崃轻电领投。此次融资标志着公司在智能电动出行领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 公司总部位于中国,专注于智能电动出行产品的研发与创新,同时致力于OMO智慧出行场景的构建。通过技术与场景的深度融合,派电科技不断推动电动出行方式的智能化与便捷化,引领行业发展...
12:21
微新创想:2026年2月17日 网友在社交平台上晒出《流浪地球3》万达影城春节档独家贴片预告 引起广泛关注 该预告片中 沈腾饰演的角色身着制服 持枪戴镜 在标有“171A”的场景中 因突发强光惊恐倒地 的画面极具冲击力 影片相关负责人已确认 这一片段为真实物料 并非剪辑或合成内容 该预告片由万达电影官方发布 同时也得到了《流浪地球》系列电影制作团队的认可 《...
12:21
微新创想:2026年2月17日,宇树科技创始人王兴兴在公开采访中透露,公司今年人形机器人目标出货量为1至2万台。这一数据表明宇树科技在人形机器人领域正加速推进商业化进程。 其参演的G1与H2机型首次展示全自主集群控制技术,实现全球首例集群快速跑位,最高速度达4m/s。这项技术的突破标志着人形机器人在多机协作与智能调度方面迈出了重要一步。 王兴兴预计全球人形机...
12:21
微新创想:近日网络上兴起一个新梗AI;DR,用来标记低质量的AI生成内容,提醒他人无需浪费时间阅读。这个词汇源自传统的TL;DR(太长不看),现在被广泛应用于Threads、Bluesky等社交平台。随着2025年《韦氏词典》年度词“slop”(烂货)的公布,可以看出公众对于AI内容泛滥的不满情绪正在加剧,AI;DR也因此迅速走红。 微新创想:AI;DR的流...
12:09
微新创想:新年第一天苹果CEO库克发布拜年视频 马年快乐Happy Year of the Horse 苹果CEO库克在新年第一天通过视频向全球用户送上祝福,用“马年大吉”点燃了网友的热情。视频发布后,社交媒体上迅速掀起热议,许多用户纷纷留言表达对苹果的祝福与期待。库克的拜年视频不仅传递了节日气氛,也为即将到来的苹果新品发布会增添了更多关注。 除夕当天苹果公...
12:09
微新创想:特斯拉在奥斯汀推出的Robotaxi无人出租车服务自八个月前启动以来,其运营数据尚未达到马斯克此前的承诺。根据最新报告,该服务在奥斯汀地区的可用率仅为19%。这意味着在大部分时间里,车辆无法正常提供服务,影响了用户体验和实际应用效果。 马斯克曾公开表示,计划在2025年底前向奥斯汀投放500辆Robotaxi。然而,据Robotaxi Tracke...
12:09
微新创想:三星Exynos 2600将在本月正式开始商用并由自家的Galaxy S26系列首发搭载 这颗芯片基于三星最先进的2nm GAA工艺制程打造不仅标志着三星在半导体制造领域的反扑也使其成为了全球首款正式投入商用的2nm手机芯片 目前Exynos 2600的详细参数已经提前揭晓其内部代号为S5e9965在架构设计上它沿用了极具特色的10核心方案包含1颗...
12:09
微新创想:苹果在今年的iPhone 18 Pro系列以及折叠屏iPhone Fold上将继续推进无卡化的硬件战略 通过在更多市场推广eSIM技术 苹果试图进一步挤出内部空间 从而容纳更大容量的电池 提升整体续航表现 目前苹果已经在北美 日本及沙特等市场彻底告别了实体卡槽 接下来的欧洲市场也将步入eSIM时代 不过考虑到实际情况 国行版机型大概率仍会保留实体S...
12:09
微新创想:近日开源AI智能体OpenClaw创始人斯坦伯格在一次访谈中公开断言未来80%的APP将会消失而个人AI智能体将成为取代这类应用的核心力量 斯坦伯格表示当下多数APP的本质只是承担数据管理与搬运的中间商角色并非用户的核心需求用户真正需要的是应用最终提供的结果而非打开应用的繁琐操作 他认为若一款APP的核心功能能用一句话概括便大概率会被AI替代单位换...
12:09
微新创想:知名苹果爆料人Mark Gurman近日透露,即将发布的iPhone 18 Pro和iPhone 18 Pro Max可能不会有显著的外观或功能升级,这或许会让部分期待已久的果粉感到失望。不过,他指出,这两款机型仍然会带来一些值得关注的技术改进。 虽然整体更新幅度不大,但iPhone 18 Pro系列仍有一些重要变化。其中,灵动岛的设计将有所调整,...
12:08
微新创想 中央广播电视总台《2026年春节联欢晚会》上 银河通用现身贺岁微电影《我最难忘的今宵》 在微电影中 银河通用的机器人演示了叠衣服 语音交互 捡拾垃圾 抓取商品等多项实用技能 并和沈腾 马丽等演员有互动 早在2026年1月25日 中央广播电视总台已正式官宣银河通用机器人成为2026年春晚指定具身大模型机器人 此次登台是其技术能力的公开落地展示 通...