在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2025年12月09日

14:07
深圳手机壳产业的崛起:CASETiFY引领Z世代消费新风尚 声明:本文来自于微信公众号 锌刻度,作者:李觐麟,授权站长之家转载发布。深圳作为手机壳生产销售的重镇,截至今年11月底已聚集4000余家相关企业,占据全国市场47.7%的份额,其中1300多家企业拥有自主专利。这个看似微小的手机配件市场,正以惊人的速度焕发着商业活力。被称为"手机壳界爱马仕"的CAS...
14:07
品牌焕新后的阿里AI助手“千问”,以惊人的速度进入产品升级周,在短短一周内连续推出三次重大迭代,分别针对办公、学习和视频创作领域进行全新升级。这一系列密集的更新,清晰地展现了大厂中“创业公司”的敏捷节奏——快速响应、持续迭代、全力以赴。千问团队表示:“千问开源大模型已具备一定领先优势,接下来的重点是如何将技术落地到工作、学习、生活的具体应用中,满足用户在各个...
14:05
2025年12月8日,备受瞩目的雷神(THUNDEROBOT)黑武士猎刃PRO电竞主机震撼问世,为游戏玩家带来前所未有的性能盛宴。这款旗舰级电竞利器搭载了海光C86旗舰处理器,其16核心32线程的强大架构配合高达3.0GHz的主频,让游戏运行如行云流水。32MB L3缓存与95W TDP的优化设计,不仅确保了极致性能的释放,更在散热方面实现了完美平衡,为玩家...
14:05
2025年12月8日,江苏耀坤液压股份有限公司传来重大喜讯,其IPO审核状态正式变更为"提交注册",标志着这家专注于液压元件及零部件研发生产的优秀企业,即将叩响深圳证券交易所主板的大门。作为国内液压行业的重要力量,耀坤液压的核心产品油箱和硬管在市场上表现卓越,市场占有率稳居国内前三甲,展现出强大的品牌影响力和行业竞争力。 本次IPO计划发行新股不超过2814...
14:05
索尼影业虚拟现实部门与巴西知名工作室Arvore正式宣布,即将推出备受瞩目的《黑袍纠察队》官方VR衍生游戏——《黑袍纠察队:触发警告》,这款充满创新体验的游戏预计将于2026年面向全球玩家发售。作为漫威宇宙中极具颠覆性的超级英雄题材作品,本作将首次将玩家带入沉浸式的虚拟现实世界,通过原剧演员倾情加盟的配音阵容,还原电影中令人印象深刻的角色魅力,为玩家带来前所...
14:05
美国内华达州拉斯维加斯,2025年12月8日,通用处理器企业Tachyum正式对外宣布已采取法律行动,要求科技巨头谷歌在人工智能领域停止使用"TPU"这一缩写。此举标志着两家企业在AI硬件领域的竞争进入白热化阶段,也引发了业界对商标权与品牌识别的广泛关注。 Tachyum公司强调,其于2015年便开始申请"TPU"商标,并于2020年成功获得美国专利商标局注...
14:02
在香港中文大学近日举办的 ATEC2025 线下挑战赛上,一场机器人技术的巅峰对决震撼上演。在这场备受瞩目的赛事中,众多机器人在无需遥控的情况下,首次直面户外极限任务的严苛考验,其惊艳表现远超预期。来自全球各大高校的顶尖机器人团队齐聚一堂,通过自主研发的智能技术,让机器狗在拱桥上灵活穿梭、在山地中勇攀高峰、精准浇灌花草以及高效完成垃圾分类,全方位展现了人工智...
13:34
2025年12月9日,领翼智造宣布完成天使轮融资,投资方为啟赋资本。公司专注于eVTOL(电动垂直起降飞行器)碳纤维复合材料关键部件的研发与制造,本轮融资将用于技术研发、产线建设及团队扩充。此次融资有助于加快其在电动航空领域的产业化布局。
13:34
2025年12月9日,“交管12123”鸿蒙版App推送3.4.2版本,新增在用车选号功能,并完成核心功能全量开发,业务中心所有功能已全面开通。此次更新覆盖全部交管业务,未收到推送的用户可手动搜索更新。该App于2025年3月19日上线,已服务超5.9亿注册用户,日均办理业务超400万笔。
13:34
日本DNP公司近日传来重大突破性消息,成功研发出全球首款线宽仅10纳米的NIL纳米压印图案化模板,这一技术突破将有力支持1.4纳米级逻辑半导体及NAND闪存等尖端芯片制造。作为纳米压印技术的领军企业,DNP凭借超20年的深厚研发积淀,创新性地采用了SADP"套刻"工艺方案,通过将光掩模技术与晶圆制造工艺进行完美融合,实现了线条密度的大幅翻倍,为半导体行业带来...
13:34
2025年12月9日,知名投资机构派珀·桑德勒公司正式宣布将百事公司的目标价从161美元上调至172美元,这一举措标志着市场对该饮料巨头未来发展的信心显著增强。据该机构分析团队透露,此次上调主要基于对百事近期业务表现和长期增长潜力的全面评估。分析师们通过对公司基本面、市场竞争格局以及财务预测数据的深入分析,认为百事在健康饮品领域的战略布局和品牌创新正逐步转化...
13:34
12月9日,承载着来自意大利米兰的时尚服饰,一架格鲁吉亚航空的货机顺利降落在海口美兰国际机场。随着货物完成关键的“换单”操作,并顺利换装海南航空的航班,这批服装最终飞往中国香港。这一标志性事件,标志着海南自贸港首单国际中转“换单”业务圆满成功,正式拉开琼港货运深度合作的序幕。 这一创新业务由海南机场集团精心实施,是继今年9月海南机场管理局与香港机场管理局签署...