在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月05日

16:00
2月2日,南航物流在春运首日累计保障货邮超4500吨。当日9时33分,首班货机CZ2543从广州白云国际机场起飞,满载近100吨年货及节日礼品。保障范围覆盖全国主要枢纽及电商集中区域,年货、生鲜类货量显著增长。此举旨在应对春节前电商物流高峰,提升航空货运时效与运力供给。
16:00
2026年2月,美国工程车辆自动驾驶技术公司Bedrock完成2.7亿美元新一轮融资,估值升至17.5亿美元。本轮融资由CapitalG和Valor Atreides AI基金领投,8VC及英伟达风投跟投。Bedrock专注于研发软硬件一体化的全自动挖掘系统,为挖掘机等工程机械提供无人操作解决方案。此次融资将用于加速产品规模化部署、扩大工程团队及拓展全球市...
16:00
2026年1月,中国民航局发布的行业标准《危险品航空运输特定要求 大型锂电池测试方法》(MH/T 1086-2026)正式生效。该标准适用于所有拟航空运输的大型动力锂电池,规定了高度模拟、温度循环、振动等10项强制性测试要求。未通过任一测试的电池不得交付航空运输。标准实施旨在提升大型锂电池航空运输的安全水平与保障能力,回应其燃烧爆炸高风险特性。此前,202...
16:00
2026年2月4日,法国AI公司Mistral AI发布Voxtral Transcribe 2系列模型。其中,Voxtral Realtime(4B参数)采用流式架构,支持13种语言(含中文),转录延迟低于200ms,以Apache 2.0许可开源;Voxtral Mini Transcribe V2面向批量处理,单次支持3小时音频,准确率优于GPT-4...
16:00
2月4日,航天科技(SZ000901)公告称,副总经理郭禄鹏因个人原因辞去职务,不再担任公司及控股子公司任何职务。郭禄鹏,1981年5月出生,中央财经大学工商管理硕士,高级工程师、美国注册管理会计师,曾任航天科工海鹰集团市场部副部长等职。2024年其税前报酬为52万元。公司成立于1999年,主营航天应用产品、汽车电子等业务,控股股东为中国航天科工飞航技术研...
16:00
2026年2月4日,追觅科技在苏州奥体中心举办品牌演唱会,创始人兼CEO俞浩称未来几年有望成为世界首富,并就外界质疑作出回应。他指出,当前高生产力时代需摒弃农业社会强调低调的文化惯性,主张拥抱个性、张狂与多元表达。俞浩强调,追觅以“用科技推动人类文明进步”为使命,该选择源于价值观而非单纯利益驱动。目前,追觅已拓展至家电、消费电子、汽车、航空、酒旅等超30个...
16:00
2026年2月5日,德国汉高集团宣布以21亿欧元收购荷兰特种涂料研发商Stahl。Stahl总部位于荷兰韦斯特兰,专注于高性能合成皮革及纺织涂层解决方案,客户覆盖全球汽车、鞋服与家具行业。此次收购旨在强化汉高在可持续柔性材料领域的技术布局与市场竞争力。交易预计于2026年下半年完成,需通过相关监管审批。
16:00
2月5日,胡润研究院发布《2025胡润中国500强》。榜单显示,500强企业总价值达77万亿元,较上年增长21万亿元(38%)。台积电以10.5万亿元价值蝉联第一,腾讯、字节跳动分列第二、第三,价值分别为5.3万亿元和3.4万亿元。小米以1万亿元新晋第八。评选覆盖中国大陆非国有企业,依据企业市值或估值编制。
16:00
据数码博主@数码闲聊站透露,OPPO K14系列计划于2026年4月前后发布。该系列含6.59英寸和6.78英寸两款机型,全系首次搭载主动散热风扇,顶配版本采用天玑9500s处理器。提供12+256GB、12+512GB、16+512GB三种存储组合,配色包括白、灰、粉及锻造碳。OPPO称其为目前唯一中端性能旗舰。因成本过高,暂不提供1TB版本。该机定位性...
16:00
2月3日至4日,第五届“首旅如家杯服务与管理技能大赛”在江苏吴江举办。赛事由如家酒店集团主办,首次通过飞书平台全程直播,采用“主会场主持+实况讲解”形式,覆盖全国员工。比赛涵盖前台接待、客房服务、安全保障及运营管理四大核心岗位,并新增“VIP客房布置”和“前台收纳”两项实战项目,旨在提升一线员工场景化服务能力。
15:28
2026年2月5日,湖北省长证智能空域创业投资基金合伙企业(有限合伙)在湖北登记成立。该基金执行事务合伙人为长江成长资本投资有限公司,认缴出资额5亿元人民币,经营范围涵盖私募股权及创业投资基金管理、创业投资等。基金由湖北省人形机器人产业投资基金、湖北夏创星火创业投资基金、咸宁长证高新产业投资基金等共同出资设立,旨在支持智能空域及相关前沿科技领域创新创业。
15:28
2026年1月23日,美国爱依斯安第斯公司宣布取消在智利阿塔卡马沙漠帕瑞纳天文台附近建设INNA绿氢工厂的计划。该项目原拟投资100亿美元,距欧洲南方天文台(ESO)帕瑞纳台址仅数英里,将导致当地光污染最高上升35%,严重威胁甚大望远镜(VLT)及在建极大望远镜(ELT)的观测能力。ESO总干事称此举消除了对全球最澄澈夜空的重大威胁。公司表示转向储能与可再...