在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年03月20日

08:51
微新创想:最近,山东青岛一家新开的爱心面馆成了大家关注的焦点,背后发生的事儿那叫一个暖人心窝。这家面馆刚开业没多久,就迎来了一份沉甸甸的善意。一位神秘顾客走进店里,啥也没多说,直接掏出7500元,预存了500份鸡腿面,还特意叮嘱,这些面是留给有困难的人免费吃的。这神秘顾客做好事不留名,只留下这份爱心,让面馆老板张善领又惊喜又感动。 面馆开业不到一周,温暖就像...
08:51
微新创想:新一代小米SU7 正式发布后,创始人雷军在接受采访时敞开心扉,分享了研发新车过程中的种种经历与思考。雷军直言,研发新一代小米SU7 让他承受了巨大压力。他把研发过程比作拍摄电影续集,由于小米此前在汽车领域已有一定成绩,就像电影第一部取得成功,大众对续作期望很高,想要再次超越难度极大。 不过,雷军也表示新一代SU7 在产品力上实现了全方位提升。但当下...
08:51
微新创想:3月20日是世界口腔健康日,很多人每天坚持刷牙,但牙齿依然出现问题,这让不少人感到困惑。其实,问题可能出在刷牙的方式上,一些常见的误区可能正在悄悄削弱你的护牙效果。 第一个误区是刷牙后立即漱口。这个习惯非常普遍,很多人刷完牙就顺手拿起水杯漱口。然而,你可能不知道,牙膏中最重要的护牙成分——氟,可能因此被冲走。氟化物能够强化牙釉质、抵御酸蚀,还能修复...
08:34
微新创想:2025年4月,社交平台Bluesky完成1亿美元B轮融资,由Bain Capital Crypto领投,近期正式披露。此次融资标志着Bluesky在发展道路上迈出了重要一步,不仅为公司提供了充足的资金支持,也增强了市场对其未来发展的信心。 融资将用于扩充团队及推进Bluesky应用与ATProto协议开发。Bluesky作为一家致力于构建去中心化...
08:33
微新创想:2026年3月19日,微软AI首席执行官穆斯塔法·苏莱曼宣布推出第二代图像生成模型MAI-Image-2。这一新模型在权威评测平台LMArena图像生成榜单中位列第三,仅次于谷歌Gemini-3.1-flash-image-preview和OpenAI的gpt-image-1.5-high-fidelity。MAI-Image-2在多个关键领域实现...
08:33
微新创想:北京时间2026年3月20日至3月23日凌晨1点,《Pet Lands》在Steam国区开启免费入库活动。这款由独立团队Tbjbu2开发的宠物收集放置游戏,原价为58元,玩家可在活动期间免费领取。 游戏采用经典的点击与放置玩法,玩家通过点击宝箱获取金币,进而孵化各种宠物。这些宠物不仅能够自动进行采矿等任务,还能帮助玩家探索更多游戏内容。随着游戏进程...
08:33
微新创想:2026年3月20日,美国AI公司Perplexity宣布上线Perplexity Health。这一新推出的健康服务平台旨在为用户提供更加精准和个性化的健康管理方案。该工具主要面向美区Pro/Max用户,通过先进的加密接口技术,实现与Apple Health、Fitbit等主流可穿戴设备的无缝连接。同时,Perplexity Health还整合了...
08:33
微新创想:3月20日,中科院分子植物科学卓越创新中心韩斌院士与王佳伟团队在《Science》封面发表重要研究成果,成功克隆决定水稻多年生特性的关键基因EBT1。这一突破性发现揭示了水稻多年生生长机制的核心调控因子。 该基因由MIR156B和MIR156C两个微小RNA基因组成,能够调控腋芽的‘成花逆转’过程。这一机制使得野生稻在开花之后仍能持续分蘖生长,展现...
08:33
微新创想:2026年3月20日起,长三角铁路启动为期32天的春游运输方案,持续至4月20日,覆盖清明小长假及4个双休日。此次运输方案旨在满足节假日期间旅客的出行需求,为游客提供更加便捷舒适的旅行体验。 预计发送旅客将达到9100万人次,日均发送旅客285万人次,同比增长约5%。这一数据创下了历史新高,显示出长三角地区在春季旅游方面的强劲势头和旺盛人气。 为应...
08:33
微新创想:韩国产业通商资源部于3月20日发布声明指出,卡塔尔液化天然气的进口量占韩国总进口量的约14%。这一比例表明卡塔尔在韩国能源供应中占据重要地位,但同时也显示出韩国在能源进口方面的多元化布局。韩国政府表示,即便出现供应中断的情况,现有的库存储备以及来自不同国家的进口渠道和替代气源仍能确保能源供应的稳定。 微新创想:韩国政府强调,当前的能源供需形势总体保...
08:33
微新创想:3月20日 中国科学院深圳先进技术研究院钟超团队联合哈佛大学团队 成功构建基于重组酶的可编程细胞分化与比例控制平台 该平台在体外实现单一祖细胞按预设规则自主分化为多种子代细胞 并精确调控分化类型 比例及顺序 研究在北京和波士顿两地实验室完成 旨在突破类器官构建与智能生物制造中的细胞组成可控性瓶颈 成果当日发表于《自然》期刊 为生物医学研究和再生医学...
08:33
微新创想:3月20日 杭州德适生物科技有限公司披露港股IPO计划 拟发行约800万股 发行价区间为95.6至112.5港元 预计最高募资8.999亿港元 公司将于3月30日在香港交易所开始交易 此次IPO旨在支持其肿瘤早筛技术研发与商业化拓展 德适生物总部位于杭州 专注于基于多组学的癌症早期检测技术 公司致力于通过先进的生物技术手段 提高癌症的早期发现率 从...