在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年01月29日

09:43
近年来,动物经纪人行业迅速崛起,成为备受社会瞩目的新兴领域。这些专业的从业者通过精湛的训导技巧,将普通宠物精心培养成影视圈中的"明星动物",其中部分"狗演员"的日薪更是高达四位数甚至更高,展现出惊人的市场价值。然而,在这光鲜亮丽的高薪背后,却隐藏着一系列亟待关注的问题,包括严苛的行业标准、动物福利争议以及尚未完善的风险保障体系。 以中华田园犬"大黄"为例,这...
09:43
近日,一位在杭州工作的黑龙江女生小林,凭借其创新的跨国返乡路线设计,在网络上引发了广泛关注。面对春运期间直飞老家黑河的高昂机票费用(约2340元且需中转),小林巧妙结合中俄互免签证政策与地理优势,规划出一条别具一格的返乡路径,不仅节省了费用,还顺道体验了出国游。小林的返乡路线具体为:从杭州出发,先飞往俄罗斯符拉迪沃斯托克,机票价...
09:43
近日,山西运城一位小学班主任的举动引发了社会广泛关注。在为学生们颁发奖状时,刘老师特意将其中一份颁给了一位近期考试交白卷的学生,此举在网络上收获了众多网友的点赞与好评。据了解,这名交白卷的学生因家庭原因对学习产生了排斥情绪,但在班级中却是个热心肠的“小太阳”,经常主动帮助老师和同学解决困难。刘老师在颁发奖状时坦言,自己内心也有些...
09:43
微新创想1月28日消息,任谁也没想到,哭哭马”玩偶不仅在国内被抢疯了,甚至吸引到了多个海外国家的消费者。近日,英国《卫报》在一篇最新报道中称,目前已经有来自南非、中东以及东亚其他国家的买家,在求购正在中国火出圈的哭哭马”。据悉,这款玩偶诞生于一个意外,玩具厂的工人不慎把一款红色的小马玩偶的嘴部缝反了,导致小马原本的笑脸变成一个委...
09:43
1月27日,月之暗面正式发布Kimi K2.5大模型。上线24小时内,该模型在LMarena榜单中位居开源模型首位,在Artificial Analysis榜单中综合排名第5、开源模型第1。事件发生于北京时间2026年1月27日至28日,主体为月之暗面公司,动因为提升中文与多模态推理能力。K2.5以显著性能优势超越所有现有开源竞品,标志着国产大模型在开源领...
09:43
1月29日,京东物流在京推出针对85英寸以上大屏电视的“满分送装”服务标准。该服务涵盖三大维度:安全100%(破损必赔)、体验100%(最快当日送装)、保障100%(提供180天超长售后)。此举旨在解决百吋电视运输安装难、售后周期短等行业痛点,推动大屏家电消费提质升级。服务即日起在全国主要城市落地实施。
09:43
1月26日,广州研趣信息科技股份有限公司正式敲响港交所上市钟声,作为人人租的母公司,该笔融资计划备受市场瞩目。作为一家成立于2015年的创新企业,研趣信息凭借其运营的中国最大线上租用消费服务平台“人人租”,在共享经济领域迅速崛起。据最新财报显示,2024年平台交易总额(GTV)已突破75亿元,占据国内线上租赁市场27.5%的领先份额,展现出强大的市场竞争力。...
09:43
罗技G即将震撼推出全新一代无线游戏耳机——G325 LIGHTSPEED,为游戏玩家带来前所未有的沉浸式体验。这款耳机采用先进的32mm驱动单元,阻抗仅为32Ω,能够精准还原每一个细腻的声音细节,让游戏音效更加逼真震撼。配备的全向波束成形麦克风,配合智能AI降噪技术,有效消除外界干扰,确保语音通讯清晰无杂音。同时支持24-bit高解析音频,为您呈现纯净细腻的...
09:43
2026年1月,中国民生银行陆续关停昆明盛高大城社区支行、邯郸世纪大街支行等7家支行,获监管终止营业批复;同期获批开业林芝分行、上海永泰路社区支行。此举系该行持续优化物理网点布局的一部分——2025年上半年其营业网点减少23家,主要为社区及一般支行。调整背景包括降本增效需求、线上化转型加速,以及2025年前三季度“增收不增利”(营收增6.74%,净利降6....
09:43
2026年1月29日,沃森生物(300142)召开第六届董事会第一次会议,续聘42岁的严野为公司董事会秘书兼副总裁。严野于2026年1月19日取得深交所颁发的董秘资格证书,正式履职。此前因未持证,其自2025年6月起的聘任暂未生效,由董事长李云春代行职责。此次续聘正值公司因2023—2024年董事及高管薪酬事项未提交股东大会、董事会审议,被深交所与云南证监...
09:43
1月27日,广西玉柴船电动力股份有限公司正式向香港交易所主板提交上市申请,招商证券国际与中国银河国际联合担任联席保荐人。这家企业拥有深厚的历史底蕴,其前身可追溯至1951年成立的玉林泉塘。经过多年的发展,玉柴船电动力在2022年完成了船用及发电机组业务的独立整合,从此专注于发电与船用发动机的研发制造,致力于打造行业领先的能源动力解决方案。 根据权威市场研究机...
09:43
1月27日,广西玉柴船电动力股份有限公司正式向港交所主板递交上市申请,招商证券国际与中国银河国际担任联席保荐人。该公司专注发电及船用发动机研发制造,历史可溯至1951年,2022年完成业务整合并独立运营。据弗若斯特沙利文数据,其为2024年中国最大发电用发动机供应商、中高速船用发动机市场第二。2023至2025年前三季度,营收分别为32.39亿、40亿、4...