在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月05日

09:49
声明:本文来自于微信公众号 新声Pro,作者:赛娜,授权站长之家转载发布。传统的电影营销套路,正在被更多观众识破。贴着热梗制造的内容,一系列让人摸不着头脑的话题词,各类短视频挑战和背负流量KPI的明星路演,构成了一套追求短期声量最大化的标准动作。但这些同质化的内容,并不能展现电影的核心特质,也就无法触达其真实的兴趣用户。「被骗」...
09:49
近日,一段记录高铁车厢内独特场景的视频在社交平台上迅速传播,引发广泛关注。视频中,一名男子手持手机,悠然自得地坐在自带的折叠椅上,位置恰好在高铁两节车厢的连接处。视频一经发布,便在网络上激起千层浪,网友们纷纷留言表达看法。部分网友流露出羡慕之情,认为这种方式“空间大、安静、还靠窗”,甚至有买到无座票的网友急切询问折叠椅的购买链接...
09:49
近日,广东一家名为“猪葛亮”食品有限公司的企业引发社会关注。有自称诸葛亮后裔的人士公开发表声明,指出该公司利用“猪”与“诸”的谐音,将“猪葛亮”注册为商标或企业名称,此举涉嫌攀附历史名人、进行恶意营销,伤害了诸葛后裔及敬仰诸葛亮人士的感情。该声明还表示,将向商标局提出申诉,若行为性质恶劣,不排除通过法律手段维护权益。针对这一争议...
09:49
近日,一名女子在社交平台发布视频,称自己花费200元“独享”了一架客机,引发网友热议。据该女子介绍,2月1日,她预订了四川航空从九寨沟飞往成都的航班。起飞前,她意外接到机场电话,被告知这趟航班只有她一名乘客,若提前到达可提前起飞。女子随即赶往机场办理登机手续,登机后舱门迅速关闭,她感觉机组人员都在等待自己。不到5分钟,飞机便开始...
09:49
2月1日,“原来静音车厢是纯人工静音”话题登上微博热搜,引发网友广泛关注。有网友发布视频称,自己出于好奇选择了高铁的静音车厢,原本以为车厢内会采用特殊材料进行降噪,没想到所谓的“静音”其实是依靠人工维持。该网友表示,一旦车厢内有人说话,乘务员便会迅速赶来制止。工作人员解释称,静音车厢的静音效果主要依赖于乘客的自觉。乘客在静音车厢...
09:20
2026年2月5日,科技媒体TechRadar发布体验报道,任天堂将于2月17日正式发售为Switch 2设计的Virtual Boy复古外设,售价99.99美元(约694.9元人民币)。该设备复刻1995年失败机型,保留桌面支架结构,需配合Nintendo Switch Online+扩充包订阅方可购买及游玩专属游戏库。编辑实测显示成像显著提升、无晕动症...
09:20
2026年2月5日起,捷豹路虎(中国)投资有限公司召回2025年8月27日至29日生产的部分进口2025款路虎揽胜及揽胜运动版汽车,共16辆。召回原因为变速箱换挡控制模块内挡位指示灯可能无法点亮,导致驾驶员无法识别当前挡位,存在安全隐患。该公司将为受影响车辆免费更换该模块,以消除风险。
09:20
2026年2月5日0时,雷蛇官方宣布预热一款全新机械键盘。该键盘采用Tenkeyless布局,外观与猎魂光蛛系列竞技版相似,命名以'H'开头,定位为签名款匠心之作。新品基于猎魂光蛛V3 Pro专业版升级,强调性能新标准。发布地点为全球同步线上预热,具体参数与售价尚未公布。此举旨在强化其高端电竞外设产品线,满足专业用户对响应速度与工艺品质的双重需求。
09:20
2026年2月5日,鹏欣资源(SH600490)因董事会秘书自2022年1月起持续空缺四年,被上交所出具警示函,董事长王健等被监管警示。公司同时于2025年1月28日起诉实控人姜照柏、姜雷,要求支付业绩补偿款约4.14亿元,缘于2018年收购宁波天弘股权后其累计净利润为-3.64亿元,远未达19.44亿元承诺目标。目前案件尚未开庭,影响暂难预估。公司202...
09:20
2025年,泰康在线迎来成立十周年。全年实现签单保费201.79亿元,同比增长38.79%;保险业务收入179.18亿元,增长27.45%;净利润4.63亿元,大幅增长804.95%。11月20日,方远近接任临时负责人兼首席投资官。公司总资产同比下降12.33%,核心与综合偿付能力充足率均为199.55%,较上年末下滑超56个百分点。年内因合规问题两度被监...
09:20
2026年1月30日,浙江海亮股份有限公司向港交所主板递交上市申请,中金公司与广发证券为联席保荐人。公司成立于2000年8月,主营铜基材料解决方案,产品覆盖热管理、导体材料及AI应用铜材等。截至2025年9月底,全球布局23个生产基地。2024年铜基材料出货量超100万吨;2025年前9月营收650.18亿元,同比降4.55%,净利润9.31亿元,增18....
09:19
2026年2月4日,四川泸州一博主王某发布虚假视频称孩子险遭人贩拐走,引发公众恐慌。经泸州市公安机关调查,涉事儿童当日放学后由家人接走,无拐骗事实及可疑人员。王某承认视频系刻意摆拍。警方依据《治安管理处罚法》对其作出行政处罚。事件发生于泸州某商场周边,起因为博取流量、制造话题。目前相关视频已被下架,警方提醒公众勿轻信传播未经核实的涉安全类信息。