在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年01月19日

09:26
近日,浙江绍兴新昌县世贸广场附近一株奇特的竹子引发全网关注,因其从废弃路灯杆中顽强生长的姿态,被网友亲切称为“竹坚强”。这株竹子的生长方式堪称一绝——它的根部精准地穿过灯杆底部的破损处,沿着金属管道内部攀爬,历经五六米的“内循环之旅”,最终从灯杆顶部的缺口处破石而出,顶端还挂着生机勃勃的嫩绿竹叶,生动展现了生命力的极限绽放。 这株“竹坚强”不仅是个体生命的奇...
09:26
河南周口西华县一家名为“李大叔蛋糕房”的乡村小店近日在网络上爆火,其推出的超值蛋糕套餐引发全民抢购热潮。这家小店推出的10元4寸精装蛋糕(普通版仅需6元)凭借亲民的价格和出色的品质,迅速俘获了周边村民和远道而来的顾客的心。订单量激增导致店铺不得不暂时歇业,但依然难挡顾客的热情。 据了解,“李大叔蛋糕房”自开业以来,便以实惠的价格和美味的口感赢得了口碑。近期随...
09:26
今冬最强雨雪天气席卷南北,南方地区迎来湿冷侵袭,湿度远超北方,给居民生活带来严峻考验。面对湿冷气候,南方居民需采取科学应对措施,注重除湿与防寒,才能确保健康舒适度过冬季。 专家提醒,南方冬季湿冷环境对身体健康构成威胁,保持身体干燥是关键。一旦遭遇雨淋,应迅速更换湿衣物,避免寒气入侵引发感冒等健康问题。同时,南方防寒的核心在于关窗除湿,特别是朝南和东南方向的窗...
09:06
全球人工智能领域的融资纪录再次被刷新,AIbase独家获悉,知名风险投资机构红杉资本正在领投人工智能初创企业Anthropic的新一轮巨额融资。据悉,本次融资规模高达250亿美元,这一惊人的数字直接将这家以Claude聊天机器人为核心产品的开发商估值推至3500亿美元(约合2.45万亿元人民币),创造了行业新纪录。除了红杉资本外,新加坡主权财富基金GIC和美...
09:06
在韩国,人工智能服务的消费热潮已超越流媒体巨头Netflix,成为当地数字经济的焦点。据韩国媒体Hankyung Aicel最新发布的权威数据,2025年12月,韩国消费者在ChatGPT、Gemini、Claude等七大主流AI服务上的总支出高达803亿韩元(约合4.3亿元人民币),首次实现对Netflix在韩国市场2024年月均750亿韩元订阅收入的超越...
09:06
Runpod 以惊人速度崛起,四年间实现年度经常性收入(ARR)突破1.2亿美元,成为 AI 算力市场的新星。这家由两位企业开发者从地下室起步的初创公司,凭借敏锐的市场洞察力和独特的“自举”增长策略,在激烈竞争中脱颖而出,书写了科技创业的传奇篇章。 从地下室挖矿到 AI 算力转型 Runpod 的创业故事始于2021年末。创始人 Zhen Lu 和 Pard...
09:06
谷歌 Gemini 的用户数量呈现爆发式增长,业界普遍猜测这款 AI 应用是否会通过广告投放来缓解高昂的算力成本。据 AIbase 获悉,谷歌全球广告副总裁丹·泰勒近期明确表示,公司目前没有在 Gemini 应用中投放广告的计划。他特别强调,谷歌当前的商业化重心仍聚焦于人工智能搜索广告的投放。 在谷歌的战略布局中,搜索与 Gemini 被定位为功能互补的工具...
09:06
当一款桌面应用在短短两周内由AI自主生成全部代码、上线即吸引4600万用户关注,它已不再只是工具,而是一场对传统工作方式的无声颠覆。Claude最新推出的Cowork,正是这样一枚投入科技湖面的重磅石子——它不仅能读取你的文件,还能主动整理、编辑、创建甚至优化整个工作流,将“智能助手”从聊天窗口真正搬进你的电脑桌面。 与传统命令行工具或脚本自动化不同,C...
09:05
硅谷科技界的风云再起,一场价值千亿的诉讼风暴正席卷而来。据AIbase独家获悉,埃隆·马斯克已正式向加州奥克兰联邦法院递交起诉书,将OpenAI及其战略盟友微软告上法庭,索赔金额高达1340亿美元。这场旷日持久的商业纠纷,源于OpenAI从非营利组织向营利性公司的转型过程中,马斯克所主张的权益被严重侵犯。 作为OpenAI的联合创始人之一,马斯克在诉状中详细...
08:56
近日,上海一家小餐馆内发生了一起令人咋舌的事件,因低消费自带食物就餐后留下的垃圾问题,老板的合理要求竟遭到顾客的激烈反驳,迅速引发全网热议。这起事件不仅暴露出部分顾客的公德意识缺失,更折射出餐饮业者在经营中面临的困境与无奈。 事发当日,六名顾客结伴来到这家位于市中心的精致小馆,他们精心准备了许多自带的菜肴,却仅点了两碗总价19元的特色汤品。用餐过程中,他们毫...
08:56
近日,青岛动物园内一只名为“小孬”的11岁孟加拉白虎凭借其惊艳的雪白皮毛和精致的面容,在网络上掀起了一股热潮,被网友们亲切地称为“虎界刘亦菲”。这只雌性孟加拉虎以其优雅的气质和温婉的神态,迅速俘获了无数网友的心,成为社交媒体上的明星动物。其独特的魅力不仅赢得了网友们的疯狂点赞,更吸引了大量游客不远千里,专程乘坐高铁或飞机前来观赏,一睹这位“白虎公主”的风采。...
08:56
近日,影视圈传来令人震惊的消息,备受尊敬的功夫影星梁小龙先生于1月14日与世长辞,享年77岁。这位在银幕上以硬汉形象著称的传奇人物,他的离去不仅让影迷们悲痛不已,也引发了整个行业的深切哀悼。 1月18日晚,梁小龙的社交媒体账号突然发布了一篇充满神秘感的告别信。信中写道:"请原谅我不辞而别,就当我到很远的地方拍电影去了。本想保密的,所以关门弟子像往常一样发视频...