在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2025年12月10日

11:54
小红书近日发布一则重要公告,引发用户热议。备受关注的“小红卡”将于2026年1月1日正式停止试运营,而所有已购卡用户将获得全额退款。这款上线仅3个月的本地生活服务产品,曾以其独特的价值主张迅速吸引了大量关注。 作为小红书布局本地生活服务领域的重要尝试,“小红卡”于今年9月底悄然上线。其核心定位是“精选吃喝玩乐一卡通”,通过年费168元的会员费,为用户提供全年...
11:54
微新创想12月10日重磅报道,社交平台新上线的一档热门播客节目中,科技巨头埃隆·马斯克就个人作息习惯接受了深度访谈。面对主持人的提问,这位知名企业家坦诚分享了自己的睡眠时长:每天坚持6小时睡眠,并强调这是经过科学验证的黄金睡眠时长。他透露,虽然也曾尝试挑战更极限的睡眠模式,将清醒时间延长至每天10小时以上,但实验结果却令人意外——认知功能明显下降,工作效率反...
11:52
美国食品药品监督管理局(FDA)于本周一正式宣布,批准了全球首款人工智能辅助诊断工具AIM-NASH,该系统专用于协助医生在药物临床试验中评估代谢功能障碍相关脂肪性肝炎(MASH)。这一创新云端系统通过深度分析肝脏组织图像,能够精准量化脂肪堆积、炎症反应及纤维化程度,并生成标准化评分体系供临床医生参考。 目前MASH临床试验普遍采用多位专家独立审阅肝活检...
11:52
雷蛇正式官宣,备受瞩目的Boomslang布斯朗悍蛇20周年纪念版鼠标将于2026年2月10日全面开启预约通道。这款传奇级产品的全球限量仅为1337台,售价定为9999元人民币,彰显其非凡的收藏价值与市场地位。 作为雷蛇旗舰鼠标的标杆之作,纪念版Boomslang延续了经典蛇首造型,并创新性地采用半透明外壳设计,让玩家得以一窥内部精密结构。在性能配置上,该款...
11:52
2025年12月10日,中国领先的互联网整合营销服务商与跨境电商综合平台米多多科技正式向香港交易所提交招股书,宣布启动其首次公开募股计划。作为一家以技术创新为核心驱动力的全球化企业,米多多科技总部坐落于中国,旗下战略性地构建了谷多多、客多多、聚多多三大核心业务板块,形成协同发展的业务矩阵。公司专注于为全球客户提供全方位的跨境电商一站式服务,其服务范围涵盖数字...
11:52
2025年12月10日,卓目科技正式宣布在新三板市场成功挂牌上市,标志着这家专注于AI视觉处理技术的高新技术企业迈入了一个崭新的发展阶段。作为新一代信息技术研发领域的先行者,卓目科技凭借其领先的边缘AI技术,在图像识别与处理领域取得了令人瞩目的成就。其自主研发的核心技术不仅实现了高效精准的图像分析,更在多个关键行业中得到了广泛应用。 卓目科技的产品体系涵盖了...
11:52
12月9日,美国Boom Supersonic公司正式宣布进军发电机市场,推出其创新的42GW燃气轮机系统——Superpower。这一突破性产品基于公司自主研发的超音速发动机技术Symphony,展现出卓越的性能与可靠性。Superpower系统具备在高达160℉(约71.11℃)高温环境下稳定运行的能力,无需依赖水冷系统,同时支持云原生监控技术,实现了智...
11:52
2024年12月9日,英特尔正式发布Wi-Fi 24.0.2和蓝牙24.0.1驱动程序更新,为Windows 11 25H2系统提供全面支持。这一重要升级不仅增强了系统兼容性,还为用户带来了更流畅的网络体验。新版Wi-Fi驱动程序特别新增了对BE211、BE213等Wi-Fi 7新品的硬件支持,这些先进设备将充分发挥Wi-Fi 7的传输速度和连接稳定性。值得...
11:52
自2025年3月起,中国钨精矿价格呈现强劲上涨态势,从14.2万元/吨稳步攀升至9月10日的28.8万元/吨历史峰值,随后虽短暂回调至26.7万元/吨并企稳,但10月中旬起再度发力,屡创历史新高。这一价格波动背后,是多重因素的复杂交织。中金公司最新研报深入剖析指出,国内钨矿供给端正面临双重压力:一方面,传统钨矿品位持续下降,开采难度加大;另一方面,环保监管政...
11:52
近日,优必选科技与国内领先的人工智能大模型企业达成战略合作,成功签署了一份总金额突破5000万元的人形机器人销售合同。此次合作的核心内容是向客户交付全球首款具备自主换电功能的工业级人形机器人——Walker S2系列。这款机器人凭借其卓越的高精度运动控制系统和智能作业能力,将在多个领域展现出强大的应用潜力。 根据合同具体条款,优必选科技承诺将在2025年内完...
11:52
2025年12月10日,甲骨文联合创始人、董事长兼CEO大卫·埃里森近期展开了一系列密集行动,积极与华纳兄弟的股东进行沟通,其核心目标在于阻止奈飞公司对其发起的潜在收购要约。这一系列举措不仅彰显了埃里森对华纳兄弟未来控制权的深切关注,更反映出他对潜在交易可能带来的长远影响持有保留态度。据多方消息透露,埃里森明确反对奈飞主导的收购交易,认为此举可能损害华纳兄弟...
11:51
2025年12月10日,备受瞩目的科技创新企业精冕科技正式宣布成功完成首轮融资,总额高达400万元人民币,其中知名投资机构雷雨资本担任领投方。作为人工智能领域的先行者,精冕科技专注于开发前沿的震颤管理平台,致力于为帕金森病患者及特发性震颤患者提供革命性的治疗解决方案。 该公司自主研发的止颤稳定器是核心产品,其创新性地融合了可穿戴惯性传感器与尖端AI算法技...