在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月04日

20:40
2025年底,一家头部美元基金以500亿美元(约合3472.78亿元人民币)估值,低调出售部分小红书老股。此前业内普遍认知的小红书估值约为2200亿元人民币;2025年6月彭博社曾报道其估值升至260亿美元。2024年底小红书预计利润超10亿美元,2025年初受TikTok风波影响,海外用户激增,两天内新增账号逾70万。此次交易反映市场对其增长与盈利潜力的...
20:40
2026年2月,奥地利科技公司奥特斯公布2025/26财年第三季度业绩:合并营收同比增长18%(汇率调整后达27%),EBITDA增长64%(汇率调整后达105%);单季净利润2400万欧元,同比由亏损3300万欧元转为盈利。前三季度营收达13亿欧元,同比增长10%(汇率调整后+16%);EBITDA升至2.97亿欧元,利润率提升至22.6%。业绩改善主要...
20:40
2026年2月,英国科博桑公司(CBS)正式在全球市场推出新款笔记本支架Lana。该产品于1月预发布,现全面上市。Lana专为耐用性设计,通过五年日常使用测试,并提供五年保修;采用循环设计理念,关键部件支持重复使用、翻新或规范回收。其极简美学适配最大16英寸、2.5公斤笔记本,配合USB-C充电及无线外设可实现单线缆简洁布线。
20:40
2026年2月4日,VivaTech发布第三版科技信心晴雨表。调研覆盖法、德、英、西、意、荷、美七国企业高管。92%受访者倾向选择本国籍技术合作伙伴,47%视其为决定性因素;86%认为技术方案地理来源影响信任度;89%信任AI辅助决策;83%对AI领域金融投资可持续性有信心,仅17%担忧投机泡沫。
20:40
2026年2月4日,NFC论坛公布最新技术路线图。该路线图由全球近场通信标准组织主导,旨在提升NFC数据传输速率(最高达当前8倍)、扩展‘多用途触碰’功能、启动下一代NFC无线充电规范(支持多线圈及更高功率),并制定首份NFC控制器安全规范,以抵御后量子计算威胁和中继攻击。此次更新是继2023年路线图及2025年6月Release 15标准落地后的关键演进...
20:40
2026年2月4日,微软正式启动“出版商内容市场”(PCM)计划。该平台旨在为AI公司提供集中式内容授权服务,支持模型训练与事实增强(grounding)。首批合作伙伴包括雅虎、美联社、康泰纳仕等。PCM采用按使用价值付费的商业模式,并兼容开源的“极简授权协议”(RSL)。此举直面生成式AI长期依赖未授权内容引发的版权争议。微软强调,PCM将重塑AI时代的...
20:10
2026年2月4日,海信视像青岛工厂被世界经济论坛(WEF)正式认定为“用户导向”灯塔工厂,系全球电视行业首家且唯一获此认证的工厂。该厂通过深度融合人工智能、大数据、工业仿真及大规模VR技术,实现研发周期缩短34%、材料成本降低18%、新员工培训时间减少60%,客户需求到产品功能转化周期压缩62%,85英寸电视制造节拍达20秒,净推荐值(NPS)达84%。...
20:10
2026年2月4日,埃及吉萨的Khufu's餐厅荣登《中东及北非最佳餐厅》榜首。该榜单覆盖14座城市,含16家新晋入选餐厅。迪拜三家餐厅紧随其后:Kinoya(第2)、Trèsind Studio(第3)、Orfali Bros(第4),后者曾连续三年夺冠。黎巴嫩贝鲁特Beihouse位列第5,并获“最高新晋奖”。评选结果于当日公布,旨在表彰区域餐饮卓越成...
20:10
2026年2月4日,金晶科技(600586.SH)发布公告称,公司股票近期出现异常波动。针对市场关注的TCO玻璃业务,公司表示目前该行业整体市场规模较小;2025年1至9月,TCO玻璃销售收入占当期总营收比重较低,未对整体营收构成显著影响。公司提醒投资者理性决策,注意投资风险。
20:10
2月4日18时39分,新西兰克马德克群岛海域(南纬29.85度、西经178.25度)发生6.0级地震,震源深度190千米。此次地震由中国地震台网正式测定,属中深源地震,未发布海啸预警。事发地位于人烟稀少的南太平洋远海区域,暂无人员伤亡及财产损失报告。当地地质构造活跃,属环太平洋地震带组成部分。
20:10
2026年2月3日,加拿大YouTuber FrozenTesla在-36℃环境下对2024款Model 3长续航版开展低温实测。车辆露天静置10小时、未插电、未预热,次日电池温度达-20℃,电量自然下降3%。行驶35.4公里至超充站,能耗高达64.2kWh/100英里,续航预估不足193公里;充电时因电池低温,前15分钟主要用于升温,充至75%需55分钟...
20:10
2026年2月4日,电科数字(600850.SH)公告,董事长、法定代表人江波及董事于开勇因工作变动原因,分别辞去董事长、董事、法定代表人及董事会专门委员会相关职务。江波不再担任公司任何职务;于开勇亦不再担任公司任何职务。二人辞职后,公司董事会成员将低于法定人数,公司将按规定尽快补选董事并完成董事长选举程序。