在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月07日

09:14
微新创想2月6日消息,今日,千问在2026年春节推出瓜分30亿”活动,其中第一波20亿免单卡”允许用户通过简单指令领取25元无门槛券,实现0.01元喝奶茶。用户只需更新千问App到最新版即能获得1张25元免单卡,可在全国30多万家奶茶店使用,奶茶店品牌包括喜茶、奈雪、瑞幸、一点点和古茗等。据多家媒体报道,上午,千问开启新年送奶茶...
09:14
微新创想2月6日消息,今日,阿里钉钉发布8.2.10版本,宣布全面升级钉钉AI群聊。新版本还为每个钉钉群配备专属AI agentAI小钉。AI 小钉”实现了24/7全天候在线,无论你何时在群里呼唤它,它都能立刻响应。目前,AI小钉已经上线三大功能:个性化资讯中枢、群动态智能管家、自然语言群管理。其中群动态智能管家可定时汇总群内你...
09:14
微新创想2月6日消息,今天,魅族Flyme AIOS正式推送新春版OTA更新,覆盖魅族22、魅族21 Note、魅族21、魅族21 PRO、魅族20、魅族20 PRO六款机型。新版OTA从视觉设计、影像体验到智能交互、实用工具,带来多项贴合春节场景的新功能,提前为用户送上节日科技福利。视觉层面,此次更新新增缤纷乐园”壁纸样式,融...
09:14
微新创想2月6日消息,今日,阿里千问APP春节30亿免单”火爆上线,仅仅9个小时,用户在千问APP上的AI订单突破1000万单,彻底引爆AI购物。今天以来,用户已经对千问APP说了3000多万次帮我买”。从PC时代的用户主动搜索找商品,到移动时代的猜你喜欢”推荐购物,再到AI时代的一句话AI自动下单帮我买”,千问APP正在创造全...
09:13
微新创想2月6日消息,Mozilla在前几天宣布将为Firefox浏览器用户带来AI控制中心功能,允许用户一键关闭浏览器中所有的AI相关功能,如今这一功能已在Firefox 148 Beta 11版本上线。与某些强制集成或完全排斥AI的浏览器不同,Firefox采取了一种更为平衡且尊重用户隐私的方案,既提供翻译、标签页智能分组、...
08:47
2026年2月7日,据知情人士透露,SpaceX已正式推迟原定于今年执行的火星探测任务。公司调整优先级,转而聚焦月球探索,以支持NASA深空战略。此举涉及资源与技术路线的重新部署,旨在确保首次无人登月任务成功。该公司计划于2027年3月实施无人登月,地点为月球近侧预定区域,执行方为SpaceX自研星舰系统。推迟火星任务主要因技术验证周期延长及月球任务窗口更...
08:47
2026年2月7日,国家数据局等四部门联合发布《关于培育数据流通服务机构加快推进数据要素市场化价值化的意见》。文件首次明确培育数据交易所(中心)、数据流通服务平台企业和数据商三类机构,分别承担综合服务、专业化发展和数据产品开发职能。意见鼓励数据换数据、换订单、换服务、换模型、换场景等多元交换模式,并支持机构协同人工智能企业建设高质量数据集、提供数据治理与模...
08:47
国家税务总局宣布,2025年度个税汇算清缴将于2026年3月1日至6月30日办理。纳税人如拟在3月1日至20日期间办理,可自2月25日起通过个人所得税App预约;3月21日起无需预约,可随时办理。此举旨在优化办税秩序、提升服务效率,方便纳税人合理安排时间。
08:47
2月6日,菲律宾民防局证实,第2号台风“西望洋”已造成至少8人死亡、逾24万人受灾。该台风已于当日减弱为热带低压,中心位于东内格罗斯省附近,最大持续风速45公里/小时,正向西缓慢移动,预计12小时内降级为低压区。灾情主要集中在中西部岛屿地区,当局已启动应急响应。
08:47
2026年2月6日,微软面向Windows 10/11用户推送Word Version 2603(Build 19727.20000)及后续版本,重点优化屏幕阅读器用户的键盘导航体验。此前,箭头键按物理位置移动,易跳过多栏、表格、图文环绕及首字下沉等复杂排版中的内容。新版本引入“逻辑阅读顺序”导航模式,使光标严格遵循文本自然流向:多栏间逐栏切换、表格内按行...
08:47
2026年2月6日,苹果被曝正与广告技术公司Taboola合作,在海外版Apple News中投放广告。Taboola因长期推送低质量、涉嫌误导性广告而备受批评,其部分广告使用AI生成图片并掩盖Gemini水印,链接域名注册仅一个月。此举引发外界质疑,认为与苹果一贯强调的隐私与内容质量形象相悖。目前Apple News广告质量持续下滑,用户观感恶化。分析指...
08:47
苹果计划于2026年4月发布iOS 26.4系统,重点搭载基于大语言模型(LLM)重构的新版Siri。该更新将于2月底或3月初启动测试,放弃旧有关键词匹配架构,首次引入逻辑推理能力。新Siri支持个人情境理解、屏幕内容实时识别及深度跨应用操作,并采用苹果与谷歌Gemini联合开发的后端模型,兼顾性能与隐私,敏感处理保留在设备端。此举被视为通往iOS 27全...