在追求图像完美化的道路上,AI 工具往往陷入一个两难境地:提升图像真实感会牺牲美感,而增强美感又可能导致失真。这一矛盾在悬疑和科幻作品中尤为明显——当调查人员通过计算机屏幕增强模糊照片时,图像瞬间清晰并揭示关键线索。然而,这种神奇效果在现实中却难以实现。英伟达应用深度学习研究副总裁 Bryan Catanzaro 曾指出:”单纯放大图像只会使其更模糊,虽然能保留一些细节,但都是错误的。”

近年来,AI 算法在图像增强领域的应用逐渐突破这一瓶颈。研究人员开始将生成对抗网络(GAN)融入图像处理工具,使增强过程更高效、更强大。以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:”图像质量突然大幅提升。” 但他同时发现,GAN 生成的图像存在严重失真问题。这些图像虽然美观自然,却虚构了不存在的细节,导致与真实场景的偏差。Michaeli 将此现象分为两类:一类展示精美图片(多为 GAN 生成),另一类则注重数据准确性但视觉效果较差。

2017 年,Michaeli 与研究生 Yochai Blau 对比了多种图像增强算法的失真与感知质量表现。研究发现,某些算法在视觉质量上表现优异,另一些则失真度极低,但两者难以兼顾。这种权衡被称为”感知失真权衡”。Michaeli 挑战其他研究者开发能在特定失真水平下实现最佳图像质量的算法,这一倡议吸引了数百名 AI 研究人员参与,并引用了他们的成果。

在特定场景下,感知失真权衡的影响相对可控。例如,英伟达发现高清屏幕难以渲染低清内容,因此开发出深度学习工具提升流媒体视频画质。工程师们选择感知质量优先,接受算法生成原始视频中不存在的细节。”模型在’幻想’,但一致性比准确性更重要”,Catanzaro 解释道。

然而,医学和科研领域对准确性要求更高。杜克大学生物医学工程师 Junjie Yao 指出:”AI 增强可能引入过度拟合或虚假特征,需谨慎使用。” 他曾利用 AI 改进大脑血流和新陈代谢测量方法,确保算法在准确性端保持稳定。

突破数据提取限制的一种方法是融合多源图像。例如,2021 年中国和英国研究人员将 Landsat 和 Sentinel-2 卫星数据结合,以更精确监测刚果盆地森林砍伐情况。通过深度学习将图像分辨率从 30 米提升至 10 米,融合数据检测干扰区域效率比单独使用 Sentinel-2 或 Landsat 更高 11%-21%。

若无法直接突破数据限制,Michaeli 提出另一种思路:让模型提供多种图像解释。在《Explorable Super Resolution》论文中,他展示了对模糊人像和车牌照片的处理结果。传统算法可能将模糊衬衫固定为某种样式,而开放式算法会呈现多种可能性(如条纹方向或数字识别)。这种方法既能排除错误选项,又避免绝对化结论。

尽管 AI 图像增强技术不断进步,但完美的”犯罪侦查增强”按钮仍遥不可及。不同领域都在探索感知失真权衡的解决方案,核心问题在于:AI 图像能提供多少信息?我们又能信任多少?Michaeli 强调:”算法为生成美观图像而编造细节,我们必须保持清醒认知。”

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

最新快讯

2026年02月26日

03:53
微新创想:2026年2月26日,谷歌在三星Galaxy S26系列发布会上推出多项Android更新。这些更新不仅提升了用户体验,还引入了多项创新功能。 新功能包括基于Gemini的多步骤任务自动化。这一功能让用户能够轻松完成如订车、加购等复杂操作。目前该功能处于测试阶段,仅限美国和韩国两国使用,并在Galaxy S26及Pixel 10系列设备上以测试版形...
02:37
微新创想:2026年2月26日 据消息人士透露 乔什·库什纳旗下风投机构Thrive Capital近期以2850亿美元估值向OpenAI注资约10亿美元 资金来自其新设立基金 此次投资发生于美国 目的是为了加强OpenAI在人工智能前沿技术研发与商业化落地能力 Thrive Capital长期聚焦科技领域成长期企业 本次加码反映其对生成式AI长期价值的坚定...
00:53
微新创想:2026年2月25日,谷歌宣布在Gemini应用中正式启用聊天功能作为数据源。这一重要更新面向全球用户,由谷歌公司技术团队部署实施。谷歌表示,此次升级旨在提升模型对实时对话内容的理解与响应能力,使Gemini能够更准确地调用和整合用户的历史聊天信息。通过这一功能,Gemini可以更好地捕捉上下文,从而提供更加精准和个性化的服务。 此次更新采用应用内...
00:53
微新创想:2026年2月25日,摩根士丹利策略师Andrew Pauker等人指出,市场对AI颠覆的过度担忧导致板块错杀,为精选个股提供良机。团队建议关注具备AI既有优势、高增长及高质量特征的公司。其逻辑在于,AI普及正扩大企业软件可服务市场,强化龙头定价权与盈利韧性。微软、财捷集团、Atlassian等被列为具吸引力的入场标的。短期AI落地动能有望缓解长期...
00:53
微新创想:2026年2月26日,南开大学与上海空间电源研究所联合团队在锂电池电解液领域取得首创性突破。该技术通过重构电解液分子结构,显著提升离子传导效率,在同等体积与重量下实现续航能力成倍增长,并大幅改善-30℃低温工作性能。 微新创想:成果当日凌晨发表于国际顶级期刊《自然》。突破核心在于替代传统含氧溶剂体系,削弱锂盐过度溶剂化效应,从而提高能量密度与温度适...
00:53
微新创想:2026年3月1日至31日,江西庐山风景区将向所有海内外游客免费开放。此次免票政策覆盖了庐山核心景区,该景区为国家5A级旅游景点,同时还包括三叠泉、白鹿洞书院、观音桥、秀峰、碧龙潭、桃花源、石门涧等七大著名景点的入园门票。游客在这一期间可无需支付门票费用,即可畅游庐山自然与人文景观。 此次免票活动的推出,是庐山风景区为促进文化旅游消费、表达对游客长...
00:20
微新创想:2026年2月25日,多名用户反馈在Outlook免费版邮箱中出现了“低价Dota 2成品号”等游戏账号交易广告。这些广告通过微软广告网络进行投放,包括Microsoft Audience Network在内的多个渠道均涉及此类内容。广告链接引导用户前往第三方游戏账号交易平台,涉及的游戏包括《堡垒之夜》《使命召唤》《Roblox》等,部分账号标价甚...
00:20
微新创想:2026年2月25日,锦欣康养产业集团有限公司正式向香港交易所提交上市申请。公司注册地为中国内地,总部位于成都,主营业务为康养社区运营及医养结合服务。本次IPO联席保荐人为中金公司和广发证券。 申请旨在拓展融资渠道,加速全国康养网络布局,并提升智能化、标准化服务能力。目前公司已运营多个自有品牌康养项目,覆盖四川、江苏、陕西等地。 微新创想:锦欣康养...
00:20
微新创想:2026年2月25日,美国银行发布预测称,受工业需求回升与投资避险情绪增强推动,白银价格今年有望再度突破每盎司100美元。该行指出,光伏、电子等下游行业采购增加,叠加通胀预期反复及美元阶段性走弱,共同构成上行动能。 分析认为,若美联储降息节奏快于预期,或加速资金流入贵金属市场。目前伦敦现货白银报价约32美元/盎司,距目标位仍有显著空间。随着全球经济...

2026年02月25日

23:43
微新创想:2026年2月25日,伯特利(603596.SH)发布公告,宣布拟收购豫北转向50.9727%的股份。此次交易涉及多个股东,包括峻鸿实业、宁波奉元、合肥华芯及合肥产投等。通过此次收购,伯特利将获得豫北转向的控股权,进一步扩大其在汽车零部件行业的布局。 豫北转向是一家专注于汽车转向系统及关键零部件研发、生产与销售的企业。其产品广泛应用于各类整车制造领...
23:43
微新创想:2026年2月25日,华策影视就网传“解散电影部门”消息发布官方声明,称该信息纯属不实。公司明确表示,电影业务不仅未被裁撤,反而将在2026年全面升级。 此举系推进“内容+科技”战略的一部分,重点以人工智能驱动创作创新。升级方向聚焦提质增效,不再盲目扩产,严守收支平衡底线,优先修复现金流。 声明由公司相关负责人当晚发布,旨在澄清误传、稳定预期。华策...
23:43
微新创想:2026年2月24日,国际期刊《自然·遗传学》发表突破性成果:Juanma Vaquerizas团队利用新型Pico-C技术发现,果蝇受精卵在基因组激活前即已形成模块化、有序的三维DNA支架。该结构精准调控基因时空表达,保障正常发育。 微新创想:同期《自然·细胞生物学》姊妹研究证实,人类细胞中同类结构崩塌会误触发免疫反应,导致炎症与疾病。这一发现为...