腾讯AI绘画突破性升级 微调技术提升图像美感300%

腾讯近期推出了一项突破性的技术革新,旨在显著提升AI生成图像的真实感与美学评分。据官方介绍,这项先进的微调技术仅需使用32块H20显卡进行10分钟的训练,就能实现令人瞩目的收敛效果,其人工评估得分更是在此基础上实现了300%以上的惊人飞跃。这一成果的取得,为当前AI图像生成领域带来了前所未有的突破。

当前主流的扩散模型虽然能够通过奖励机制优化图像质量,但仍然面临着两大核心挑战。首先,模型优化步骤有限,容易导致”奖励作弊”现象的出现,即模型为获取高分而生成质量平平的图像。其次,离线调整奖励模型的过程缺乏灵活性,严重制约了实时优化的能力。针对这些问题,腾讯AI团队提出了两项创新性解决方案。

首项创新技术名为”Direct-Align”,其核心原理是通过预先注入噪声,使模型能够从任何时间点恢复原始图像。这一设计巧妙地减少了早期反向传播中的梯度爆炸现象,确保模型在整个扩散过程中都能得到充分优化,而不再局限于最后几个步骤。这种全流程优化的思路,为模型性能提升开辟了全新路径。

腾讯AI绘画突破性升级 微调技术提升图像美感300%插图1

第二项创新技术是”语义相对偏好优化”(SRPO)。该技术将原本的奖励信号转化为可受文本控制的信号,通过添加正面和负面提示词,让模型能够灵活调整生成图像的风格。用户只需在提示词前加上简单的控制短语,即可轻松实现亮度调整、风格转换等高级功能,而无需依赖额外数据。这种创新设计极大地提升了用户体验,让AI图像生成变得更加智能化和人性化。

实验数据显示,经过SRPO训练的FLUX.1-dev模型在真实感和美学质量上均取得了长足进步。在一项包含3200个提示词的专项测试中,该模型在真实感维度上的优秀率从8.2%大幅提升至38.9%,美学质量的优秀率也从9.8%跃升至40.5%。尤为值得关注的是,相较于其他方法,SRPO不仅保持了高美学质量,还能生成纹理更加自然的图像。这一技术的成功应用,不仅彰显了腾讯在AI绘画领域的持续探索和创新精神,更为未来AI图像生成技术的发展指明了前进方向。相关技术论文已发布至arxiv,供业界参考学习:https://arxiv.org/pdf/2509.06942

最新快讯

2025年09月16日

12:42
2025年9月16日10时35分,河南许昌市气象台紧急发布暴雨红色预警信号,林科所实测降水量已突破100毫米大关。据最新气象监测数据显示,受强对流天气系统持续影响,未来2小时内,许昌市中心城区大部分区域或将面临超过100毫米的强降雨挑战。 面对严峻的汛情形势,许昌市防汛抗旱指挥部于10时45分果断将防汛应急响应提升至二级。这一决策旨在全面启动应急预案,强...
12:42
UPS近期正式宣布对亚洲航空网络进行重大战略调整,将资源重点投向深圳亚太转运中心与澳大利亚悉尼金斯福德·史密斯机场之间的直飞航线。这一关键航线已从原有规模大幅提升至每周5班,整体运力增长超过4倍,为亚洲主要市场与澳大利亚之间的货物运输效率带来革命性突破。此次升级举措显著缩短了从中国、日本、韩国等核心区域出发的国际物流时间,实现货物配送周期从原先的3个工作日压...
12:42
9月15日,备受市场关注的旭辉集团股份有限公司传来重大利好消息,其旗下全部公司债重组方案获得顺利通过,涉及的总本金规模高达约100.6095亿元人民币。这一重组方案的成功实施,不仅覆盖了旭辉控股集团旗下所有现存的公司债券,更为企业未来的稳健运营奠定了坚实基础。 旭辉控股集团首席财务官杨欣在公告中明确表示,当前房地产市场正处于筑底期,行业转型压力不容忽视。面对...
12:42
九思增材近日正式宣布成功完成Pre-A+轮融资,领投方为极壳科技。作为国内领先的超精细金属3D打印服务商,该公司凭借在新材料应用、高精度工艺和低成本规模化制造领域的深厚积累,已构建起强大的核心竞争力。九思增材致力于为3C终端设备、工业机器人及高端消费品等多元化领域提供兼具高强度、高韧性和高效率的全工序打印产品,服务范围覆盖钛合金、铝合金、不锈钢等主流金属材料...
12:42
9月16日,行业内部消息显示,华为汽车业务单元(车BU)正与广汽丰田加速深化战略合作,计划在未来两年内联合推出三款重磅新车。其中,备受关注的铂智7车型预计将于明年正式上市,该车型将率先搭载华为鸿蒙座舱5.0系统,并配备全新的华为电机系统,为用户带来更智能、更高效的驾驶体验。 根据合作规划,2027年双方将推出两款旗舰车型,这两款车型将全面应用华为最新的乾崑智...
12:42
9月16日,方大集团在官方互动平台上明确回应了外界关于其是否涉足电池业务的疑问。公司方面表示,目前方大集团的业务重心主要集中在幕墙系统、消防产品以及轨道交通设备三大领域,并未进入电池相关产业。这一表态进一步印证了方大集团在产业布局上的专注与清晰。 针对部分市场猜测,方大集团特别强调,公司现阶段既没有与电池产业链相关的研发项目,也暂无任何电池产品的生产计划。这...
12:42
Kimi开放平台重磅推出Kimi K2官方高速版API限时特惠活动,以震撼5折优惠力度,持续整整一个月,为广大开发者带来前所未有的机遇。此次特惠活动旨在让更多用户能够以更低的成本,更高效地体验Kimi K2的卓越性能。 Kimi K2官方高速版API在模型参数上与kimi-k2-0905保持高度一致,同时将上下文长度大幅提升至256K,为用户提供了更广阔的创...
12:42
2025年9月16日,敦煌网正式对外公布商家综合指标考核规则的全面调整方案,这一重要举措旨在从源头上降低商家的运营成本与理解成本,同时有效解决考核指标重复设置、标准不统一等长期困扰行业的问题。此次调整的核心目标在于通过优化考核体系,显著提升商家的整体运营效率、商品质量以及客户满意度,从而构建更加健康、可持续的电商生态。据悉,新规则已于9月12日发布,并将于9...
12:11
Meta AI 近期正式发布了 MobileLLM-R1 系列轻量级边缘推理模型,这一创新成果已在 Hugging Face 平台公开发布。该系列模型参数规模覆盖从 140M 到 950M 的广泛区间,其核心设计理念聚焦于高效执行数学运算、编码任务以及科学推理,令人惊喜的是,即便在参数总量不足 10 亿的条件下,依然实现了令人瞩目的性能表现。 MobileL...
12:11
VEED重磅发布全球首款AI会说话视频模型Fabric 1.0,以颠覆性的技术重新定义视频创作边界。只需一张静态图片,即可生成具有逼真唇形同步和自然面部表情的动态视频,彻底打破传统视频制作的成本与时间壁垒。官方数据显示,Fabric 1.0将视频生成成本降低60倍,速度提升7倍,最长支持1分钟内容生成,这一突破性成果迅速引发科技界强烈关注,开发者与内容创作者...
12:11
2025中国企业500强榜单及分析报告于9月16日由中国企业联合会与中国企业家协会联合发布,引发广泛关注。卓尔智联集团凭借其卓越的经营业绩,成功跻身中国企业500强,位列第164位,同时荣获中国战略性新兴产业领军企业100强称号,排名升至第65位。这一双料入榜成绩不仅彰显了卓尔智联集团在行业内的领先地位,更体现了其稳健的经营策略与持续的创新动力。 此次发布的...
12:11
安帝康生物近日传来振奋人心的消息,公司在抗呼吸道病毒创新药研发领域取得重大突破,已成功布局包括"一粒"治愈流感新药、口服抗新冠特效药及抗RSV药物在内的多款前沿产品。其中备受瞩目的口服抗新冠特效药CN-2021,计划于今年正式进入临床试验阶段。这款创新药物以奈玛特韦结构为基础进行深度优化,临床前研究数据惊艳亮相,展现出超越同类的Best-in-Class潜力...