腾讯混元SRPO技术革新AI图像生成 提升真实感解决过油问题

腾讯混元SRPO技术革新AI图像生成 提升真实感解决过油问题插图1

腾讯混元团队近日在官方公众号重磅发布了其最新研究成果——SRPO(语义相对偏好优化)技术,旨在显著提升AI生成图像的真实感,特别针对开源文生图模型Flux在人物皮肤质感上存在的“过油”问题提出创新解决方案。这一突破性技术的推出,有望为整个生图领域带来革命性变革。在数字艺术创作日益普及的今天,AI生成图像的质量已成为衡量创作价值的重要标准。Flux模型作为开源文生图社区的核心基础模型,虽广受青睐,但其生成人物皮肤时过于光滑、缺乏自然质感的缺陷,一直备受诟病。为解决这一难题,腾讯混元团队联合香港中文大学(深圳)及清华大学共同攻关,成功研发了SRPO方案。该方案通过在线调整奖励偏好、优化生成轨迹等多元手段,全方位提升生成图像的真实感表现。SRPO技术的核心创新在于引入“语义偏好”概念,通过添加“真实感”等特定控制提示词,精准调整奖励模型的优化目标。实验数据有力证明,这种方法能够显著增强生成图像的真实度表现。然而,研究团队也敏锐地意识到,单一语义引导可能引发奖励破解问题。为此,他们创新性地提出“语义相对偏好优化”策略,采用正向与负向词汇协同作用作为引导信号,有效中和奖励模型的潜在偏差。值得注意的是,传统生成优化方法往往聚焦于生成过程的后半段,这种局限性容易导致在高频信息上出现过拟合现象。腾讯混元团队通过独创的Direct-Align策略,向输入图像注入可控噪声,并将其作为参考锚点进行图像重建,大幅降低重建误差,实现更精准的奖励信号传导。这一创新方法突破性地支持对生成轨迹的前半段进行优化,从根本上解决了过拟合难题。在技术性能方面,SRPO展现出惊人的训练效率,仅需10分钟即可超越现有的DanceGRPO方法。研究结果显示,SRPO在真实度和美学评分上提升超过三倍,而训练时间相较于传统方法降低了高达75倍。随着这项技术的广泛应用,未来AI生成图像的真实感将得到质的飞跃,必将为数字艺术创作开辟全新的可能性空间。项目地址:https://tencent.github.io/srpo-project-page/

腾讯混元SRPO技术革新AI图像生成 提升真实感解决过油问题插图2

腾讯混元SRPO技术革新AI图像生成 提升真实感解决过油问题插图3

最新快讯

2025年09月18日

10:18
9月18日,大语言模型(LLM)领域迎来一项里程碑式突破。DeepSeek 团队凭借其关于 DeepSeek R1 的研究论文,成功登上了顶级学术期刊《Nature》的封面,成为首个通过权威同行评审的大语言模型。这一事件不仅证明了 DeepSeek R1的技术创新,也为整个 AI 行业树立了新的学术标准。《Nature》编辑部指出,在 AI 技术飞速发展、炒...
10:18
随着人工智能模型能力快速提升,AI安全问题日益凸显。周三,专注于AI安全评估的公司Irregular宣布完成8000万美元新一轮融资,由红杉资本和红点创投领投,网络安全公司Wiz首席执行官阿萨夫·拉帕波特也参与投资。知情人士透露,此轮融资对Irregular的估值达到4.5亿美元。前瞻性安全防护理念"我们的观点是,很快,大量的经济活动将来自人与人工...
10:18
位于旧金山的初创公司Invisible Technologies近日宣布完成一轮1亿美元的融资。这一轮融资由新成立的投资公司 Vanara Capital 领投,其他参与投资的公司包括 Princeville Capital、HOF Capital、Acrew Capital、Greycroft 和 Deepwater Asset Management。这轮...
10:18
随着 AI 技术的不断进步,如何让大模型具备 “并行思维” 能力,成为了研究者们关注的热点话题。最近,腾讯 AI Lab 联合多所高校的研究团队推出了一个名为 Parallel-R1的全新强化学习(RL)框架,旨在教会大模型如何同时探索多条推理路径。这一创新的框架为应对复杂的数学推理任务开辟了新思路。传统的方法往往依赖于监督微调(SFT),这种方式不仅对数据...
10:18
Meta 于周三的 Connect2025年度开发者大会上,正式推出了其最新款智能眼镜产品——Meta Ray-Ban Display。这款眼镜由首席执行官马克·扎克伯格亲自发布,其核心亮点在于右侧镜片内置的显示屏,能够直观地呈现应用程序、提醒和导航信息。该产品将于9月30日起上市,售价为799美元。Meta Ray-Ban Display 旨在延续前代 R...
09:54
近日,全球领先的云安全服务商Netskope成功在美国完成首次公开募股,以每股19美元的价格出售约4780万股,最终筹集资金高达9.08亿美元。此次发行价格精准定位于上调后区间顶端,充分展现了市场对Netskope的高度认可与信心。作为专注于企业云服务安全监管的技术提供商,Netskope凭借其创新的安全解决方案,为大型企业有效保障员工在使用谷歌Drive、...
09:54
特斯拉近日宣布对车门把手进行重大重新设计,以解决此前因电子释放装置故障引发的安全隐患问题。据彭博社最新报道,这一改进措施旨在提升车辆在紧急情况下的安全性,确保乘客能够顺利逃生。公司设计主管弗朗茨・冯・霍尔茨豪森透露,新设计将创新性地整合电子与手动车门释放装置,使乘客在遭遇紧急状况时无需依赖电子系统,即可通过传统手动方式打开车门,从而大大增强逃生效率。 这一举...
09:54
9月18日,极兔速递正式对外发布重要公告,宣布董事会已达成一致决议,批准公司开展大规模股份回购计划。根据方案,极兔速递将回购不超过公司已发行B类股份总数10%的股份,回购资金总额上限设定为10亿港元。此次回购将主要通过公开市场方式进行,具体操作需待股东周年大会通过相关决议后方可实施。 此次股份回购计划的核心目标在于优化公司的资本结构,通过减少流通股数量提...
09:54
昨日,备受瞩目的趣玩日活动圆满落幕,罗技G品牌携旗下最新力作——PRO X SUPERLIGHT 2c无线电竞鼠标震撼登场。这款创新产品不仅继承了PRO X SUPERLIGHT 2的核心技术精髓,更在便携性与舒适度上实现了突破性升级,专为中小手型用户量身定制。其机身尺寸经过精心优化,缩减至118×61×39毫米的紧凑形态,重量仅为51克,让玩家在激烈对抗中...
09:54
宇石空间可复用不锈钢液体运载火箭研制基地近日在湖南株洲经开区正式破土动工,这一标志性事件标志着湖南省首个火箭研发制造项目正式拉开建设帷幕,为当地航天产业链在运载火箭领域填补了关键空白。项目占地面积约5.4万平方米,总投资额高达15亿元人民币,预计达产后将实现年产8发火箭的产能,年产值有望突破20亿元大关。基地将重点承担AS-1号火箭的生产与总装任务,致力于打...
09:54
谷歌正式宣布启动Pixel 10系列手机的Android测试版计划,为全球用户带来抢先体验最新系统版本的机会。根据Android Authority最新消息,此次测试计划全面覆盖Pixel 10标准版、Pixel 10 Pro、Pixel 10 Pro XL以及Pixel 10 Pro Fold四款旗舰机型。用户只需登录谷歌官网,使用同一谷歌账号即可轻松注册...