兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini

兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini插图1

在图像编辑领域,一项革命性的技术正彻底颠覆传统认知!兔展智能携手北京大学 UniWorld 团队联合发布了新一代图像编辑模型——UniWorld-V2,这一突破性成果不仅在细节处理上超越了Nano Banana,更在中文指令理解上实现了质的飞跃。UniWorld-V2的核心驱动力是创新的视觉强化学习框架UniWorld-R1,该框架首次将强化学习策略优化技术引入图像编辑领域,通过智能算法显著提升了编辑的精准度和灵活性。与传统的监督微调方法相比,UniWorld-R1巧妙地解决了数据过拟合和泛化能力不足的难题,使模型能够从容应对各种复杂编辑指令。

兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini插图2

以手势修改为例,当用户要求AI将一位女生的手势调整为”OK”姿势时,UniWorld-V2能够精准捕捉用户意图并完成完美转换,而Nano Banana则明显缺乏这种理解能力。在海报编辑测试中,该模型更是展现出惊人的艺术表现力,能够精准渲染”月满中秋”等复杂中文艺术字体,确保文字效果既美观又符合语义要求。UniWorld-V2的精细化控制能力同样令人赞叹,用户只需简单框选目标区域,即可实现高难度的局部调整,比如将特定物体从画面中移除。此外,其在光影处理方面的卓越表现,能够自然地将编辑对象融入场景,大幅提升整体视觉效果。

兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini插图3

在权威测试基准GEdit-Bench和ImgEdit的评测中,UniWorld-V2分别以7.83和4.49的优异成绩遥遥领先OpenAI的GPT-Image-1和Gemini2.0等知名模型。这些亮眼成绩的背后,是UniWorld-R1框架强大的通用性支撑,该框架不仅显著提升了UniWorld-V2的性能表现,也为其他图像编辑模型带来了革命性改进。令人欣喜的是,UniWorld-R1的论文、代码和模型已在GitHub和Hugging Face平台公开,为学术界和工业界的研究者提供了宝贵的资源,为未来图像编辑技术的发展奠定了坚实基础。

这一技术的问世,不仅推动了多模态领域的技术进步,更为图像编辑技术开辟了全新的可能性。通过将强化学习与视觉处理深度融合,UniWorld-V2展现了人工智能在创意领域的无限潜力,预示着未来图像编辑将更加智能、高效和人性化。论文地址:https://arxiv.org/abs/2510.16888GitHub链接:https://github.com/PKU-YuanGroup/UniWorld

最新快讯

2025年11月07日

14:17
随着冷空气的频繁侵袭,多地气温骤降,不少地区甚至出现“断崖式”降温,让羽绒服成为冬季出行的必备装备。然而,面对琳琅满目的羽绒服产品,如何挑选一件真正保暖又舒适的羽绒服,成为了许多消费者关心的问题。事实上,羽绒服的保暖性能并非仅由厚度决定,而是受到蓬松度、含绒量、充绒量以及面料抗风性等多重因素的共同影响。专业人士特别指出,许多消费者存在一个普遍误区——认为羽绒...
14:17
11月6日,山西太原上演了一场惊心动魄的街头自卫事件,迅速成为全网热议的焦点。一名小偷在光天化日之下企图偷窃一名年轻女子的手机,却意外遭遇了前所未有的反击,最终狼狈不堪地逃窜。据现场目击者描述,当时小偷趁女子低头看手机时突然伸手行窃,不料女子反应异常敏捷,在瞬间察觉到异常并果断出手反击。 这场突如其来的对抗持续了长达半个多小时,过程惊险刺激。女子凭借过人的勇...
14:17
近期不少微信用户收到了官方发出的特别调研邀请,调研内容聚焦于"多台手机登录同一微信号"这一创新功能。这一举措被广泛视为微信正在积极布局突破当前的单设备登录限制,致力于为用户带来更加流畅的多设备协同体验。值得注意的是,尽管调研活动正在火热进行中,但该功能目前仍处于严格的内部测试阶段。 微信客服部门已通过官方渠道发布明确声明:当前版本的手机客户端暂不支持多设备同...
14:17
瑞典超跑巨头科尼赛克以雷霆之势重夺量产车最快纪录,旗下全新力作"萨戴尔之矛"在加州拉古纳塞卡赛道掀起震撼风暴。这台战车以1分24.16秒的惊人单圈成绩,不仅打破了由自家旗舰Jesko Attack保持的1分24.86秒纪录,更将量产车速度标杆提升至全新高度。这条全长3.601公里的魔鬼赛道,以其标志性的"Corkscrew"发夹弯闻名遐迩,对任何超跑都是严峻...
14:17
森工科技近日宣布成功完成A轮融资,投资方为鸿富资产与南山战新投,彰显了资本市场对该绿色环保新型材料研发企业的坚定信心。作为一家专注于环保材料创新的企业,森工科技始终致力于传统包装材料的绿色升级与替代,通过科技赋能推动产业可持续发展。其自主研发的可降解产品已广泛应用于日用消费品、工业生产、医疗卫生等多个领域,展现出强大的市场应用潜力。 值得关注的是,森工科技的...
14:17
2025年11月7日,全球领先的房地产投资信托基金凯德投资被曝正积极寻求与新加坡丰树集团进行战略合作,探讨将中国以外地区的资产进行整合合并。据悉,此次潜在合作将涵盖凯德在亚洲、欧洲及美洲的多个核心房地产投资组合,通过资源优化配置与协同效应,显著提升整体运营效率与市场表现。 作为亚洲房地产市场的双雄,凯德投资与丰树集团的此次合作意向引起了业界的广泛关注。若合并...
14:17
大疆创新今日正式官宣,将在11月18日14:00举行备受期待的农业无人机新品发布会,以"全能高手,安全无忧"为核心宣传口号,彰显其专业实力与可靠品质。此次发布会将全面聚焦农业无人机领域,延续大疆一贯的神秘发布风格,具体产品型号与详细规格仍处于保密阶段,进一步吊足了行业与用户的胃口。据悉,这款全新农业无人机将重点突出超强的多功能性与全方位作业安全保障,有望通过...
14:17
谷歌近日正式发布了备受期待的Magika 1.0稳定版本,这一里程碑事件标志着其AI驱动的文件类型识别系统正式迈入成熟阶段。作为业界领先的文件分析工具,Magika 1.0在性能与安全性方面实现了重大突破,为用户带来前所未有的高效体验。 该版本的核心引擎经过全面重构,采用Rust语言重新开发,不仅显著提升了运行速度,更在内存安全性方面实现了质的飞跃。新架...
14:17
OpenAI于本周四正式发布了一份针对青少年使用人工智能的安全标准蓝图,这份具有里程碑意义的文件旨在为公众和立法者提供清晰的指引,共同关注并解决青少年在接触AI技术过程中可能面临的安全风险。该蓝图首次通过 Axios 透露给外界,恰逢多个州正在积极酝酿制定AI安全法案的敏感时期,尤其是美国参议院已正式将禁止未成年人使用聊天机器人的法案列入议程。这一发布时机引...
13:38
2025年11月7日,备受关注的泡泡玛特官方直播间直播事故引发社会广泛关注,公司方面迅速作出正式回应。事件起因于两名工作人员在直播推广一款售价79元的周边产品时,因私下对话被直播画面收录,其中"卖这么贵""会有人买单吗"等不当言论意外曝光,迅速在网络上引发轩然大波,成为热议焦点。 泡泡玛特公司经过核实确认,该直播事故确实存在,目前公司已启动紧急内部调查程序。...
13:38
近日,小算科技正式宣布成功完成A轮融资,本轮投资由长沙领新基金独家领投。作为一家深耕移动互联网操作系统技术研发的创新企业,小算科技专注于Android虚拟化操作系统及系统兼容性解决方案的研发与应用,致力于为企业提供专业高效的技术支持服务。此次融资不仅为小算科技注入了强劲的资金动力,更将有力推动其在移动操作系统领域的技术创新与市场拓展,为企业数字化转型提供更优...
13:38
飞航智能近日传来振奋人心的消息,成功完成A轮融资,由实力雄厚的万林国际领投。作为智能无人系统领域的创新先锋,飞航智能凭借其前瞻性的技术布局,构建了独具特色的“智能感知+协同控制+场景智能”三位一体技术体系。该体系深度融合了人工智能与具身智能等前沿科技,为无人机、机器人等多类无人装备的协同作业提供了强大的技术支撑,推动着无人化应用向更高层次迈进。 在核心技术方...