兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini

兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini插图1

在图像编辑领域,一项革命性的技术正彻底颠覆传统认知!兔展智能携手北京大学 UniWorld 团队联合发布了新一代图像编辑模型——UniWorld-V2,这一突破性成果不仅在细节处理上超越了Nano Banana,更在中文指令理解上实现了质的飞跃。UniWorld-V2的核心驱动力是创新的视觉强化学习框架UniWorld-R1,该框架首次将强化学习策略优化技术引入图像编辑领域,通过智能算法显著提升了编辑的精准度和灵活性。与传统的监督微调方法相比,UniWorld-R1巧妙地解决了数据过拟合和泛化能力不足的难题,使模型能够从容应对各种复杂编辑指令。

兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini插图2

以手势修改为例,当用户要求AI将一位女生的手势调整为”OK”姿势时,UniWorld-V2能够精准捕捉用户意图并完成完美转换,而Nano Banana则明显缺乏这种理解能力。在海报编辑测试中,该模型更是展现出惊人的艺术表现力,能够精准渲染”月满中秋”等复杂中文艺术字体,确保文字效果既美观又符合语义要求。UniWorld-V2的精细化控制能力同样令人赞叹,用户只需简单框选目标区域,即可实现高难度的局部调整,比如将特定物体从画面中移除。此外,其在光影处理方面的卓越表现,能够自然地将编辑对象融入场景,大幅提升整体视觉效果。

兔展智能发布UniWorld-V2图像编辑模型 框选即改中文字体精准渲染性能超越GPT-Image与Gemini插图3

在权威测试基准GEdit-Bench和ImgEdit的评测中,UniWorld-V2分别以7.83和4.49的优异成绩遥遥领先OpenAI的GPT-Image-1和Gemini2.0等知名模型。这些亮眼成绩的背后,是UniWorld-R1框架强大的通用性支撑,该框架不仅显著提升了UniWorld-V2的性能表现,也为其他图像编辑模型带来了革命性改进。令人欣喜的是,UniWorld-R1的论文、代码和模型已在GitHub和Hugging Face平台公开,为学术界和工业界的研究者提供了宝贵的资源,为未来图像编辑技术的发展奠定了坚实基础。

这一技术的问世,不仅推动了多模态领域的技术进步,更为图像编辑技术开辟了全新的可能性。通过将强化学习与视觉处理深度融合,UniWorld-V2展现了人工智能在创意领域的无限潜力,预示着未来图像编辑将更加智能、高效和人性化。论文地址:https://arxiv.org/abs/2510.16888GitHub链接:https://github.com/PKU-YuanGroup/UniWorld

最新快讯

2025年11月07日

11:58
今年8月中旬,@影视飓风 创始人Tim完成了一场震撼人心的100小时荒岛直播,旗下账号@飓多多StormCrew 分别在B站与抖音同步开播,无间断地记录下这场极限生存挑战。据B站官方数据,这场直播累计观看次数高达1.69亿次,期间4150万B站用户涌入直播间实时互动。在这场现象级的互联网狂欢中,或许鲜有人注意到,Tim身上穿的短袖来自@影视飓风 自有品牌,该...
11:58
今年双11,奥康鞋业的客服团队迎来了前所未有的高效与从容。9月份,奥康成功升级了店小蜜5.0客服Agent,这一智能客服系统不仅将客服问题解决率提升至80%,更将答非所问率压减至仅5%,实现了客服服务质量与效率的双重飞跃。这一转变并非孤例,纳艾森家具负责人彭怀安也分享了类似的体验,他再也不用熬夜整理经营数据,因为“生意管家”的大促小助理只需3分钟就能生成完整...
11:57
工业自动化领域迎来重磅消息,领先的解决方案提供商阿尔赛克近日成功完成数千万元Pre-A轮融资。此次融资由知名投资机构明势创投与同创伟业联合领投,相城金控积极参与跟投,领甪资本则担任独家财务顾问,为公司的快速发展注入强劲动力。 作为工业以太网解决方案的核心企业,阿尔赛克专注于为智能制造提供高效可靠的数字化网络架构。其产品线覆盖了PROFINET、EtherCA...
11:57
2025年11月6日,深圳核心医疗科技股份有限公司正式宣布其IPO材料已获上海证券交易所受理,计划发行不超过9000万股股票,目标登陆科创板。作为人工心脏研发领域的领军企业,公司凭借全周期、多人群的产品矩阵战略,在高端医疗器械市场树立了显著地位。其核心产品Corheart®6作为全球体积最小的商业化磁悬浮人工心脏,凭借卓越性能在2024年实现超45%的市场占...
11:57
2025年11月6日,泉州嘉德利电子材料股份公司传来振奋人心的消息,其首次公开发行股票招股说明书正式获得上海证券交易所受理,标志着这家专注于电子材料领域的创新企业即将迈入主板上市的新征程。根据披露信息,本次IPO计划发行股份数量介于4,590.7505万股至10,329.1885万股之间,预计募集资金总额约为12.17亿元人民币,这一资金将重点投向四大核心领...
11:57
中国铁路部门近日宣布对全国130余条高铁线路的1300余趟动车组列车实施市场化票价机制,最大优惠幅度可达4折,为旅客带来前所未有的出行实惠。此次调价充分考虑了区域差异、淡旺季波动以及不同时段的客流特点,通过精准的票价策略,有效提升高铁服务的市场竞争力。 针对旅时较长、客座率偏低的列车,铁路部门将推出较大幅度的折扣优惠,而旅速较快、供不应求的线路则保持较小折扣...
11:57
最新消息显示,三星下一代旗舰Galaxy S26 Ultra将在影像系统和充电技术方面迎来重大突破,为用户带来更出色的使用体验。据行业消息源@chunvn8888独家爆料,这款备受瞩目的旗舰机型将全面升级其影像硬件配置,特别是在主摄和视频录制方面实现显著提升。 在影像系统方面,Galaxy S26 Ultra将搭载全新的1200万像素S5K3LD传感器,相较...
11:57
立中集团今日正式发布重要公告,宣布将斥资7809.41万元人民币对旗下核心研发机构——立中新能源实施现金增资。作为新能源领域的深耕者,立中新能源长期致力于锂电池、钠离子电池关键新材料以及氟盐系列产品的高效研发与规模化生产。此次战略性的资金注入,不仅将显著增强企业在新能源材料领域的技术研发实力,还将有力推动其产能建设的加速进程,为集团在新能源产业链中的领先地位...
11:57
2025年11月7日,浙江乌镇,世界互联网大会乌镇峰会现场迎来一场人工智能技术的盛宴。蚂蚁集团在此隆重发布其自主研发的百灵大模型家族系列产品,向全球展示其在通用人工智能领域的最新突破与前瞻成果。这一系列产品的问世,不仅彰显了蚂蚁集团在AI领域的深厚技术积累,更标志着中国在人工智能发展赛道上的新里程碑。 百灵大模型家族目前已涵盖18款不同功能定位的AI模型,全...
11:57
洋河股份近日公布的2025年第三季度报告揭示了公司业绩的显著变化。数据显示,公司前三季度营业收入达到180.9亿元,较去年同期大幅下滑34.26%。归母净利润更是锐减至39.75亿元,降幅高达53.66%。其中,第三季度表现尤为疲软,公司录得3.69亿元的净亏损,而去年同期同期仍保持6.31亿元的盈利。面对这样的业绩下滑,洋河股份坦诚表示,主要受白酒市场整体...
11:57
11月6日,中国金融监管体系迎来重大调整,辽宁、黑龙江、大连及北京等多地金融监管局陆续批准了原锦州银行多家支行的名称变更申请。这一系列变更的核心内容涉及沈阳、哈尔滨、大连、北京等分行,这些分行正式降格为支行,并更名为中国工商银行相应分支机构。与此同时,原锦州银行旗下剩余的154家支行也同步完成更名,全部转型为中国工商银行支行。 此次调整的背后,是中国工商银行...
11:57
11月6日,医药板块传来重磅消息,新诺威(SZ300765)正式宣布以11亿元人民币现金收购石药集团恩必普药业所持有的巨石生物29%股权。此次交易完成后,新诺威对巨石生物的控股比例将显著提升至80%,进一步巩固其在生物制药领域的领先地位。值得注意的是,新诺威此次增持的总出资额已达到16.33亿元,且工商变更登记手续已全部完成,标志着双方合作关系的深化与战略协...