昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术

昆仑万维集团在备受瞩目的SkyWork AI技术发布周第三天,正式向全球开发者与研究者开源其最新研发的「Skywork UniPic2.0」统一多模态模型。这一具有里程碑意义的发布,不仅标志着多模态人工智能领域迈入新纪元,更代表着该技术生态的又一次重大突破。Skywork UniPic2.0作为一个面向统一多模态建模的高效训练与推理框架,通过创新性地整合生成与编辑模块的轻量化设计,以及多模态理解模型的联合训练机制,成功构建了集理解、生图、编辑于一体的核心能力体系。该模型致力于实现“高效、高质、统一”的多模态生成目标,为人工智能应用开辟了更广阔的可能性。

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术插图1

Skywork UniPic2.0模型架构由三大核心模块协同构成:生图编辑模块、统一模型能力模块以及生图编辑后训练模块。这一设计基于先进的SD3.5-Medium架构,将原本仅支持文本输入的传统模型升级为同时兼容文本与图像输入的双重输入模型,显著扩展了生图能力至生图与编辑的双重功能。通过冻结生图编辑模块,并引入多模态模型Qwen2.5-VL-7B与Pre-Train连接器,成功构建出理解生成编辑一体化能力框架。在此基础上,通过连接器与生图编辑模块的联合微调,最终实现了真正意义上的一体化理解、生图、编辑模型,为多模态AI应用提供了前所未有的技术支持。

此次Skywork UniPic2.0的开源举措,不仅向全球开发者与研究者提供了全面的技术平台,涵盖模型权重、推理代码、强化策略等全部技术资源,更在技术指标上实现了超越性突破。其生成模块基于2B参数的SD3.5-Medium架构进行深度训练,在生图和编辑指标上超越了众多具有更大参数量的同类模型。此外,该模型创新性地引入了强化学习机制,基于Flow-GRPO首创的渐进式双任务强化策略,有效提升了模型对复杂指令的理解能力,并显著增强了图像生成与编辑的一致性,为多模态AI应用带来了质的飞跃。

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术插图2

项目主页:https://unipic-v2.github.io/
技术报告:https://github.com/SkyworkAI/UniPic/blob/main/UniPic-2/assets/pdf/UNIPIC2.pdf
GitHub地址:https://github.com/SkyworkAI/UniPic/tree/main/UniPic-2
HuggingFace Gradio:https://huggingface.co/spaces/Skywork/UniPic2-Metaquery
HuggingFace Model:https://huggingface.co/Skywork/UniPic2-SD3.5M-Kontext-2B; https://huggingface.co/Skywork/UniPic2-Metaquery-9B

最新快讯

2025年11月28日

14:45
微新创想11月28日重磅消息,一加手机中国区总裁正式宣布,全新一加Ace 6T将全球首次搭载8300mAh冰川电池与100W超级闪充技术,这一创新成果使其成为当前手机市场中唯一同时拥有超大电池容量与百瓦级快充能力的旗舰机型。长期以来,大电池与快充在手机设计中始终存在难以兼顾的矛盾。追求大电池意味着牺牲快充速度,而选择快充方案又往往导致电池容量被压缩。这种两难...
14:45
微新创想11月28日讯 从山东菏泽单县朱楼村出发,57岁的“大衣哥”朱之文正迎来他人生的新篇章。这位因2011年《星光大道》而走红的农民歌手,至今仍坚守着与土地的深情连接,用歌声传递着质朴的力量。 作为家喻户晓的明星,朱之文始终保持着农民本色。他常穿的那件军绿色大衣,早已成为他鲜明的个人标识。成名后,他选择扎根故土,但随之而来的争议也从未间断。围绕他的“炒作...
14:45
AR眼镜用户刚询问"对面是什么楼",后端MLLM-SC框架便在10毫秒内生成一张语义注意力热图。建筑轮廓被标注为深红色并赋予最高优先级,而其他背景信息则被降低编码率。这种创新的多模态数据处理方式彻底改变了传统信息处理的模式,不再对所有数据"平均用力",而是通过语义引擎精准识别并优先处理与任务相关的像素、语音和坐标数据,让这些关键信息走"快车道",同时自动降档...
14:45
ICLR 2026 学术会议正面临一场前所未有的挑战——AI技术大规模渗透其审稿系统,引发学术界的广泛关注和担忧。根据第三方机构最新检测报告显示,在ICLR 2026收到的7.6万份评审意见中,高达21%的评审完全由大型语言模型一键生成,另有35%的评审意见被AI不同程度地润色修改,真正由人类专家独立撰写的比例已锐减至43%。这一数据揭示了AI技术在学术评审...
14:45
11月27日,备受瞩目的AI社交平台Soul App正式向香港交易所递交招股书,正式宣告进军资本市场,中信证券作为独家保荐人全程保驾护航。Soul App以其独特的基于兴趣与个性的沉浸式社交模式,迅速在年轻用户群体中掀起热潮。截至2025年8月31日,平台累计注册用户已突破3.9亿大关,日均活跃用户达到惊人的1100万,其中高达78.7%的用户属于Z世代这一...
14:45
2025年11月17日夜晚,意大利阿尔卑斯山脉上演了一场罕见的自然奇观——罕见的“ELVE”红色光环现象在雷暴云层之上绚烂绽放。摄影师Valter Binotto凭借其精湛的技艺,利用索尼A7S相机搭配20mm f/1.8超广角镜头,在距离雷暴中心约300公里的山巅成功定格了这一转瞬即逝的发光事件。这一现象由强烈负极闪电产生的电磁脉冲猛烈撞击电离层引发,形成...
14:45
近日,中信证券最新研报发布,明确指出2025年将成为具身智能商业化进程中的关键转折点。报告特别强调,随着多家头部企业成功斩获亿元级大单,具身智能技术正加速从实验室走向实际应用场景。值得注意的是,尽管当前下游制造企业对于大规模订单仍持谨慎态度,整个产业在发展过程中确实面临阶段性瓶颈。然而,在OEM厂商、核心供应链企业以及科技巨头的紧密协同下,机器替代人工的效率...
14:45
2025年11月28日,长安汽车在最新一轮路演活动中重磅发布了其智能汽车机器人技术发展战略,正式官宣将围绕“1+N+X”全新战略框架,全面加速在智能汽车机器人领域的布局。据悉,长安汽车将携手行业领军企业共同研发具有突破性的人形机器人,重点攻克“大脑”智能决策系统、“能源”高效续航技术以及“驱动”精准控制三大核心技术瓶颈,旨在打造具备高度自主性和交互能力的下一...
14:45
2025年11月27日,银轮股份正式宣布完成董事会对外投资议案的审议,并成功获得批准。根据公告内容,公司计划投入约1.33亿元人民币自有资金,通过股权收购与增资扩股相结合的方式,强势控股深圳市深蓝电子股份有限公司,并取得其超过55%的股权。此举标志着银轮股份在数字能源系统领域迈出战略布局的关键一步。 此次投资的核心目标在于整合深蓝电子在控制器、驱动器集成电路...
14:45
天风证券最新研报揭示了中国医美市场的蓬勃发展趋势,指出轻医美项目正成为消费新宠。尽管目前整体渗透率仍落后于成熟市场,但注射类、光电器械、减脂塑形及医美服务等细分领域展现出巨大的增长潜力。在强监管政策持续加码的背景下,行业正经历一场深刻的洗牌,优质企业加速脱颖而出,推动市场迈向健康化、规范化轨道。研报特别强调,规范化管理将成为医美产业实现长期可持续发展的关键驱...
14:45
中信建投最新研报深度剖析了机器人技术领域的最新动态,指出随着技术路线的持续迭代升级,产业链正迎来前所未有的发展机遇。值得注意的是,当前市场参与者日益多元化,投资者更加关注产品性能的突破和客户送样等实质性进展,这些关键指标成为衡量企业竞争力的核心标准。在此背景下,Optimus机器人的正式定型有望引领硬件技术路线走向边际收敛,形成更为清晰的发展方向,而深度配套...
14:45
2025年11月21日,欧洲航天局(ESA)与日本宇宙航空研究开发机构(JAXA)共同宣布了一项重大航天成就——备受瞩目的BepiColombo水星探测器已成功进入抵达水星前的最后一年航程。这一里程碑式的任务自2018年10月发射以来,已经跨越了整整七年的漫长旅程,期间经历了六次精准的水星飞掠,不断调整并优化自身轨道。根据计划,BepiColombo预计将在...