昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术

昆仑万维集团在备受瞩目的SkyWork AI技术发布周第三天,正式向全球开发者与研究者开源其最新研发的「Skywork UniPic2.0」统一多模态模型。这一具有里程碑意义的发布,不仅标志着多模态人工智能领域迈入新纪元,更代表着该技术生态的又一次重大突破。Skywork UniPic2.0作为一个面向统一多模态建模的高效训练与推理框架,通过创新性地整合生成与编辑模块的轻量化设计,以及多模态理解模型的联合训练机制,成功构建了集理解、生图、编辑于一体的核心能力体系。该模型致力于实现“高效、高质、统一”的多模态生成目标,为人工智能应用开辟了更广阔的可能性。

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术插图1

Skywork UniPic2.0模型架构由三大核心模块协同构成:生图编辑模块、统一模型能力模块以及生图编辑后训练模块。这一设计基于先进的SD3.5-Medium架构,将原本仅支持文本输入的传统模型升级为同时兼容文本与图像输入的双重输入模型,显著扩展了生图能力至生图与编辑的双重功能。通过冻结生图编辑模块,并引入多模态模型Qwen2.5-VL-7B与Pre-Train连接器,成功构建出理解生成编辑一体化能力框架。在此基础上,通过连接器与生图编辑模块的联合微调,最终实现了真正意义上的一体化理解、生图、编辑模型,为多模态AI应用提供了前所未有的技术支持。

此次Skywork UniPic2.0的开源举措,不仅向全球开发者与研究者提供了全面的技术平台,涵盖模型权重、推理代码、强化策略等全部技术资源,更在技术指标上实现了超越性突破。其生成模块基于2B参数的SD3.5-Medium架构进行深度训练,在生图和编辑指标上超越了众多具有更大参数量的同类模型。此外,该模型创新性地引入了强化学习机制,基于Flow-GRPO首创的渐进式双任务强化策略,有效提升了模型对复杂指令的理解能力,并显著增强了图像生成与编辑的一致性,为多模态AI应用带来了质的飞跃。

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术插图2

项目主页:https://unipic-v2.github.io/
技术报告:https://github.com/SkyworkAI/UniPic/blob/main/UniPic-2/assets/pdf/UNIPIC2.pdf
GitHub地址:https://github.com/SkyworkAI/UniPic/tree/main/UniPic-2
HuggingFace Gradio:https://huggingface.co/spaces/Skywork/UniPic2-Metaquery
HuggingFace Model:https://huggingface.co/Skywork/UniPic2-SD3.5M-Kontext-2B; https://huggingface.co/Skywork/UniPic2-Metaquery-9B

最新快讯

2026年01月14日

08:43
近日,江苏发生的一起家庭事件引发广泛关注并登上热搜。一位妻子因全心照顾孩子请假频繁,导致年终奖被扣除。然而,家人的暖心举动却让这份失落化为满满的感动,同时也引发了社会对于家庭责任分工与职场权益的深度讨论。据悉,这位妻子在育儿过程中投入了大量精力,频繁请假虽属无奈,却还是影响了年终奖的发放。得知此事后,丈夫毫不犹豫地转账8000元...
08:43
近日,贵州施秉的一场婚礼上,一段展示新娘满屋嫁妆的视频在网络上引发广泛关注。画面中,一张床上整齐陈列着数十套精致的衣服和首饰,令人目不暇接。据刘先生介绍,这些嫁妆是新娘母亲自女儿年幼时起,便开始一针一线亲手缝制,历经20年时光积累而成。每一件衣物、每一件首饰,都凝聚着新娘母亲的心血与爱意,同时也得到了新娘父亲的大力支持。这份沉甸...
08:43
近日,一位 23 岁女孩夏夏的抗癌故事在网络上引发广泛关注。据媒体报道, 2021 年 6 月,夏夏被确诊患有骨肉瘤,这是一种成骨间叶细胞产生的原发恶性骨或软组织肿瘤,也是最常见的骨恶性肿瘤之一,约占所有恶性骨肿瘤的34%,好发于 10 至 30 岁的年轻人,且男性患者多于女性。面对突如其来的重病,夏夏展现出了惊人的勇气和乐观。...
08:43
马年贺岁纪念币与纪念钞正式开放预约,这一消息迅速点燃了民众的热情,相关话题瞬间冲上微博热搜前五,其中“马年纪念币预约”与“马年纪念币抢不到”更是强势霸榜前二,足见其受欢迎程度。据悉,此次发行的 2026 年贺岁币发行量达 1 亿枚,每枚面额为 10 元; 2026 年贺岁钞发行量同样为 1 亿张,每张面额 20 元。在预约兑换规...
08:12
2026年1月13日,苹果加拿大发布创意广告SLIDE,宣传iPhone 17系列搭载的第二代超瓷晶面板。广告模拟法律谈判场景,律师将iPhone 17 Pro Max屏幕朝下在桌面反复滑行并撞击,展示其耐用性。最终标语“放轻松,这可是iPhone 17”强调产品可靠性。苹果称,新屏幕抗划痕能力达前代iPhone 16的三倍,得益于Ceramic Shie...
08:12
2026年,宝马M部门将推出首款全面电动化的高性能车型,或将命名为iM3。新车基于新世代技术打造,采用四电机独立驱动、专属电池系统及“Heart of Joy”控制核心,动力响应显著提升。车辆配备模拟换挡模式,增强驾驶参与感,并应用Bcomp天然纤维材料,降低碳排放约40%。此举标志着宝马M正式进军纯电高性能领域。
08:12
2026年1月13日,苹果宣布调整软件生态策略,旗下Pages、Numbers、Keynote和Freeform四款应用将结束完全免费时代,转为“免费增值”模式。用户可继续免费使用基础功能,包括文档创建、编辑与协作;但高级功能如AI智能工具、高级模板及“内容中心”的高品质素材库需订阅“Apple Creator Studio”解锁。此举旨在提升专业用户创作...
08:12
2026年1月29日,备受瞩目的全新奔驰S级将揭开神秘面纱,而豪华旗舰迈巴赫版S级也将在随后登场。本次改款阵容堪称一次全面的革新,工程师们对约2700项部件进行了精心升级,从外观设计到内饰配置,从智能科技到动力系统,无不彰显着梅赛德斯-奔驰对卓越品质的不懈追求。 此次改款最引人注目的莫过于动力系统的全面升级。全新S450和S500车型将搭载先进的M256 E...
08:12
2026年1月13日,苹果在发布新应用的同时透露,iOS版Pixelmator将不再获得更新。该应用原为2014年推出的Mac版Pixelmator Classic配套工具,现被标记为“经典版”,虽仍可使用基础修图功能,但已停止维护。与此同时,同团队开发的Photomator应用则将继续独立销售并获得后续更新支持。此举标志着苹果对图像编辑产品线的一次调整,...
08:12
2026年1月14日,美国科罗拉多斯普林斯市警方正式宣布启用一项创新执法技术——自动车辆识别系统(AVIS),该系统不仅具备移动测速功能,更将大幅提升交通管理效率。据悉,首批配备该系统的警车已选用两辆Jeep大切诺基,将在城市多个重点区域进行流动执法。这些高精尖设备将重点监控学校周边、公园入口、施工现场以及居民生活区等关键路段,确保交通安全与秩序。 根据警方...
08:12
2026年1月12日,德国与英国顶尖科学家团队正式宣布达成一项突破性合作,计划利用欧洲首台E级超级计算机“木星”进行史上规模最大的人脑模拟实验。这一雄心勃勃的项目旨在通过超大规模计算模拟,彻底揭示人脑复杂的运作机制,为神经科学领域带来革命性突破。据项目组介绍,高精度模拟将涵盖人脑从神经元到神经网络的多尺度交互过程,有望填补当前认知科学研究的诸多空白。 该项目...
08:12
2026年1月14日,我国自主研发的首台海底地层空间钻探与监测机器人在南海成功完成试验作业,这一重大突破标志着我国深海勘探技术迈入新纪元。该设备由广州海洋地质调查局精心研制,具备深海立体钻探与原位实时监测的核心功能,为我国深海资源开发提供了强有力的技术支撑。 此次试验作业在南海复杂海底环境中展开,充分验证了机器人的自主作业能力与稳定性。作为我国深海科学钻...