昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术

昆仑万维集团在备受瞩目的SkyWork AI技术发布周第三天,正式向全球开发者与研究者开源其最新研发的「Skywork UniPic2.0」统一多模态模型。这一具有里程碑意义的发布,不仅标志着多模态人工智能领域迈入新纪元,更代表着该技术生态的又一次重大突破。Skywork UniPic2.0作为一个面向统一多模态建模的高效训练与推理框架,通过创新性地整合生成与编辑模块的轻量化设计,以及多模态理解模型的联合训练机制,成功构建了集理解、生图、编辑于一体的核心能力体系。该模型致力于实现“高效、高质、统一”的多模态生成目标,为人工智能应用开辟了更广阔的可能性。

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术插图1

Skywork UniPic2.0模型架构由三大核心模块协同构成:生图编辑模块、统一模型能力模块以及生图编辑后训练模块。这一设计基于先进的SD3.5-Medium架构,将原本仅支持文本输入的传统模型升级为同时兼容文本与图像输入的双重输入模型,显著扩展了生图能力至生图与编辑的双重功能。通过冻结生图编辑模块,并引入多模态模型Qwen2.5-VL-7B与Pre-Train连接器,成功构建出理解生成编辑一体化能力框架。在此基础上,通过连接器与生图编辑模块的联合微调,最终实现了真正意义上的一体化理解、生图、编辑模型,为多模态AI应用提供了前所未有的技术支持。

此次Skywork UniPic2.0的开源举措,不仅向全球开发者与研究者提供了全面的技术平台,涵盖模型权重、推理代码、强化策略等全部技术资源,更在技术指标上实现了超越性突破。其生成模块基于2B参数的SD3.5-Medium架构进行深度训练,在生图和编辑指标上超越了众多具有更大参数量的同类模型。此外,该模型创新性地引入了强化学习机制,基于Flow-GRPO首创的渐进式双任务强化策略,有效提升了模型对复杂指令的理解能力,并显著增强了图像生成与编辑的一致性,为多模态AI应用带来了质的飞跃。

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术插图2

项目主页:https://unipic-v2.github.io/
技术报告:https://github.com/SkyworkAI/UniPic/blob/main/UniPic-2/assets/pdf/UNIPIC2.pdf
GitHub地址:https://github.com/SkyworkAI/UniPic/tree/main/UniPic-2
HuggingFace Gradio:https://huggingface.co/spaces/Skywork/UniPic2-Metaquery
HuggingFace Model:https://huggingface.co/Skywork/UniPic2-SD3.5M-Kontext-2B; https://huggingface.co/Skywork/UniPic2-Metaquery-9B

最新快讯

2025年08月13日

11:46
近日,备受瞩目的孤岛生存100小时挑战正式拉开帷幕,由知名影视制作人、视频博主Tim领衔发起。这场极限生存实验不仅全程网络直播,更将野外生存的诸多真实场景——如取火、建庇护所、寻水觅食——以第一视角形式呈现,让观众仿佛置身荒野,沉浸式体验生存挑战的惊心动魄。据悉,Tim此次冒险的舞台选在浙江杭州三白潭的一座孤岛,该地生态环境高度还原野外生存场景,被网友誉为"...
11:46
声明:本文源自微信公众号数字生命卡兹克,作者数字生命卡兹克授权站长之家转载发布。此前我曾分享过一款名为Minimax的Agent,这款工具凭借其卓越的能力和出色的表现给我留下了深刻印象。然而文章发布后,评论区几乎众口一词地指向了同一个问题——贵。我个人在Minimax Agent上的投入已近250美元,每一次不满意的结果都意味着金钱的损失,这让我深感肉疼。尽...
11:46
OpenAI近期对ChatGPT进行了重大升级,全面优化了模型选择、速率限制及交互体验,旨在为用户提供更智能、更便捷的AI服务。根据AIbase最新整理的信息,此次更新不仅重新启用GPT-4o作为默认模型,还在GPT-5中引入了多种模式选择,同时显著提升了AI的个性表现,使其更加温暖、亲切。这一系列改进为用户带来了前所未有的灵活性和高效性,让AI交互体验迈上...
11:46
8月13日,天津市住房公积金管理中心发布一项重要新政,为符合条件的缴存人及其配偶提供更灵活的公积金使用方案,允许提取公积金用于支付存量房的首付款。这一举措标志着天津市在优化住房金融服务、降低购房门槛方面迈出关键一步。 新政明确规定,申请提取公积金支付存量房首付的缴存人需满足以下条件:首先,在本市范围内通过公积金贷款或商业按揭贷款方式购买存量房屋;其次,必须在...
11:46
荣耀官方于北京时间2025年8月13日惊喜官宣,备受期待的新款折叠屏旗舰手机荣耀Magic V Flip2将于8月21日正式亮相。这款手机以"小高定,大自拍"为核心宣传口号,彰显其独特魅力与强大功能。作为荣耀在折叠屏领域的又一力作,该产品将全面革新影像系统、优化外观设计并提升续航表现,进一步巩固荣耀在高端手机市场的领先地位。此次新品发布不仅展现了荣耀对技术创...
11:46
2025年8月13日,领先的AI计算平台优刻得正式宣布与国内顶尖大模型厂商智谱AI达成战略合作协议。此次合作将聚焦于模型部署优化、云端服务体系升级以及行业应用场景落地三大核心领域,共同开启AI技术落地的新篇章。 作为双方合作的重点成果,优刻得将全面集成智谱AI的GLM-4.5及GLM-4.5V大模型技术,将其深度嵌入自研的UModelVerse平台中。通过这...
11:46
2025年8月13日,航运市场迎来剧烈波动,集运指数(欧线)期货主力合约遭遇重挫,跌幅超过5%,最终收报1341点。这一显著下滑不仅揭示了市场对集装箱运输需求可能出现转弱,更暗示了行业对未来收益前景的担忧加剧。多位行业分析师指出,当前跌势的背后,是多重复杂因素交织的结果。一方面,全球经济复苏步伐放缓,导致国际贸易活动减弱,直接压缩了集装箱运输的需求空间;另一...
11:46
2025年8月13日,阅文集团股价迎来惊人飙升,单日涨幅超过15%,创近期新高。这一强劲表现不仅彰显了资本市场对该公司的极度信心,更折射出市场对阅文集团未来发展的乐观预期。作为数字内容领域的领军者,阅文集团的业务表现始终是投资者关注的焦点。此次股价大幅上涨,无疑是对其近期战略布局和业务成果的高度认可。分析人士普遍认为,阅文集团凭借其在网络文学、影视制作等领域...
11:46
8月13日,港股市场中的苹果概念股迎来一波强劲的上涨行情,整体呈现出震荡上扬的态势。在这一轮行情中,多家相关企业表现尤为亮眼,其中鸿腾精密(FIT HON TENG)表现最为突出,盘中股价一度飙升超过17%,最高价达到4.48港元,显示出市场对其未来发展的浓厚兴趣。另一家重要企业丘钛科技同样录得显著涨幅,股价上涨幅度超过8%,进一步印证了苹果产业链股的集体躁...
11:46
2025年8月13日清晨,资本市场交易数据揭示了一个显著现象:医药板块遭遇主力资金净流出,金额高达24亿元以上,使其成为当日资金流出最为严重的行业之一。这一数据反映出市场对该板块短期内的信心有所波动。与之形成鲜明对比的是,通信板块和非银金融板块则吸引了大量资金净流入,显示出市场对这两大领域的乐观预期。 在个股层面,杭钢股份表现抢眼,全天强势涨停,主力资金净买...
11:46
2025年8月13日,商务部在国新办新闻发布会上发布最新消费趋势报告,指出随着居民可支配收入的稳步增长,我国消费结构正经历一场深刻变革,逐步从传统的商品消费主导向服务消费主导时代迈进。商务部服务贸易和商贸服务业司负责人王波在会上强调,这一转变趋势已十分明显,当前家庭在健身休闲、文化旅游、教育培训、医疗健康等服务领域的支出总额已超过商品消费支出,展现出服务消费...
11:46
8月12日,小红书内部传来重要组织调整消息,正式宣布成立大商业板块,由资深高管柯南出任总负责人。此次战略布局的核心目标在于强化商业化广告与交易业务的协同效应,通过优化内部协作机制,实现资源整合与效率提升。据多位知情人士透露,此次调整并非简单的部门合并,而是旨在构建更为紧密的深度合作关系,让商业部与交易部在保持一级部门设置不变的前提下,进一步打通业务链路,形成...