昆仑万维开源Skywork UniPic模型 融合图像生成与理解能力

昆仑万维重磅发布自回归路线的「多模态统一预训练模型 Skywork UniPic」,并正式开源,为人工智能领域带来突破性进展。这款创新模型集成了图像理解、文本生成图像(T2I)和图像编辑三大核心功能于一体,展现了人工智能技术的最新突破。Skywork UniPic 的核心优势在于基于海量高质量数据进行端到端的预训练,使其具备出色的通用性和可迁移性。昆仑万维始终秉持开放合作的理念,用户可通过官方链接免费获取模型权重、技术报告和代码仓库,为开发者和研究者提供便捷的探索平台。

Skywork UniPic 借鉴了 GPT-4o 的自回归范式,通过深度融合图像理解、文本到图像生成和图像编辑任务,构建了真正统一的多模态模型架构。与传统多模态模型不同,Skywork UniPic 采用了创新的 MAR 编码器和 SigLIP2 结构设计,显著提升了模型在理解、生成和编辑任务上的综合表现。该模型支持图文理解、图像生成和图像编辑等多种功能,用户只需输入简单提示词,即可实现图像内容理解、新图像生成,甚至风格转绘等高级编辑操作。其便捷的操作性和强大的功能,迅速在开发者群体中引发广泛关注。

Skywork UniPic 以 1.5B 的轻量级参数规模,实现了媲美大型模型的卓越性能,完美诠释了“小而美”的技术设计理念。在各类权威评估中,该模型表现亮眼,尤其在指令遵循、复杂指令生成和图像编辑方面展现出超凡的执行能力。为确保 Skywork UniPic 的高性能,团队构建了精细化的数据构建和训练体系,通过精选训练数据和创新的奖励模型,持续优化模型表现。多阶段训练和渐进式任务引入机制,不仅大幅提升模型的理解和生成能力,还有效克服了多任务训练中的常见挑战。

昆仑万维开源Skywork UniPic模型 融合图像生成与理解能力插图1

Skywork UniPic 的发布为多模态人工智能模型的实用化应用开辟了新路径,显著降低了技术门槛,激励更多开发者投身这一前沿领域。以下是获取 Skywork UniPic 的官方资源链接:

模型权重:https://huggingface.co/Skywork/Skywork-UniPic-1.5B
技术报告:https://github.com/SkyworkAI/UniPic/blob/main/UNIPIC.pdf
代码仓库:https://github.com/SkyworkAI/UniPic

划重点:
? Skywork UniPic 是昆仑万维推出的开源多模态统一预训练模型,集成了图像理解、生成和编辑功能。
? 模型采用 1.5B 的轻量级设计,性能接近大型模型,便于开发者快速上手。
? 通过精细化的数据构建和多阶段训练,Skywork UniPic 在各类评估中表现卓越,推动多模态人工智能技术迈向新高度。

最新快讯

2026年03月04日

09:31
3月3日晚,在2026年总台元宵联欢晚会上,主持人撒贝宁遭遇了一场超逗的“意外”,把观众们笑得前仰后合。当时,撒贝宁正在舞台上全情投入地主持节目,突然,节目组“搞事情”,亮出了他春晚同款“老鼠干”表情包的实体道具。这突如其来的一幕,让撒贝宁瞬间愣住,紧接着他双手抱头,表情失控,整个人就像被定住了一样,那反应呆萌又搞笑,喜剧效果直...
09:31
微新创想3月4日消息,小米官方今日发布公告,新一代小米SU7实车已陆续抵达全国143个城市的492家门店。这款备受瞩目的新车预计将于4月正式上市,目前的预售价格为22.99万元起。新一代小米SU7在安全配置上进行了系统性的全面强化。全系标配了2200MPa超强钢材质的内嵌式防滚架,结构完整覆盖从A柱到C柱的关键区域。此外,车辆还...
09:31
针对日益严重的AI使用安全性及心理健康争议,OpenAI于当地时间 3 月 3 日宣布,将在ChatGPT中引入一项名为“可信联系人”的新功能。该功能允许成年用户指定一位紧急联系人,当系统检测到用户在使用聊天机器人过程中出现心理健康危机时,将自动向其发送警报通知。这一功能的推出背景颇为沉重。据不完全统计,OpenAI目前正面临至少 13 起独立的消费者安全诉...
09:31
中国大模型正在全球开发者社区掀起一场名为“性价比”与“工程化”的狂暴飓风。2026 年 3 月 3 日,根据全球最大的 API 聚合平台 OpenRouter 的最新数据,国产大模型展现了前所未有的统治力:MiniMax M2.5 的调用量位居全球第一,而排在其后的分别是 Kimi K2.5 和 GLM-5。这一“国产三强”霸榜前三的局面,标志着在 AI 应...
09:31
2026年3月4日,全国人大代表、小米集团董事长兼CEO雷军正式提交五份建议,重点聚焦通用人形机器人、智能驾驶安全、科技公益及人才培养等前沿领域,旨在通过政策与技术标准协同,加速我国AI与智能制造产业的深度融合。雷军在建议中指出,人形机器人作为继智能手机、新能源汽车后的颠覆性产品,正处于从实验室走向产业化的关键期。尽管我国在技术领域具备先发优势,但工艺稳定性...
09:31
继 ChatGPT 和 Claude 网页版相继推出语音交互后,AI 编程领域也迎来了“动嘴”革命。当地时间3月3日,AI 巨头 Anthropic 宣布为其面向开发者的命令行工具 Claude Code 正式引入语音模式。这意味着开发者现在可以跳过键盘,直接通过语音指令让 AI 执行复杂的编程任务。据 Anthropic 工程师 Thariq Shihip...
09:31
Google DeepMind 近日正式发布 Gemini3.1Flash-Lite 预览版,标志着 Gemini3系列中速度最快、性价比最高的成员面世。作为 Gemini2.5Flash-Lite 的迭代产品,新模型在保持每秒超360个 token 的极速输出及5.1秒平均响应时间的基础上,实现了智能水平的显著跨越。根据 Artificial Analys...
09:31
当人工智能掌握了核武器的“发射按钮”,世界会变得更安全吗?伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示,在模拟核危机场景中,大语言模型(LLM)更倾向于升级冲突,甚至在 95% 的推演情境中都选择了部署或使用核武器。图源备注:图片由AI生成,图片授权服务商Midjourney这项研究调用了当前全球最尖端的三个 AI 模型:GP...
09:31
微新创想:谷歌智能家居(Google Home)正迎来一场彻底改变“看家”逻辑的重大升级。2026年3月2日,谷歌家居负责人阿尼什·卡图卡兰在社交平台宣布,多项基于Gemini大模型的深度优化正式向用户推送。其中最令业界震撼的,是名为“Live Search(实时搜索)”的功能。这意味着你的Nest摄像头从此拥有了“大脑”,能够实时理解正在发生的画面,而非仅...
09:31
微新创想:3月3日,阿里巴巴创始人马云与蔡崇信、吴泳铭等核心管理层现身杭州云谷学校,就AI时代的机遇与挑战同师生展开深入交流,释放出阿里巴巴集团及蚂蚁集团全面加码AI战略的明确信号。马云在交流中指出,AI时代的加速到来将对社会产生深远冲击,而青少年群体作为未来的希望,更需具备应对技术变革的能力。 此次阿里与蚂蚁两集团管理层罕见聚齐,旨在分享阿里巴巴近期在AI...
08:39
微新创想:3月4日前,中科院光电所联合多家单位在云南丽江高美古观测站开展星地激光通信试验。此次试验依托自主研制的1.8米地面站,团队成功与地球同步轨道卫星建立稳定激光链路。在40740.96公里的最远距离下,实现了上下行对称1Gbps的双向高速通信。 微新创想:试验过程中,建链仅需4秒,链路连续稳定运行超过3小时。这一突破性表现不仅验证了激光通信在超远距离下...
08:39
微新创想:2026年3月3日,特斯拉柏林超级工厂生产负责人安德烈·蒂里希在领英上发布声明,否认德国《商报》关于该工厂2025年仅生产14.9万辆Model Y以及仅0.74%利润率的报道。蒂里希明确表示,2025年的实际产量已超过20万辆,并且各季度之间呈现出持续增长的趋势。此外,他提到自2022年工厂正式投产以来,累计生产量已突破70万辆。 蒂里希还强调,...