CoMPaSS-FLUX.1模型突破:提升文本到图像生成空间理解能力

近日,一项备受瞩目的研究成果——CoMPaSS-FLUX.1模型正式问世,为图像生成领域带来了革命性的突破。该模型作为基于FLUX.1文本到图像扩散模型的LoRA适配器,专注于提升生成图像中物体空间关系的理解能力,在处理复杂空间关系方面取得了令人惊叹的进展,为AI艺术创作开辟了全新的维度。

CoMPaSS-FLUX.1模型以FLUX.1-dev作为基础架构,采用16级LoRA配置,文件体积约50MB,完美兼容Diffusers框架。其核心功能在于能够生成具有精准空间关系的图像,特别擅长构建需要严格空间排列的构图作品,同时在不牺牲其他生成能力的前提下,大幅增强了空间感知能力。

在性能表现上,CoMPaSS-FLUX.1创造了行业新纪录。根据权威VISOR基准测试显示,该模型的相对提升高达98%;在T2I-CompBench空间测试中,提升幅度达到67%;而在GenEval位置评估中更是实现了131%的惊人改善。更令人惊喜的是,CoMPaSS-FLUX.1在图像保真度方面同样表现出色,FID和CMMD分数均优于基础模型,充分证明其生成质量得到了显著提升。

使用CoMPaSS-FLUX.1时,用户可以参考其优化后的提示系统。该模型在处理空间关系描述时表现尤为出色,特别擅长理解包含明确空间指示词(如”左边”、”右边”、”上面”、”下面”)的提示,或者能够准确解析两个不同物体间明确空间关系的描述(例如”照片中A在B的右边”)。这种精准的空间理解能力,使得模型能够根据文本指令生成构图严谨、空间关系明确的图像作品。

CoMPaSS-FLUX.1模型突破:提升文本到图像生成空间理解能力插图1

在模型训练阶段,CoMPaSS-FLUX.1采用了严格的数据筛选标准。训练数据来自SCOP(空间约束导向配对)数据引擎,包含约28,000个经过精心挑选的物体对。这些数据在视觉重要性、语义区分度、空间清晰度、物体关系复杂性和视觉平衡性等方面均符合严苛标准。训练过程持续24,000步,采用批量大小为4的配置,学习率设定为1e-4,并运用AdamW优化器配合1e-2权重衰减策略,确保了模型训练的高效性和精准性。

huggingface:https://huggingface.co/blurgy/CoMPaSS-FLUX.1

划重点:
🌟 CoMPaSS-FLUX.1模型通过突破性技术显著提升了文本到图像生成时的空间理解能力,尤其在处理复杂物体间关系方面展现出卓越表现
📊 多项权威基准测试结果证明,该模型在空间关系理解方面实现了革命性提升,同时保持高品质图像生成效果
📚 模型训练基于严格筛选的高标准数据集,确保生成图像在空间关系表达和视觉清晰度上达到专业水准

最新快讯

2026年03月05日

19:34
微新创想:2026年3月5日,高途教育科技公司发布截至2025年12月31日的第四季度及全年未经审计财报。数据显示,2025年Q4收入达到16.853亿元,同比增长21.4%。毛利润为11.445亿元,增长20.7%。尽管公司仍处于净亏损状态,但净亏损金额为8418万元,同比收窄37.7%,显示出财务状况的明显改善。 全年来看,高途教育科技公司2025年总收...
19:34
微新创想:2026年3月5日,Akash Systems宣布正式发售首款搭载AMD Instinct MI350X GPU的金刚石冷却AI服务器,由神云科技制造。该服务器首次实现Diamond Cooling技术在AMD Instinct GPU数据中心的商用部署。这一创新技术为高性能计算和人工智能领域带来了全新的散热解决方案。 微新创想:该冷却方案可叠加现...
19:34
微新创想:2026年3月5日,重庆江津福朋喜来登酒店在滨江新城核心商圈正式开业。酒店坐落于风景优美的圣泉湖公园附近,由国际知名的万豪国际集团进行管理。这一新地标不仅为当地增添了高端酒店服务,也为商务人士和游客提供了更优质的住宿体验。 酒店共设有121间客房及套房,每间客房均配备先进的智能入住系统,让客人能够更加便捷地享受入住服务。此外,房间内还设有电动窗帘、...
19:34
微新创想:2026年3月5日,人形机器人企业魔法原子证实创始人兼原CEO吴长征已离职并启动个人创业。事件发生于北京,由公司官方回应确认。吴长征离职后,CTO陈春玉全面接管研发工作。公司表示核心技术团队未发生变动,业务与技术研发均按年度规划稳步推进,整体运营未受明显影响。
19:04
微新创想:3月3日,开发商Weyrdworks宣布,桌面宠物模拟游戏《Weyrdlets: Idle Desktop Pets》将于3月17日正式转为付费模式。玩家可于3月17日前免费入库Steam。 游戏自2024年7月上线以来,凭借独特的玩法和精美的画面赢得了众多玩家的喜爱。经过持续的更新与优化,游戏已逐步发展为一款完整的养成类作品,为玩家提供了丰富的互...
19:04
微新创想:2026年3月5日,广汽丰田宣布在华新能源车型核心供应链已实现本土化。这一举措标志着广汽丰田在新能源领域迈出了重要一步,进一步深化了其在中国市场的布局。 旗下新车铂智7将搭载华为鸿蒙座舱5.0,带来更流畅的交互体验和更智能的车载系统。同时,该车型还配备了Momenta R6智能驾驶辅助系统,提升了车辆的安全性和智能化水平。 此外,铂智7还配备了双腔...
19:04
微新创想:2026年2月第二、三周,中国AI模型周调用量分别达到4.12万亿和5.16万亿Token,连续两周超越美国同期水平。这一数据表明中国在AI领域的应用和部署正在迅速增长,展现出强大的技术实力和市场需求。 OpenRouter数据显示,在当前调用量排名前五的AI模型中,有四款来自中国厂商,合计贡献了85.7%的调用量。这不仅反映了中国企业在AI模型研...
19:04
微新创想:3月5日,*ST松发发布公告披露,其下属公司恒力造船(大连)有限公司与欧洲船东签订了一份关于建造4艘30.6万吨超大型原油运输船的合同。这四艘船舶属于VLCC(超大型原油运输船)类别,总金额预计在4至6亿美元之间。合同签署地点位于大连,签约方为恒力造船与一位未公开身份的欧洲船东。 此次订单金额占公司2024年度经审计主营业务收入的50%以上,被认定...
19:04
微新创想:北京时间2026年3月6日凌晨2点《杀戮尖塔2》将在Steam平台开启抢先体验 本作是Mega Crit开发的续作延续了前作的美术风格并在此基础上进行了全面升级 游戏新增了大量卡牌敌人事件与场景让玩家在探索过程中体验到更多新鲜内容 同时引入了替代章节以及5名可选角色其中包括2名全新角色为游戏增添了更多选择性 还特别加入了4人在线合作模式让玩家能够与...
19:04
微新创想:3月4日,广和通在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC 2026)上宣布率先实现基于MediaTek T930与高通X85/X82平台的功率等级1(PC1)模组技术落地 此次技术突破标志着广和通在5G-A领域迈出了重要一步。通过双平台的协同应用,该模组能够全面支持3Tx/8Rx/L4S等关键技术 3Tx技术有效提升了上行吞吐量,最...
19:04
微新创想:2026年3月5日,哔哩哔哩(B站)在港交所发布2025年第四季度及全年财报。2025年全年净营业额达到303.5亿元,同比增长13%。这一成绩标志着公司在内容生态和用户增长方面取得了显著进展。 微新创想:净利润方面,公司实现了11.9亿元的盈利,与去年同期的亏损13.6亿元形成鲜明对比。经调整净利润为25.9亿元,进一步体现了公司经营状况的改善和...
19:04
微新创想:近日,爱立信联合中国移动在江苏永联村部署了5G-A网络及差异化连接方案。该方案通过引入先进的网络切片技术,实现了对全村无线资源的高效划分,并结合RedCap技术,确保了网络覆盖的全面性和稳定性。这一举措不仅为永联村带来了更优质的通信体验,也为当地数字治理、民生服务以及产业升级提供了强有力的技术支撑。 微新创想:5G-A网络的部署使得村内各类智能应用...