小红书复旦开源InstanceAssemble AI精准图像排版技术

近日,小红书与复旦大学联合宣布在布局控制生成(Layout-to-Image)领域取得突破性进展,正式推出创新技术——InstanceAssemble。这项研究成果旨在攻克AI绘画中困扰已久的“构图难题”,通过革命性机制实现从简单到复杂场景的精准图像生成。据悉,相关技术论文已成功入选人工智能顶级会议NeurIPS2025,标志着该技术获得学术界的高度认可。

在当前AI绘画领域,虽然“文字生成图像”技术已趋于成熟,但在“布局控制生成”方面仍存在明显短板。传统AI往往难以精确遵循用户设定的空间约束(如边界框或分割掩码)来安排画面元素,常见问题包括物体位置对齐误差和语义逻辑脱节。InstanceAssemble技术的问世,正式开启了AI绘画的“精准构图”新纪元。

该技术基于主流的扩散变换器架构,核心创新在于提出“实例拼装注意力”机制。用户在使用时,只需提供每个物体的具体位置标注(边界框)和内容描述,AI即可在指定区域内生成高度符合要求的图像。无论是包含少量元素的简洁画面,还是实例密集的复杂场景,InstanceAssemble都能保持卓越的排版精度和语义一致性。

InstanceAssemble最值得关注的技术特性是其轻量级适配方案。该技术无需对整个大模型进行重新训练,仅需极少的额外参数即可实现现有模型的快速适配。具体而言,适配Stable Diffusion3-Medium模型仅需约3.46%的额外参数,而适配Flux.1模型时参数占比更是低至0.84%。这种高效的设计大大降低了技术应用的门槛。

小红书复旦开源InstanceAssemble AI精准图像排版技术插图1

为了全面评估技术性能,研究团队还同步推出了包含9万个实例的“Denselayout”基准测试集及全新评估指标体系。这一举措将推动行业对布局控制生成技术的标准化评估进程。目前,InstanceAssemble已在GitHub完成开源,开发者可免费获取源代码和预训练模型,为设计、广告及内容创意行业带来巨大应用潜力。

github:https://github.com/FireRedTeam/InstanceAssemble

划重点:🎯 精准排版控制:通过“实例拼装注意力”机制,让AI能够严格按照用户设定的位置生成物体,完美支持从稀疏到密集的复杂布局需求。⚡ 极低适配成本:采用轻量化设计理念,无需重训全模型,仅需不足1%至4%的额外参数即可适配Flux.1或SD3等主流模型。🔓 全面开源共享:项目已在GitHub开源并提供预训练模型,同时发布了全新的测试基准集Denselayout以推动行业评估标准化进程。

最新快讯

2025年12月26日

15:56
微新创想12月26日消息,今日,荣耀WIN系列正式发布,新机全系搭载10000mAh巨无霸青海湖电池,首次将行业电池容量带入万级”时代,出门无需再携带充电宝,彻底告别电量焦虑。根据荣耀在发布会上公布的数据,荣耀WIN可以连续刷31小时短剧、连续追番40集,或连续排位50把。此外,新机还搭载荣耀都江堰电源管理系统和能效增强芯片HO...
15:56
微新创想12月26日消息,在小米17 Ultra发布会上,小米集团总裁对移动影像的未来给出了两个断言。一是LOFIC会是未来的技术方向,其超高动态范围解决了移动影像长期无法解决的明暗对比大的场景拍摄问题,一定会有更多产品跟进。二是2亿像素连续光学变焦是移动影像长焦的趋势方案,高像素/大底/连续光变解决了中焦和长焦高画质不可兼得的...
15:56
微新创想12月26日消息,胖东来三胖店于本月23日开业,店内出现多款知名国际球星签名球衣引发关注。胖东来在该店的三楼设置了一个专柜,陈列着梅西、姆巴佩、库里、乔丹等球星的签名球衣,并标有价格标签。其中最贵为乔丹的签名球衣,售价138000元;最便宜的为艾弗森76人时期球衣,售价6300元。今日,胖东来工作人员表示,目前大部分球衣...
15:43
2025年12月26日,中国新就业形态研究中心重磅发布《数字平台中的青年新职业趋势研究——以闲鱼为例(2025)》,深度剖析了闲鱼平台上青年就业形态的演变轨迹。报告揭示,过去一年间,闲鱼平台新增1962万卖家,其中技能服务发布者占比显著,00后群体贡献了41%的份额,成为新职业浪潮中的主力军。值得关注的是,超四成参与副业经营的青年从业者,其副业收入已占据月总...
15:43
2025年12月26日,国家卫生健康委举行新闻发布会,介绍医疗便民服务进展。目前,全国所有省份已实现地市内医疗机构间超过200项检查检验结果互认。常住人口超10万的县均具备血透服务能力。根据七部门发布的指导意见,目标2030年基本实现跨区域、跨机构检查结果互认。国家医保局同步推出新规,影像检查价格须包含云存储等服务,否则减收5元,并推进‘医保影像云索引’建...
15:43
自2026年起,工信部第404批《道路机动车辆生产企业及产品公告》将实施新规定。乘用车申报需提交可体现前排驾驶室整体布置的内部结构照片,并上传《产品使用说明书》作为佐证材料。此举意味着未来新车在公示外观“证件照”的同时,内饰也将同步公开。该调整旨在完善产品准入管理,提升信息完整性,被业内视为“工信部车展”信息披露的重要升级。
15:43
2025年12月26日,市场监管总局在安徽合肥对光伏行业开展价格竞争秩序合规指导。针对当前光伏行业存在的低质竞争、重复建设等“内卷式”竞争问题,总局通报了相关价格违法风险,强调严禁价格串通、欺诈及虚假宣传等行为。发电企业被要求坚持优质优价,行业协会需加强自律引导。市场监管总局将加大产品质量监督和反不正当竞争执法力度,推动形成健康有序的行业生态。国家发展改革...
15:43
2025年12月26日,创新药研发企业茵创园医药宣布完成A轮融资。本轮融资由鼎锋资产、星空资本共同投资,资金将用于推进肿瘤免疫疗法和精准治疗领域的新药研发。茵创园医药专注于发现全新药物分子,已建立覆盖分子生物学、细胞生物学、药理学、毒理学、药物化学及转化医学的一体化新药发现平台。公司致力于解决未被满足的临床需求,为患者提供亟需的创新医药产品。
15:43
2025年12月26日,MOREFINE摩方推出M900迷你主机,面向海外市场发售。该主机提供AMD锐龙7 H 255、AI 7 350、AI 5 340三种处理器版本,支持最高96GB DDR5内存和双M.2 2280固态硬盘。产品配备Wi-Fi 6、蓝牙5.2及双2.5G网口,前置OCuLink外接显卡接口和USB4接口,支持视频输出,具备良好扩展性,...
15:43
2025年12月26日,针对近期市场关于“华硕进军DRAM内存制造”的传闻,公司方面正式作出澄清。华硕官方发言人明确表示,企业目前并无任何计划投入资金建设内存晶圆厂。这一回应旨在消除市场误解,确保信息传播的准确性。 在当前全球半导体市场环境下,华硕正积极采取稳健策略,持续深化与现有内存供应商的战略合作。通过建立长期稳定的供应链关系,公司能够有效保障原材料的稳...
15:43
2025年12月26日,蚂蚁集团旗下前沿AI助手灵光正式公布其创新功能“闪应用”上线一个月的运营成果,用户累计创建量已突破1200万个,展现出强大的市场吸引力与用户粘性。这一功能凭借其独特的智能化应用生成能力,迅速在多个领域引发广泛关注,覆盖了娱乐互动、生活服务、效率工具、在线教育等多元化场景。 用户只需通过自然语言输入具体需求,灵光AI助手能够在极短的时间...
15:43
2025年第六次全量OTA升级今日推送,智元远征A2旗舰版迎来V1.3版本。此次更新提升行走最大速度至1.2m/s,导航速度达0.8m/s,并新增灵动待机、自定义问候、语音全流程操控及边走边做动作功能。机器人现支持智能避障与全身舞蹈新动作,新增蓝牙音响与硅基送功能,客户端同步升级,优化坐姿包装便于单人运输。该机型专为交互服务场景设计,具备40+自由度、70...