小红书开源InstanceAssemble布局可控生成框架突破多实例图像精度

在人工智能生成内容(AIGC)从自由创作迈向精准控制的转型关键期,小红书AIGC团队今日正式开源其突破性布局可控图像生成框架——InstanceAssemble。这一专为高密度、多对象、复杂空间关系设计的Layout-to-Image任务而生的框架,在仅增加0.84%极低参数增量的同时,实现了生成图像空间对齐精度与语义一致性的显著提升,为电商、设计、游戏等高要求场景提供了强大的工业级解决方案。

级联建模 + Assemble-Attention,攻克“多物堆叠”技术难题
传统Layout-to-Image模型在处理“10个商品图标+文字标签+背景图层”等复杂布局时,常面临对象错位、重叠或语义错配的挑战。InstanceAssemble创新性地采用级联双阶段架构,有效破解了这一难题:首先,通过语义理解阶段精准解析文本描述与布局指令的语义关联;其次,借助自研的Assemble-Attention机制,在空间组装阶段动态建模实例间的相对位置、遮挡关系与层次结构,确保每个元素都能“精准落位”。实验数据显示,在密集商品展示、多角色插画、UI界面生成等场景中,InstanceAssemble的对象定位准确率与边缘清晰度均显著超越现有方法。

小红书开源InstanceAssemble布局可控生成框架突破多实例图像精度插图1

极轻量适配,无缝兼容主流底模
为降低部署门槛,InstanceAssemble框架特别采用了超轻量LoRA适配器设计:适配Stable Diffusion3-Medium仅需3.46%额外参数,而适配Flux.1模型更是低至惊人的0.84%。这一创新意味着用户无需重新训练庞大的大模型,即可在保留底模强大生成能力的基础上,灵活注入布局控制能力,完美支持文本+参考图+边界框的多模态指令输入。

自建DenseLayout基准,引领评估标准化进程
为精准衡量布局对齐质量,小红书同步发布了DenseLayout评测数据集与LGS(Layout Grounding Score)可解释指标。LGS从位置精度、尺度匹配、语义一致性三个维度量化生成效果,有效解决了传统指标(如IoU)在密集场景下失真的问题,为行业提供了更科学的评估标准。

AIbase权威评论认为,InstanceAssemble的发布标志着AIGC正从“画得像”迈向“摆得准”的新阶段。当AI不仅能生成精美图像,还能严格遵循设计师的精确布局指令“精准摆放”每个元素时,AIGC才真正具备嵌入专业生产流程的能力。小红书此次开源不仅赋能社区创作者,更将有力推动整个行业向可控、可靠、可商用的生成式AI迈进。

小红书开源InstanceAssemble布局可控生成框架突破多实例图像精度插图2

论文链接:https://arxiv.org/abs/2509.16691
项目主页:https://github.com/FireRedTeam/InstanceAssemble

最新快讯

2025年12月26日

12:07
长期以来,用户在借助 ChatGPT 创作长篇邮件或专业文章时,常常受限于单一的聊天文本格式。生成内容后,往往需要手动复制到第三方编辑器进行繁琐的二次排版。为解决这一痛点,OpenAI 近期悄然上线了一项创新功能——"格式化模块",旨在让 AI 生成内容更贴合专业文档的编辑习惯。据 AIbase 深度观察,该功能的核心突破在于其智能化的"界面自适应"技术。当...
11:52
2025年,内容种草已成为品牌营销与经营的核心策略,越来越多的品牌开始系统化地与创作者建立合作关系,跳出传统孤立合作模式。然而在激烈的市场竞争中,品牌每一分投入都需产生实际效果。克劳锐观察到当前品牌与创作者合作中存在两大痛点:与头部垂类博主合作后用户质疑产品使用真实性;种草内容虽受欢迎却难以突破原有粉丝圈层,无法实现有效转化。这一现象揭示了当种草从流量红利转...
11:52
微新创想12月26日重磅消息,一加手机品牌战略再添新篇章,继数字旗舰与Ace系列之后,正式官宣推出全新Turbo系列产品线。这款备受期待的新机预计将于明年一月揭开神秘面纱,以其卓越的性能、持久的续航和极致的游戏体验,重新定义移动设备性能新标杆。 据数码闲聊站博主率先曝光的真机谍照显示,一加Turbo系列在设计上大胆突破,采用了超大R角屏幕设计,圆润流畅的边框...
11:39
2026年春节档最受瞩目的影片《飞驰人生3》正式官宣定档,这部由韩寒编剧并执导的赛车喜剧力作将于12月26日发布最新消息。影片延续了前作的热度,由沈腾饰演的传奇车手张驰再次回归赛场,与原班人马和新加盟的演员共同演绎全新的赛车传奇。 故事背景设定在巴音布鲁克拉力赛之后,聚焦张驰在职业生涯转型阶段的挑战与成长。面对核心成员离队、技术革新带来的冲击,这位老将如何调...
11:39
2025年12月26日,备受瞩目的年度科技盛会在小米总部盛大举行,小米正式揭开了其2026年度旗舰产品系列的神秘面纱,其中小米17 Ultra作为年度重磅机型震撼登场。这款备受期待的影像旗舰不仅延续了小米一贯的创新精神,更在影像技术、性能配置和用户体验上实现了全面突破,其首发价6999元的起售价也标志着小米高端产品线的又一新高度。 此次发布会亮点纷呈,小米1...
11:39
2025年12月25日,备受瞩目的广东美亚旅游科技集团股份有限公司(简称“美亚科技”)传来重大喜讯,其IPO审核状态正式升级为“提交注册”,标志着这家泛商旅综合解决方案提供商即将叩响北交所的大门。作为行业内的创新力量,美亚科技致力于为全球商旅市场提供全方位、智能化的综合服务,其核心业务布局在三大关键领域:一是航旅票务B2B分销,通过高效精准的分销网络,为企业...
11:39
LG电子今日正式发布备受期待的全新UltraGear evo系列电竞显示器,涵盖39GX950B、27GM950B和52G930B三款旗舰型号,并宣布将在即将到来的CES 2026展会上首次与全球观众见面。这一创新系列不仅代表了LG在电竞显示技术领域的最新突破,更将为玩家带来前所未有的沉浸式游戏体验。 39GX950B作为系列中的顶级产品,采用了业界领先的1...
11:39
2025年12月25日,科技界迎来里程碑式的一天特斯拉CEO埃隆·马斯克与人工智能总监斯瓦米·奥卢斯瓦米亲自来到奥斯汀,对无安全员Robotaxi自动驾驶服务进行了实地测试这一创新性的无人驾驶演示吸引了全球目光。马斯克亲自坐上副驾驶座,全程体验了自动驾驶过程,并激动地表示车辆表现堪称"完美驾驶"展现出令人赞叹的驾驶技术。与此同时奥卢斯瓦米从后排第一视角拍摄了...
11:39
12月25日,中鼎股份(SZ000887)发布重要公告,宣布其全资子公司安徽睿思博机器人科技有限公司将联合深圳逐际动力科技与合肥柔性科天机器人材料公司,共同投资设立一家注册资本达5000万元的合资企业。此次合作的核心目标是进军人形机器人制造代工领域,并构建核心零部件的稳定供应体系。 在股权结构方面,安徽睿思博机器人科技有限公司将凭借3000万元的现金出资,占...
11:39
2025年12月,石药创新正式向香港交易所提交了上市申请,标志着这家由石药集团控股75.3%的企业迈出了资本市场的重要一步。石药创新近年来积极拓展生物制药领域,通过多次收购控股股东旗下相关资产,逐步构建起多元化的业务版图。数据显示,2025年前7个月,石药创新的生物制药产品收入同比激增8倍,成为推动公司整体增长的核心动力。尽管功能性原料及保健食品业务面临收入...
11:39
2025年12月26日,先歌国际正式披露了其在北京证券交易所的IPO问询回复文件,为公司的上市之路再添关键一步。在此次披露的文件中,公司实际控制人张太武与张光武兄弟合计持有公司93%的股份,这一显著的控制权并未将他们的亲属张茵如、彭秋霞纳入共同实控人名单。尽管二人分别持股5%和2%,但由于年龄差异、不同居住地以及未参与公司日常经营管理的实际情况,他们对股东大...
11:39
2025年12月26日,国家发改委发布重要政策指引,宣布在"十五五"规划期间,将积极引导轻工、纺织等传统产业向中西部及东北地区有序转移。这一战略布局旨在通过优化产业空间分布,推动传统产业实现降本增效与提质升级的双重突破。根据政策规划,相关部门将重点支持企业开展技术改造、数字化转型及绿色升级工程,通过创新驱动提升产品质量与标准水平,并强化品牌建设力度。 为...