虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

小红书联合复旦推出InstanceAssemble:AI绘画实现复杂布局精准生成新突破

2025-12-27来源:快讯编辑:瑞雪

AI绘画领域迎来重要突破,复旦大学与小红书联合研发的InstanceAssemble技术,在布局控制生成(Layout-to-Image)方向实现关键性进展。这项基于扩散变换器架构的创新方案,通过引入"实例拼装注意力"机制,成功解决了复杂场景下物体布局对齐与语义匹配的难题,相关研究成果已被国际顶级学术会议NeurIPS 2025收录。

传统AI绘画技术主要依赖文字描述生成图像(Text-to-Image),而新一代布局控制生成技术则要求系统根据用户指定的空间约束条件进行创作。这些约束条件包括物体边界框、分割掩码或骨架图等空间定位信息,技术难点在于如何确保生成图像中的每个物体都严格符合预设位置,同时保持语义逻辑的连贯性。现有方案普遍存在布局偏移、语义脱节或计算资源消耗过大等问题。

研究团队提出的InstanceAssemble技术通过创新机制实现了精准控制。该系统采用轻量化设计,仅需在现有模型基础上增加约7100万个参数(相当于Stable Diffusion3-Medium模型容量的3.46%),即可完成模型适配。特别值得注意的是,当适配Flux.1模型时,额外参数需求更低至0.84%,显著降低了技术落地门槛。

实验数据显示,在包含90万个实例的密集布局数据集测试中,新技术展现出卓越性能。研究团队专门构建的"Denselayout"基准测试集包含5000张图像和9万个实例,配合全新设计的"Layout Grounding Score"评估指标,能够精确量化生成图像与布局指令的匹配程度。测试结果表明,即使训练数据仅包含稀疏布局(≤10个实例),系统在处理密集场景(≥10个实例)时仍能保持稳定输出。

这项突破性成果标志着AI绘画技术进入精准构图时代。用户只需提供物体位置框和内容描述,系统即可在指定区域生成符合语义的图像元素,无论是简单场景还是复杂构图都能保持高度一致性。研究团队表示,该技术已具备实际应用条件,未来可广泛应用于数字内容创作、虚拟场景构建等领域,为创意产业提供新的技术支撑。

小米17 Ultra深度评测:2亿像素长焦革新 影像旗舰新标杆诞生
在15 Ultra 上,小米曾同时配备70mm与100mm 两颗长焦镜头,而到了17 Ultra,却只保留了一颗潜望长焦。17 Ultra的主摄依旧是一颗 1 英寸超大底,并引入了最新的 LOFIC 技术…

2025-12-26

鸿蒙AI赋能华为Mate 80系列:智慧体验升级,开启便捷生活新篇章
除了这些实用的功能,在使用华为 Mate 80 时,很多去趣味化的 AI 体验还经常会为小编带来心情上的愉悦,比如小编很喜欢 Mate 80系列上首发搭载的“元气心情 3D 互动主题”,可根据我的情绪智能…

2025-12-26