虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

港科大贾佳亚团队新突破:DreamOmni2开源,AI多模态创作迈入新阶段

2025-10-24来源:快讯编辑:瑞雪

当语言无法精准传递灵感时,AI能否跨越文字的局限,直接捕捉创作者心中的视觉想象?香港科技大学贾佳亚团队最新推出的DreamOmni2模型,通过突破性的多模态编辑技术,为这一难题提供了创新解决方案。该成果在GitHub上线两周即收获1600颗星,引发YouTube创作者群体热议,被视为AI图像生成领域的里程碑。

传统AI创作工具长期受困于指令依赖困境。当用户试图将照片中的背包替换为波西米亚风格图案时,复杂纹理的语义描述往往导致结果偏差;而模仿老照片的复古光影或画家笔触时,现有模型更因抽象属性处理能力不足而束手无策。DreamOmni2的突破性在于,其构建的FLUX Kontext基座模型通过多参考图像解析机制,首次实现了对具体物体与抽象概念的同步编辑。

实测数据显示,该模型在人物替换任务中展现出惊人精度。将赛博场景中的男性角色替换为女性形象时,生成的画面不仅完整保留了背景光影与文字细节,更通过面部光线迁移技术,使新角色自然融入原始环境。在风格迁移测试中,模型成功将像素艺术、二次元画风等视觉特征完整迁移,相较GPT-4o的色调复制和Nano Banana的简单变色,展现出对艺术风格的深度理解。

技术白皮书揭示,研究团队通过三阶段数据工程构建了新型训练范式。首先利用特征混合技术生成包含相同物体/属性的高质量图像对,解决数据稀缺难题;继而开发提取-编辑双模型架构,自动生成(源图+指令+参考图)→目标图的完整训练链;最终通过多参考图像生成机制,形成覆盖具体物体与抽象属性的综合数据集。这种创新方法使模型在基准测试中,抽象属性处理得分超越GPT-4o与Nano Banana。

模型架构创新同样引人注目。针对多图像输入的混淆问题,研究团队引入索引编码与位置偏移技术,使模型能精准区分不同参考图像。通过视觉语言模型(VLM)与生成模型的联合训练机制,系统可自动将用户模糊指令转化为结构化操作,显著提升真实场景下的指令理解能力。LoRA微调策略的运用,则在保持基座模型性能的同时,实现了多模态能力的无缝激活。

在四图组合生成测试中,DreamOmni2将三位不同角色的特征与第四张图的画风完美融合,生成画面中人物服饰细节、动物品种特征与艺术笔触均得到准确呈现。这种跨图像、跨模态的编辑能力,使设计师能直接通过视觉参考进行创作,而非依赖文字描述。YouTube教程作者评价该模型为"免费工作流中的性能王者",其多图编辑精度已达到专业创作工具水准。

荣耀全球开发者大会启幕:发布8大AI方案 构建全场景智能生态新格局
为解决用户面对“场景割裂、服务单一”的智能生态时带来的碎片化体验,并攻克行业长期存在的互联互通难题,荣耀基于HONOR AI Connect平台,发布了8大AI场景化生态解决方案,覆盖智慧家居、智慧车联、潮…

2025-10-24

REDMI K90 Pro Max评测:3999元起步能否扛起红米“冲高”大旗?
但首先要说的是,K90 Pro Max,它和小米17 标准版一样,也没背屏。 结果拿出 K90 Pro Max 一看,居然没找到,但 K80Pro 上还是在的。。。怎么这点就不对标 iPhone 了? 不…

2025-10-24

REDMI K90 Pro Max深度体验:从性价比到旗舰,红米这次真的变了
总体用下来,REDMI K90 ProMax的影像进步明显,不仅是算法的持续进步,用上高动态主摄之后,在全场景,全时段的影像能力有了大幅提升,相比之前的REDMI手机更容易出片。 可能是为了求稳,REDM…

2025-10-24

网友苦等一加15,李杰回应“等等党不会输”,165帧游戏体验将亮相
快科技10月23日消息,有网友给一加中国区总裁李杰留言:前面那么多新机都没买,就一直等着一加15。李杰回复:“等等党不会输”。 从120帧到165帧,游戏帧率的突破不仅是参数上的跃升,更是手游体验的一次大换代…

2025-10-24

小米智能摄像机4双摄与变焦版实测:功能对比与选购指南
6、变焦版支持手势通话,手对着摄像头比个“OK”2秒钟就能在手机端发出通话提醒。价格方面,双摄版299元;变焦版399元,和手机类似有长焦就是贵一些。 最后补充一点,我新家门口监控用的也是小米,加上这段时间…

2025-10-23

​华为新品路线图揭秘:Pura 90系列或2026年4月携影像新突破亮相​
【CNMO科技消息】近日,有数码博主曝光了华为今年和明年的新品发布路线图,其中备受关注的Pura90系列预计将于2026年4月正式亮相,成为华为下一代影像旗舰。 据CNMO了解,华为Pura 90系列有望搭…

2025-10-23

苹果2027年新机命名或有变,或跳过“19”直接推出“iPhone 20”系列
【太平洋科技】10 月 23 日消息,据外媒报道,苹果预计在 2027年推出的iPhone新机将跳过“19”命名,直接将新机命名为“iPhone 20”系列。苹果或借此契机重新调整产品命名、机型定位和发…

2025-10-23

华为HarmonyOS 6升级亮点抢先看:新增14项功能,性能较鸿蒙4提升40%
【CNMO科技消息】近日,有数码博主曝光了华为HarmonyOS6操作系统增加的功能亮点和升级,其中包含一键生成视频和AI防诈骗等功能。在HarmonyOS 4升级HarmonyOS 6准备页面,提及用外部…

2025-10-22

性能旗舰之争:荣耀Magic8凭软硬件协同,成今年高性能手机优选
荣耀Magic8的影像系统结合AI算力,在长焦、夜景、人像等场景中都有显著提升。 对于正在考虑入手一款顶级旗舰的用户而言,荣耀Magic8无疑是今年最值得关注的答案——在众多高性能机型中,它以稳、快、智的综合…

2025-10-22

一加Ace 6系列新机情报流出:骁龙8 Gen5搭配超大容量电池引期待
IT之家 10 月 22 日消息,博主 @数码闲聊站 今天在微博透露了某厂骁龙 8 Gen5 新机的最新情报。 博主表示,这台手机将配备骁龙 8Gen5 芯片,拥有 1.5K 直屏,刷新率是 165Hz,其…

2025-10-22