虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

苹果推出Pico-Banana-400K数据集,为文本引导图像编辑模型提供优质训练资源

2025-10-29来源:快讯编辑:瑞雪

苹果公司近日宣布推出一项名为《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》的研究成果,并同步公开了包含40万张图像的完整数据集。该数据集采用非商业性研究许可协议发布,允许全球学术机构和研究人员自由使用,但明确禁止商业用途。这一举措旨在解决当前图像编辑领域数据集质量参差不齐、共享性受限等核心问题。

研究团队指出,尽管近年来图像生成与编辑技术取得显著突破,但开放研究仍面临关键瓶颈。现有数据集普遍存在三大缺陷:依赖专有模型生成的合成数据、人工筛选子集规模有限、以及领域偏移与质量控制不一致等问题。这些缺陷直接导致鲁棒图像编辑模型的开发受阻。为突破这一局限,苹果团队历时数月构建了Pico-Banana-400K数据集。

该数据集的构建流程体现了严格的筛选机制。研究人员首先从OpenImages数据集中精选涵盖人物、物体及文字场景的多样化真实照片,随后设计了35类图像修改指令,并划分为八大编辑类别。具体包括像素与光度调整(如添加复古滤镜)、以人为中心的编辑(如生成Funko-Pop风格形象)、场景构成编辑(如天气条件变换)、对象级语义修改(如物体空间关系调整)等。

在技术实现层面,团队采用谷歌的Gemini-2.5系列模型完成核心工作。每张原始图像与编辑指令输入至Nanon-Banana模型(即Gemini 2.5-Flash-Image)生成编辑结果后,需通过Gemini 2.5-Pro模型的双重验证:评估编辑是否精准遵循指令,并确保视觉质量达标。只有通过严格筛选的样本才会被纳入最终数据集。

数据集的创新性体现在其结构设计上。除包含单轮编辑样本外,还首次引入多轮连续编辑序列,模拟真实场景中的渐进式修改需求。更值得关注的是"偏好对"样本的收录——通过对比成功与失败的编辑结果,为模型提供区分优质输出的学习范例。这种设计有助于提升下一代文本引导图像编辑模型的判断能力。

研究团队坦承,当前使用的Nanon-Banana模型在精细空间控制、布局外推及文字排版处理方面仍存在改进空间。但他们强调,Pico-Banana-400K的核心价值在于为行业提供首个可复现、高质量的训练与评测基准。目前,相关研究论文已上线预印本平台arXiv,完整数据集则在GitHub平台向全球研究者开放下载。

富士康携手英伟达,休斯顿工厂将启用人形机器人专产AI服务器
今年 6 月有消息称,富士康与英伟达正在洽谈将人形机器人引入休斯顿工厂,计划在 2026 年第一季度投入使用。 综合IT之家此前报道,今年 6 月的消息称,富士康正与英伟达联合开发自研人形机器人,并已测试中…

2025-10-29

小米新零售战略深化:王晓雁卸任小米之家总经理 陈恺接棒促扩张
此次调整是小米新零售战略深化的重要一步。王晓雁自今年7月晋升为集团高级副总裁后,仍负责中国区整体业务,并向集团总裁卢伟冰汇报。今年8月,小米之家昆明公园1903旗舰店正式开业,王晓雁在开业仪式中强调,该店是…

2025-10-29

紫光同芯TMC-E9系列通过GSMA eSA认证,加速eSIM全球规模化应用
IT之家 10 月 27 日消息,今日紫光同芯官方微信公众号宣布,近日,紫光同芯 eSIM 芯片 TMC-E9 系列以行业最快速度,成功通过GSMA eUICC Security Assurance(eSA…

2025-10-29

​小米武汉智能家电工厂投产:AI质检赋能,高端空调6.5秒高效下线​
2025年10月28日,小米智能生态官微发布消息称,今天小米智能家电工厂在武汉正式竣工投产。冰箱产品出货量超79万台,同比增速超25%,洗衣机出货量超60万台,同比增速超45%。此外,2025年第一季度,小米…

2025-10-29

一加15评测:性能“Ultra”领航,165Hz高刷与全能体验共塑旗舰新标杆
在旗舰手机市场陷入参数内卷的当下,一加15以行业首部性能Ultra超旗舰,的身份破局而来它不仅搭载了第五代骁龙8至尊版移动平台与全新「风驰游戏内核」,更将165Hz超高刷第三代东方屏、7300mAh 冰川电池…

2025-10-28

苹果20周年iPhone定制传感器将搭载LOFIC技术,影像升级或引领新潮流
快科技10月28日消息,据媒体报道,苹果20周年iPhone将会采用苹果定制图像传感器,这枚传感器首次搭载LOFIC技术。LOFIC技术全称是Lateral OverFlow Integration Cap…

2025-10-28

华为Mate 70 Air或10月29日预热!主打轻薄设计,11月有望开售
此前,这款新机已现身中国电信终端产品库,型号为SUP-AL90,标志着华为首次在Mate系列中推出“Air”后缀机型,主打轻薄设计。价格方面,另有数码博透露,华为Mate 70 Air的起售价预计在3000…

2025-10-28

红魔11 Pro+臻金传奇典藏版来袭:全面屏配7500mAh大电池,游戏党福音
红魔在发布新一代游戏手机的同时,预热了新版本,全称为红魔11Pro+臻金传奇-限量典藏,对比Pro+版本多方面有所不同,比如散热材料、机身材质等方面。 新机优势相同,比如电竞双芯、全面屏、超大电池、首创水…

2025-10-28

一加Ace 6正式登场:2599元起售,游戏性能与续航双双拉满
据悉,一加Ace6同样支持165超高帧游戏体验,性能碾压同档,同时配备全新一代风驰游戏内核,实现行业领先的165无限满帧、同档最强的1%Low帧以及同档最强的游戏多任务、多窗满帧,综合游戏体验断档领先。 …

2025-10-28

港行iPhone启用Apple智能 可用新功能 国区账号或迎小规模测试
IT之家 10 月 27 日消息,消息源 GreatMOLA 今天在 Linux Do 论坛发文,称自己的港行苹果 iPhone手机从今天早上可以下载 Apple 智能模型,启用后发现确实可以使用。 根据博…

2025-10-28