虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

苹果DeepMMSearch-R1模型:用“图像裁剪术”攻克AI视觉搜索难题

2026-01-15来源:快讯编辑:瑞雪

苹果公司近日在人工智能领域取得重要进展,其研发团队发表的研究论文详细介绍了一款名为DeepMMSearch-R1的新型AI模型。该模型针对复杂视觉场景下的信息检索问题进行了深度优化,通过创新技术解决了传统AI模型在处理多要素视觉任务时常见的准确性不足问题。

传统AI模型在面对包含多个视觉元素的复合问题时,往往难以精准定位关键信息。例如当询问"画面左上角鸟类的最高飞行速度"时,现有模型可能因无法聚焦局部细节而返回整个鸟群的平均速度数据。这种"答非所问"或"漏看关键信息"的现象,在医疗影像分析、工业质检等需要高精度识别的场景中尤为突出。

DeepMMSearch-R1的核心突破在于引入了视觉定位工具系统。该系统通过动态图像裁剪技术,能够自动识别并隔离干扰元素,将处理范围聚焦于目标区域。这种"先定位后验证"的处理流程,使模型在保持整体场景理解能力的同时,显著提升了微小目标的识别精度。研究团队特别设计了双重验证机制,确保裁剪后的图像信息仍能保持语义完整性。

为平衡计算效率与处理精度,研发团队创新性地采用混合训练策略。通过监督微调技术,模型学习在何种场景下需要启动裁剪功能,避免不必要的计算资源消耗;结合在线强化学习算法,持续优化工具调用的时机与范围。这种训练方式使模型在保持响应速度的同时,将准确率提升了37%。

独立测试表明,在需要精确图文匹配的任务中,DeepMMSearch-R1的表现明显优于现有检索增强生成(RAG)系统及提示词驱动的搜索智能体。特别是在处理包含遮挡、重叠或微小元素的复杂图像时,该模型能准确识别并提取关键信息,有效解决了AI系统在常识性事实检索中常见的"简化处理"问题。目前研究团队正在探索该技术在自动驾驶、远程医疗等领域的应用可能性。

索尼欧洲1月21日将开新品发布会,或推新形态音频设备而非WF-1000XM6
IT之家 1 月 15 日消息,索尼欧洲分部昨日(1 月 14 日)发布预告视频,宣布将于格林尼治标准时间 1 月 21 日下午 4点(北京时间 22 日 0 点)举行新品发布会。 视频中醒目地展示了“探索…

2026-01-15

2025全球智能手机市场:苹果领跑,三星小米紧追,未来售价或上涨
分析师评论显示,苹果在 2025 年的增长得益于其在新兴和中型市场的稳健需求,更强大的产品组合支持也为其提供了助力。而在前五排名之外,Nothing 和谷歌表现良好,分别在 2025 年实现了 31%和 …

2026-01-15