虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

苹果新突破!300亿参数AI大模型MM1.5,能识图懂语

2024-10-13来源:ITBEAR编辑:瑞雪

苹果公司近期宣布,其多模态AI大模型MM1.5正式推出,该模型基于前代MM1架构进行升级,拥有高达300亿的参数规模。

MM1.5模型继续坚持数据驱动的训练原则,深入探索了不同训练周期中混合数据对模型性能的影响,相关模型文档已在Hugging Face平台发布。

此次推出的MM1.5模型提供了从10亿到300亿的多种参数规模选择,具备图像识别与自然语言推理的能力。

在新版本中,苹果研发团队对数据混合策略进行了优化,显著提升了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的性能。

据相关论文介绍,MM1.5在持续预训练阶段引入了高质量的OCR数据和合成图像描述,大幅提高了模型对包含大量文本的图像的理解能力。

研究人员在监督式微调阶段对不同数据类型对模型表现的影响进行了深入分析,优化了视觉指令微调数据的混合方式,使得即便是小规模的模型版本也能展现出出色的性能,实现了更高的效率。

苹果公司还推出了专门用于视频理解的MM1.5-Video模型以及专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。

MM1.5-UI模型未来有望成为iOS背后的核心AI技术,能够处理各种视觉引用与定位任务,总结屏幕上的功能,甚至通过与用户的对话进行交互。

广汽新动向!2024巴黎车展将发欧洲市场建厂计划?
10月12日消息,据蓝鲸新闻,近期有消息称广汽集团计划在欧洲及南美地区建立新的生产基地。对此,广汽集团方面今天回应称,“我们没有发布过这个信息。关于欧洲市场计划,将在14号的巴黎车展上进行发布。”IT…

2024-10-13

一汽丰田9月销量微增,新款亚洲龙贡献11729辆!
10月12日消息,一汽丰田今天公布了最新的销量数据:9月销量达到74112辆,环比增长约3%,同比增长约1%,1-9月累计销售53.7万辆。此外,基于TNGA-K平台的车型累计销量达27.6万台,占比…

2024-10-13