虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

360自研AI大模型gpt2-o1亮相,数学逻辑推理能力能否超越国际水平?

2024-12-14来源:ITBEAR编辑:瑞雪

近日,360智脑官方在其公众号上发布了一则令人瞩目的消息,正式推出了其自主研发的AI大模型——360gpt2-o1。这款新模型在推理能力上实现了显著提升,尤其在数学与逻辑推理任务上的表现尤为突出。

360gpt2-o1之所以能够在这些领域取得如此优异的成绩,主要得益于其三大技术突破:合成数据优化、模型后训练以及“慢思考”范式。这些技术使得该模型在多项权威评测中均表现出色,超越了前代模型360gpt2-pro,甚至在与GPT-4o模型的对比中也毫不逊色。

在数学领域的评测中,360gpt2-o1展现出了强大的实力。无论是基础数学评测,如MATH和高考数学,还是权威的数学竞赛,包括AIME24和AMC23,该模型都取得了令人瞩目的成绩。特别是在数学竞赛评测中,360gpt2-o1还超越了阿里巴巴最新开源的o1系列模型QWQ-32B-preview,进一步证明了其卓越的数学推理能力。

为了提升模型的推理能力,360智脑团队在合成数据优化方面下足了功夫。他们通过指令合成、质量/多样性筛选等方法,有效解决了高质量数学与逻辑推理数据稀缺的问题,为模型提供了丰富的训练数据集。

在模型后训练阶段,360智脑团队采用了两阶段训练策略。他们首先利用小模型生成多样化的推理路径,然后利用大模型进行RFT训练和强化学习训练,从而进一步提升了模型的推理能力和反思纠错能力。

360gpt2-o1还引入了“慢思考”范式,这一创新性的技术使得模型能够像人类一样逐步推理和反思。该范式利用蒙特卡洛树搜索探索多样化的解决方案,并引入LLM进行错误验证和纠错,最终形成包含反思、验证、纠错和回溯的长思维链。

360智脑官方还公布了360gpt2-o1的整体架构图,展示了其复杂而精密的设计。这一架构的公布,不仅让人们更加了解了这款AI大模型的内部构造,也为其在未来的应用和发展提供了更多的可能性。

一加Turbo 6系列下周发布,超大电池+高帧性能外观颜值双在线
具体细节方面,官方介绍称其拥有超高帧的满帧性能、超巨量的电池、超防水超耐用的全面体验。 安兔兔近日发文显示,其在后台发现了型号为PLU110的新机,推测应该是即将发布的一加Turbo系列新机,搭载了高通骁龙…

2025-12-30

荣耀Power2官宣定档1月5日,10080mAh大电池续航实力拉满
结合官方图片来看,荣耀Power2后置了一个大尺寸的摄像模块,其中可见镜头和闪光灯组件,还可见产品系列标志。据悉,荣耀在上周发布了WIN系列手机,提供荣耀WIN、荣耀WIN RT两个版本。荣耀WIN还拥有…

2025-12-30

AI规模化落地加速,推理芯片成新风口,巨头布局引领技术革新
可以说,推理芯片是AI从技术概念走向实际应用的关键支撑,通过性能、能效、成本与场景适配性的综合优化,成为AI规模化发展的核心引擎。英伟达首席执行官黄仁勋在内部邮件中指出,此项合作将显著拓宽公司技术版图 ——…

2025-12-30

微信回应存储空间疑问:优化聊天记录存储 转发文件不重复存
2025年12月29日,微信派公众号发布消息,回应了几个关于微信占存储空间的误解。 据微信派表示,存储空间优化本质上是在处理大家最珍贵的数字资产——聊天记录。在微信转发同一份文件不会重复存储。每次优化、每个改…

2025-12-30

微信回应存储占用问题:安装包持续优化,聊天记录成占用“大户”
2025年12月29日,微信通过其官方公众号就用户普遍关注的存储空间占用问题作出说明,回应了长期以来存在的几项常见误解。随着用户需求不断演进,微信持续引入新功能,相应地需要在安装包中集成更多代码、逻辑结构以…

2025-12-30

苹果50款机型大盘点!网友热议最经典四款:iPhone 4等机型成心头好
快科技12月29日消息,从2007年第一款手机到现在(iPhone的横空出世,让苹果凭借一己之力干翻了昔日老大哥诺基亚),苹果已经推出了50款机型,而你觉得最经典的是哪个机型? 近日,“苹果最经典的四款机型”…

2025-12-30