虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

360自研AI大模型gpt2-o1亮相,数学逻辑推理能力能否超越国际水平?

2024-12-14来源:ITBEAR编辑:瑞雪

近日,360智脑官方在其公众号上发布了一则令人瞩目的消息,正式推出了其自主研发的AI大模型——360gpt2-o1。这款新模型在推理能力上实现了显著提升,尤其在数学与逻辑推理任务上的表现尤为突出。

360gpt2-o1之所以能够在这些领域取得如此优异的成绩,主要得益于其三大技术突破:合成数据优化、模型后训练以及“慢思考”范式。这些技术使得该模型在多项权威评测中均表现出色,超越了前代模型360gpt2-pro,甚至在与GPT-4o模型的对比中也毫不逊色。

在数学领域的评测中,360gpt2-o1展现出了强大的实力。无论是基础数学评测,如MATH和高考数学,还是权威的数学竞赛,包括AIME24和AMC23,该模型都取得了令人瞩目的成绩。特别是在数学竞赛评测中,360gpt2-o1还超越了阿里巴巴最新开源的o1系列模型QWQ-32B-preview,进一步证明了其卓越的数学推理能力。

为了提升模型的推理能力,360智脑团队在合成数据优化方面下足了功夫。他们通过指令合成、质量/多样性筛选等方法,有效解决了高质量数学与逻辑推理数据稀缺的问题,为模型提供了丰富的训练数据集。

在模型后训练阶段,360智脑团队采用了两阶段训练策略。他们首先利用小模型生成多样化的推理路径,然后利用大模型进行RFT训练和强化学习训练,从而进一步提升了模型的推理能力和反思纠错能力。

360gpt2-o1还引入了“慢思考”范式,这一创新性的技术使得模型能够像人类一样逐步推理和反思。该范式利用蒙特卡洛树搜索探索多样化的解决方案,并引入LLM进行错误验证和纠错,最终形成包含反思、验证、纠错和回溯的长思维链。

360智脑官方还公布了360gpt2-o1的整体架构图,展示了其复杂而精密的设计。这一架构的公布,不仅让人们更加了解了这款AI大模型的内部构造,也为其在未来的应用和发展提供了更多的可能性。

小米回应“不让卖小米”谣言 涉事村支书道歉 蹭流量应有底线
今天下午,该事件当事人冯玉宽在抖音账号「小冯来助农」发布了道歉视频,说自己的视频给小米公司造成了影响,浪费了社会资源,以后会规范网络言行,向大家表示诚挚歉意。 小米作为农产品名称当然可以用,但你模仿人家高管…

2025-12-13

性能颜值双在线!iQOO Neo11 2K屏大电池骁龙8E独显,游戏党福音
最后还是想说下缺点,虽然,这次iQOO Neo11的影像表现不错,但是,我觉得可以再增加个长焦,这样就更完美了,还有USB口也是USB2.0,这是和旗舰机比,唯一我发现的两个缺陷,倒是金属边框,很有质感的这个…

2025-12-12

破局专利桎梏:AV1斩获2025艾美奖,开源编解码器引领视频技术新篇章
12 月 11 日消息,电视学院(Television Academy)于 2025 年 12 月 4 日公布了第 76届技术与工程艾美奖获奖名单,正式授予 AV1 视频编解码器“技术与工程艾美奖”,以表彰…

2025-12-12

小米回应“不让卖小米”谣言:系恶意造谣 依法维权不应被污名化
小米方面强调,此前对相关账号发起的投诉,仅针对其长期存在的恶意模仿行为及捏造不实信息,特别是对小米公司及其高管名誉造成的侵害,并非限制“小米”二字在农产品等领域的正常使用。小米指出,该账号以“助农”为幌子,…

2025-12-12

荣耀WIN Pro新机来袭!9000mAh大电池+骁龙8E5,价格或比红米更具优势
荣耀真正的性价比机型,则是去年重新回归的GT系列,去年的荣耀GT和GT Pro各具特色,前者是最便宜的骁龙8 Gen3中端新机,目前为止也还是如此但作为回归后的初代产品,荣耀GT系列还是有诸多不足,热度和销量…

2025-12-12