虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

字节跳动推出Seed Prover 1.5 模型 数学推理能力与效率显著提升

2025-12-24来源:快讯编辑:瑞雪

字节跳动旗下Seed团队近日正式发布新一代形式化数学推理专用模型——Seed Prover 1.5。该模型通过大规模Agentic强化学习(RL)训练,在数学推理能力与效率方面实现突破性提升,成为形式化数学推理领域的重要进展。

在针对国际数学奥林匹克竞赛(IMO)的测试中,Seed Prover 1.5展现出强劲实力。仅用16.5小时,该模型便为IMO 2025前5道题目生成完整可编译验证的Lean证明代码,按竞赛评分标准换算后取得35分的成绩,达到金牌分数线(满分42分)。这一表现较前代模型有显著提升,标志着自动化数学推理向人类顶尖水平迈进一步。

面向北美本科数学竞赛Putnam的测试同样验证了模型的泛化能力。在9小时内,Seed Prover 1.5成功为Putnam 2025的12道赛题中的11道生成可验证的Lean代码,解题效率与准确性均达到竞赛级标准。更全面的评估显示,该模型在完整的Putnam历史题库中解决了88%的问题,在代表硕士数学难度的Fate-H评估集和博士生数学难度的Fate-X评估集中,分别攻克了80%和33%的题目,刷新了形式化数学推理模型在多项权威评测中的最优表现(SOTA)。

技术层面,Seed Prover 1.5通过创新的Agentic RL训练框架,实现了推理路径的自主规划与优化。其核心突破在于将形式化证明过程分解为可动态调整的子任务链,使模型能够根据问题特征灵活选择策略,显著提升了复杂数学问题的求解效率。团队公开的技术报告详细披露了模型架构与训练方法,为学术界与工业界提供了可复现的研究范式。

目前,Seed Prover 1.5的技术报告已对外发布,相关代码库与演示接口即将陆续开放。开发者可通过官方渠道获取Lean证明代码示例,体验模型在自动化数学推理领域的实际应用能力。这一进展不仅为数学研究提供新型辅助工具,也为人工智能在科学推理领域的拓展奠定了技术基础。

正浩创新引入华为系高管:组织变革求突破,IPO前夕谋新局
陈熙和王雷同为大疆前员工,早在正浩创立起步阶段陈熙就已加入公司,长期全面负责技术研发与战略决策,主导研发了公司多项核心技术,为公司元老。 正浩创新此次组织变革的走向,或将成为一个重要的观察窗口,它不仅会在短期…

2025-12-24

科创50增强ETF南方(588370)12月23日微涨 规模份额今年双降
12月23日,南方上证科创板50成份增强策略ETF(588370)收盘涨0.28%,成交额480.86万元。 规模方面,截止12月22日,科创50增强ETF南方(588370)最新份额为7077.20万份,…

2025-12-24

荣耀WIN系列引领新潮流:10000mAh巨无霸电池开启电竞新篇章
12 月 22 日,荣耀官方分享荣耀 WIN 系列预热海报,正式官宣全系搭载 10000mAh 巨无霸青海湖电池。测试结果显示,荣耀 WIN 系列在多项严苛的续航模型中实现了“断层式领先”。未来,荣耀计划构建…

2025-12-24