虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

蚂蚁开源全球首个万亿参数混合线性思考模型 性能跃升达IMO金牌水准

2026-02-14来源:天脉网编辑:瑞雪

蚂蚁集团近日宣布开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,标志着AI大模型领域在长文本处理与复杂任务规划能力上取得突破性进展。该模型在生成效率、推理深度和长时程任务执行能力三大核心指标上实现显著提升,尤其在数学竞赛、代码生成和智能体任务执行等场景中展现出开源模型领先水平。

在数学推理能力验证中,Ring-2.5-1T在国际数学奥林匹克竞赛(IMO 2025)自测中取得35分(满分42分),中国数学奥林匹克(CMO 2025)自测中更以105分远超金牌线78分和国家队集训队选拔线87分。对比前代模型Ring-1T,新模型在推理逻辑严谨性、高级数学证明技术应用和答案完整性方面均有显著优化。在编程能力测试中,该模型在LiveCodeBench-v6代码生成基准中超越所有对比模型,展现出强大的工程化落地潜力。

技术架构层面,Ring-2.5-1T基于创新的Ling 2.5混合线性注意力架构,通过将传统GQA(分组查询注意力)升级为MLA(多头线性注意力)与Lightning Linear结构的1:7混合比例,在保持63B激活参数规模的同时,将内存访问开销降低至前代的1/10。实验数据显示,在32K以上长文本生成场景中,模型生成吞吐量提升超3倍,且随着序列长度增加,效率优势持续扩大。在配备8块H200 GPU的测试环境中,当生成长度超过16K tokens时,其解码吞吐量较传统架构模型高出40%以上。

针对复杂任务执行场景,研究人员通过大规模完全异步智能体强化学习训练,使模型具备跨应用工具协作能力。在智能体搜索任务Gaia2-search中,Ring-2.5-1T在规划生成和多步工具调用准确率上达到开源模型最优水平,较Kimi-K2.5-Thinking等竞品提升23%。该模型已实现与Claude Code智能体编程框架和OpenClaw个人AI助手的快速适配,支持多步骤工具调用与动态规划生成。

在开源生态建设方面,蚂蚁集团同步在Hugging Face、ModelScope等平台发布模型权重与推理代码,并计划于近期上线官方Chat体验页和API服务。对比测试显示,在AIME 26数学推理、HMMT 25竞赛数学等高难度基准测试中,Ring-2.5-1T均实现开源模型最佳性能,在SWE-Bench Verified软件工程任务执行基准中更以87.6%的通过率领先第二名14个百分点。这些突破为金融、科研、工业等领域处理超长文档、复杂业务流程提供了新的技术路径。

石头科技获柔轮设计新专利,以技术创新赋能智能清洁设备新发展
在智能清洁领域,最近传来了振奋人心的消息:石头科技(688169)成功获得了一项名为“柔轮、谐波减速器、机械臂和清洁设备”的实用新型专利,专利申请号为CN202520064302.9,授权日期为2026年2月…

2026-02-14

联想产品经理晒三星96GB 9600MT每秒 LPCAMM2内存条 消费级内存新高度?
IT之家 2 月 13 日消息,联想 ThinkBook 产品经理 @思考未来啊 昨日晒出了一件三星电子 LPDDR5X CAMM2(LPCAMM2) 内存条的实物图片,通过标签可以发现该型号容量为 96G…

2026-02-13

石头科技再获突破!“爬楼装置”专利为智能清洁设备开辟新路径
这一新专利的获得不仅标志着公司在自主研发方面的进一步突破,也为智能清洁设备的未来发展指明了方向。石头科技的这一新专利正是顺应了这一趋势,标志着公司在智能清洁设备领域的进一步深化。 总的来说,石头科技的“爬楼装…

2026-02-13

三星LPDDR6X内存样品交付高通 性能升级或为边缘侧AI带来新突破
根据最新的行业消息,三星电子已经完成了LPDDR6内存的关键研发工作,并计划在2026年下半年实现正式商用。 作为增强版本的LPDDR6X,则会在带宽和延迟表现上进一步挑战DRAM的极限。高通之所以选择在AI…

2026-02-13