虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

蚂蚁发布万亿参数Ling-1T模型,多项测试领先,FP8训练及创新方法成亮点

2025-10-09来源:快讯编辑:瑞雪

蚂蚁百灵大模型家族迎来重要成员——Ling-1T。这款拥有万亿参数的通用语言模型由蚂蚁集团自主研发,作为Ling 2.0系列的首款旗舰产品,其规模与性能均创下团队历史新高。该模型在复杂推理任务中展现出卓越能力,在有限输出Token条件下,于多项基准测试中刷新最佳成绩,尤其在高效思考与精确推理的平衡方面表现突出。

在竞赛数学领域,Ling-1T的表现尤为亮眼。以美国数学邀请赛25题(AIME 25)为例,该模型仅消耗平均4000余Token即达到70.42%的准确率,超越同期测试的Gemini-2.5-Pro(消耗5000+Token,准确率70.10%)。这种以更少资源实现更高精度的特性,使其在推理效率与准确率的综合评估中占据优势,相关成果已推动该领域帕累托前沿的拓展。

技术架构方面,Ling-1T延续了Ling 2.0的核心设计,依托超过20万亿Token的高质量语料库完成预训练,支持最长128K的上下文窗口。通过"中训练+后训练"的演进式思维链(Evo-CoT)技术,模型在复杂逻辑推导和精准答案生成方面获得显著提升。特别值得关注的是,该模型采用FP8混合精度训练方案,成为当前已知规模最大的FP8基座模型,这项创新使显存占用降低、并行策略更灵活,并实现15%以上的端到端训练加速。

在强化学习阶段,研发团队提出LPO(Linguistics-Unit Policy Optimization)策略优化算法,以"句子"为最小优化单元。这种设计既避免了词元级处理的碎片化问题,又克服了序列级优化的笼统性,使奖励信号与模型输出在语义层面实现精准匹配。同时,团队构建的"语法-功能-美学"混合奖励机制,在确保代码正确性的基础上,显著提升了模型对视觉美学的理解能力。

在前端开发能力评估中,Ling-1T于ArtifactsBench基准测试取得59.31分,虽略低于Gemini-2.5-Pro-lowthink的60.28分,但在开源模型中稳居首位。该模型在代码生成、软件开发、专业数学等领域同样表现优异,多项指标刷新开源社区纪录。目前,开发者可通过Hugging Face平台及蚂蚁百宝箱等渠道体验Ling-1T的完整功能。

据悉,蚂蚁百灵团队还在同步推进深度思考大模型Ring-1T的研发,其preview版本已于9月30日开源。这款聚焦复杂推理的新模型,将与Ling-1T形成能力互补,共同构建更完整的AI技术矩阵。

荣耀Magic8系列10月15日登场:AI自进化赋能,开启智慧生活新篇章
其中“AI自进化”与“2亿超夜神”成为业界及用户的两大关注焦点。 为进一步释放AI交互能力,更便捷、高效地开启智能生活,荣耀Magic8系列在机身侧边新增了专属AI物理按键,可以一键触发AI相关应用,为用户提…

2025-10-09

OPPO Watch S智能手表外观亮相,10月16日全球首发,或成轻薄智能表新标杆
IT之家 10 月 9 日消息,今天下午,OPPO 揭晓了 Watch S 智能手表的外观,这款手表号称“轻薄表皇”,将于 10 月 16 日19 时全球首发。Mini 版本于同年 4 月发布,主打轻薄设计…

2025-10-09

恒河水质堪忧,美的净水器携“帕斯卡膜”技术硬核净化解难题
之后,团队使用净化后的水制作餐食,摆出一桌“恒河流水席”,邀请当地民众共同体验,用事实印证了“净化水可直饮”的硬核实力。正是凭借这一技术突破,美的净水器才能从容应对恒河这种高难度水体,展现出卓越的环境适应性与…

2025-10-09

三星S26 Ultra机模现身网络 银色橙色淡金色三色可选引期待
按照三星的产品节奏,预计明年初会发布新一代Galaxy S26系列,但今年下半年开始,三星GalaxyS26系列的外观配置就已经开始陆续曝光,现在机模也有消息。 如上图所见,有海外网友晒出了号称是三星S26…

2025-10-09

iQOO 15新机10月登场:自研电竞芯片Q3加持,2K屏+大电池带来极致体验
随着国内手游用户不断增加,各大品牌陆续推出性能手机、游戏手机,重点提升整体性能,实现高配置、高性能。官方重点预热了多方面,比如2K屏幕、自研电竞芯片、机身双防、蓝海大电池、旗舰影像、旗舰之芯等方面,均为新机的…

2025-10-09

金凡社交动态再引猜测,小米17 Pro背屏创新玩法与17 Ultra影像规格成焦点
除了小米17 Ultra的消息外,有爆料提到,小米公司正开发一款代号为“pecan”的新款折叠屏手机。 据悉,在GSMAIMEI数据库,发现了型号“26023PN08C”的小米手机,预估为小米MIX Fo…

2025-10-08

三星One UI 8.5系统即将开启测试,Galaxy S25系列或成首批尝鲜机型
IT之家 10 月 8 日消息,据科技媒体 Sammobile 今天报道,尽管三星的 One UI 8系统姗姗来迟且处于初期阶段,但这家公司已经准备好开启测试 One UI 8.5 系统,预计将带来诸多界面…

2025-10-08

小米17 Pro Max延续首销权益“变相降价”,7500mAh大电池+512GB大存储亮点足
为了让新机开卖的时候取得好成绩,手机厂商们经常会对旗下新机设置专门的首销价,或者首销权益,而小米公司就非常喜欢做这种事,像新出的小米17系列手机,就有专门的首销权益,包括2年碎屏保、2年背屏碎屏险,以及365…

2025-10-08

苹果深耕印尼市场:iPhone 17系列及iPhone Air本周五开启预订,17日线下发售
【环球网科技综合报道】10月8日消息,据MacRumors报道,苹果公司近日宣布,将于10月10日(本周五)在印度尼西亚正式开启iPhone17、iPhone Air、iPhone 17 Pro及iPhon…

2025-10-08

从技术本质到产业预判:如何提前2年洞察OpenAI的AI操作系统演进路径
早在2023年,我便在《》等文章中提出,大型语言模型(LLM)的本质是“一种新式的云端的操作系统”,并勾勒了其后续的产业演进脉络,参见: 一旦确定了“操作系统”这个“名”(基类),我就可以调动所有关于操作系…

2025-10-07