虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

苹果杜克联手,新“交错推理”法让大语言模型更聪明更快!

2025-05-31来源:ITBEAR编辑:瑞雪

近期,一项由苹果公司与杜克大学携手推出的创新强化学习方法“交错推理”,在人工智能领域掀起了波澜。该方法旨在显著增强大语言模型的推理能力,为复杂问题的解决提供了新的视角。

在探讨这一突破之前,我们不得不提及当前大语言模型在处理多步骤复杂问题时所面临的挑战。它们往往遵循一种线性的“思考-回答”模式,虽然逻辑清晰,但响应速度较慢,且在推理链的任一环节出错都可能影响最终答案的准确性。这种模式与人类的交流方式大相径庭,人类倾向于在思考过程中逐步表达想法,而模型则倾向于在完成整个推理后才给出答案,这在一定程度上限制了其效率和互动性。

为了打破这一僵局,“交错推理”应运而生。该方法的核心在于,在模型的推理过程中,巧妙地交替进行内部计算和输出中间答案的操作,从而大幅提升响应速度和实用性。为了实现这一目标,研究团队设计了一个基于强化学习的训练框架,其中嵌入了特定的指示标签,这些标签能够引导模型在达到关键推理节点时输出阶段性成果。

为了确保模型在追求局部输出效率的同时,不牺牲整体推理的准确性,研究团队精心构建了一套基于规则的奖励机制。该机制综合考虑了格式合规性、最终准确率以及条件性中间准确率等多个维度,以确保模型在推理过程中的每一步都能得到恰当的激励。

实验数据表明,“交错推理”在Qwen2.5模型(包括1.5B和7B参数版本)上取得了显著成效。与传统方法相比,该方法的响应速度提升了超过80%,推理准确率也提高了近19.3%。更令人振奋的是,尽管模型仅在问答类和逻辑类数据集上进行了训练,但它在MATH、GPQA和MMLU等更具挑战性的任务中也展现出了强大的泛化能力。

研究团队还尝试了多种奖励机制,包括全或无奖励、部分积分奖励及时间折扣奖励等。结果显示,条件性奖励和时间折扣奖励的效果最为突出,远远超越了传统训练方式。

“交错推理”的提出,不仅为提升大语言模型在复杂推理任务中的表现提供了一条切实可行的技术路径,也为未来模型的设计与优化提供了新的思路。这一创新成果无疑将推动人工智能领域向更加高效、智能的方向发展。

网友苦等一加15终有回应 李杰承诺不辜负期待 165帧游戏新体验即将登场
快科技10月23日消息,有网友给一加中国区总裁李杰留言:前面那么多新机都没买,就一直等着一加15。李杰回复:“等等党不会输”。 从120帧到165帧,游戏帧率的突破不仅是参数上的跃升,更是手游体验的一次大换代…

2025-10-23

结构力学测试龙头东华测试:业绩稳增,布局机器人赛道谋新发展
据了解,东华测试是国内领先的结构力学性能研究和电化学工作站整体解决方案企业,前身为成立于1993年的靖江东华测试技术开发有限公司,2012年在深交所成功上市,其产品广泛应用于国内航空航天、重大装备、大型建筑…

2025-10-23

一加Turbo系列新机将至:8000mAh大电池+骁龙8 Gen5,性能续航双突破
综合性能表现上,安兔兔评测跑分有望突破340万分,定位为高通产品线中的次旗舰平台,性能略低于骁龙8 Elite Gen5移动平台。 市场信息显示,一加有望成为该平台的首发品牌,新机或将归属于一加Turbo系列…

2025-10-22

远程协作新利器?皓丽四摄AI会议平板深度体验,解锁会议效率新境界
传统会议平板最大的痛点之一就是摄像头性能不足,单一镜头难以兼顾全景与特写,导致远程与会者往往难以获得沉浸式体验。 在远程办公和跨地域协作成为常态的今天,这样一款智能会议平板,无疑能为企业提供实实在在的效率和…

2025-10-22

华为Mate80系列将携鸿蒙6.0登场,多款新品齐聚11月28日星光盛典
据说,鸿蒙6.0在全新的方舟引擎和鸿蒙内核的支持下,App冷启动速度快30%,多任务切换无掉帧。 Mate 80 系列有四款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro+ 以及…

2025-10-22

小米17 Pro系列爆发式增长:前三周占比近85%,成功吸引iPhone用户转投
【CNMO科技消息】10月22日,有博主爆料称,小米17系列开售前三周,出货量较上代增长12%。其中,17 Pro系列两款机型的出货量比上代一款Pro机型增长了141%,也就是上代的2.4倍。CNMO了解到,…

2025-10-22

余承东微博官宣:华为路由X3Pro 11月登场,艺术外观搭配强劲性能
紫金财经10月21日消息 华为常务董事、终端BG董事长余承东在微博上揭晓了华为路由X3Pro,将于11月正式上市。 华为路由 X3 Pro 主体呈圆柱形,上半部分是透明的,下半部分渐变熏黑,呈现出“日照金山…

2025-10-22

真我GT8 Pro深度体验:影像创新联动理光GR,性能越级再升级
使用真我GT8 Pro拍摄后就会发现,它可以说是把理光GR的整套理念和色彩科学都塞进了手机里。 长焦还上了2亿像素1/1.56英寸大底潜望,在3倍、6倍和12倍变焦下,画质都有很高可用性,也是长焦街拍的很好补…

2025-10-22

DeepSeek开源3B参数OCR模型:长文本压缩下实现高精度识别
10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。 据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长…

2025-10-22

iQOO 15性能旗舰登场:四款配色+顶级配置,4199元起售引爆手游市场
参数规格上,第五代骁龙8至尊版处理器采用的是目前现阶段制程工艺最成熟、性能最稳定的台积电3nm,处理器部分的话使用了第三代QualcommOryon CPU架构,主频为4.6GHz,性能核主频为3.62GH…

2025-10-22