虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

英伟达联手高校推出Fast-dLLM框架,AI推理速度大幅提升最高达27.6倍

2025-06-03来源:ITBEAR编辑:瑞雪

近期,科技界迎来了一项重要突破,英伟达携手麻省理工学院(MIT)及香港大学,共同推出了Fast-dLLM框架,这一创新成果旨在显著提升扩散模型(Diffusion-based LLMs)的推理速度,为语言生成任务带来了全新的可能性。

扩散模型,作为传统自回归模型的有力挑战者,凭借其双向注意力机制,理论上能够实现多词元同步生成,从而加速解码过程。然而,在实际应用中,扩散模型的推理速度却往往不尽如人意。原因在于,每次生成步骤都需要重新计算全部注意力状态,这导致了高昂的计算成本。多词元同步解码时,词元间的依赖关系容易受到破坏,进而影响生成质量,使得扩散模型难以满足实际应用的需求。

为了突破这一瓶颈,英伟达联合团队研发了Fast-dLLM框架,该框架引入了两大核心创新:块状近似KV缓存机制和置信度感知并行解码策略。这一创新设计,为扩散模型的推理速度和质量带来了显著提升。

在Fast-dLLM框架中,KV缓存机制通过将序列划分为块,预计算并存储其他块的激活值,以便在后续解码中重复利用,从而显著减少了计算冗余。而其DualCache版本更进一步,缓存了前后缀词元,利用相邻推理步骤的高相似性,进一步提升了效率。这一机制的实施,为扩散模型的推理速度带来了质的飞跃。

另一方面,置信度解码策略则根据设定的阈值,选择性解码高置信度的词元,从而避免了同步采样带来的依赖冲突,确保了生成质量。这一策略的实施,使得扩散模型在保持高质量生成的同时,进一步提升了推理速度。

Fast-dLLM框架在多项基准测试中均展现出了惊人的表现。在GSM8K数据集上,生成长度为1024词元时,其8-shot配置下实现了27.6倍的加速,准确率高达76.0%。在MATH基准测试中,加速倍数为6.5倍,准确率约为39.3%。而在Humaneval和MBPP测试中,分别实现了3.2倍和7.8倍的加速,准确率维持在54.3%和基线水平附近。这些测试结果表明,Fast-dLLM框架在加速推理的同时,仅牺牲了1-2个百分点的准确率,成功实现了速度与质量的平衡。

Fast-dLLM框架的成功推出,标志着扩散模型在实际语言生成任务中具备了与自回归模型竞争的实力。这一创新成果不仅解决了推理效率和解码质量问题,更为扩散模型的广泛应用奠定了坚实基础。未来,我们有理由相信,随着技术的不断进步和完善,扩散模型将在更多领域展现出其独特的优势和潜力。

网友苦等一加15终有回应 李杰承诺不辜负期待 165帧游戏新体验即将登场
快科技10月23日消息,有网友给一加中国区总裁李杰留言:前面那么多新机都没买,就一直等着一加15。李杰回复:“等等党不会输”。 从120帧到165帧,游戏帧率的突破不仅是参数上的跃升,更是手游体验的一次大换代…

2025-10-23

结构力学测试龙头东华测试:业绩稳增,布局机器人赛道谋新发展
据了解,东华测试是国内领先的结构力学性能研究和电化学工作站整体解决方案企业,前身为成立于1993年的靖江东华测试技术开发有限公司,2012年在深交所成功上市,其产品广泛应用于国内航空航天、重大装备、大型建筑…

2025-10-23

一加Turbo系列新机将至:8000mAh大电池+骁龙8 Gen5,性能续航双突破
综合性能表现上,安兔兔评测跑分有望突破340万分,定位为高通产品线中的次旗舰平台,性能略低于骁龙8 Elite Gen5移动平台。 市场信息显示,一加有望成为该平台的首发品牌,新机或将归属于一加Turbo系列…

2025-10-22

远程协作新利器?皓丽四摄AI会议平板深度体验,解锁会议效率新境界
传统会议平板最大的痛点之一就是摄像头性能不足,单一镜头难以兼顾全景与特写,导致远程与会者往往难以获得沉浸式体验。 在远程办公和跨地域协作成为常态的今天,这样一款智能会议平板,无疑能为企业提供实实在在的效率和…

2025-10-22

华为Mate80系列将携鸿蒙6.0登场,多款新品齐聚11月28日星光盛典
据说,鸿蒙6.0在全新的方舟引擎和鸿蒙内核的支持下,App冷启动速度快30%,多任务切换无掉帧。 Mate 80 系列有四款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro+ 以及…

2025-10-22

小米17 Pro系列爆发式增长:前三周占比近85%,成功吸引iPhone用户转投
【CNMO科技消息】10月22日,有博主爆料称,小米17系列开售前三周,出货量较上代增长12%。其中,17 Pro系列两款机型的出货量比上代一款Pro机型增长了141%,也就是上代的2.4倍。CNMO了解到,…

2025-10-22

余承东微博官宣:华为路由X3Pro 11月登场,艺术外观搭配强劲性能
紫金财经10月21日消息 华为常务董事、终端BG董事长余承东在微博上揭晓了华为路由X3Pro,将于11月正式上市。 华为路由 X3 Pro 主体呈圆柱形,上半部分是透明的,下半部分渐变熏黑,呈现出“日照金山…

2025-10-22

真我GT8 Pro深度体验:影像创新联动理光GR,性能越级再升级
使用真我GT8 Pro拍摄后就会发现,它可以说是把理光GR的整套理念和色彩科学都塞进了手机里。 长焦还上了2亿像素1/1.56英寸大底潜望,在3倍、6倍和12倍变焦下,画质都有很高可用性,也是长焦街拍的很好补…

2025-10-22

DeepSeek开源3B参数OCR模型:长文本压缩下实现高精度识别
10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。 据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长…

2025-10-22

iQOO 15性能旗舰登场:四款配色+顶级配置,4199元起售引爆手游市场
参数规格上,第五代骁龙8至尊版处理器采用的是目前现阶段制程工艺最成熟、性能最稳定的台积电3nm,处理器部分的话使用了第三代QualcommOryon CPU架构,主频为4.6GHz,性能核主频为3.62GH…

2025-10-22