虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

DeepSeek联合北大发布DSpark框架:突破推理瓶颈 速度提升最高达85%

2026-06-28来源:互联网编辑:瑞雪

DeepSeek团队与北京大学联合攻关,在提升大语言模型推理效率领域取得重大突破。研究团队提出的DSpark技术框架,通过创新性的解码机制,成功破解了高并发场景下模型响应速度与生成质量难以兼顾的行业难题。实测数据显示,该技术使单用户文本生成速度较现有主流方案提升最高达85%,相关成果已发表于最新研究论文。

传统自回归模型在生成文本时,每个新token的产出都需要完整的前向计算过程,这种串行工作模式导致推理延迟随输出长度线性增加。特别是在实时对话等交互场景中,过长的响应时间不仅损害用户体验,更造成GPU算力的闲置浪费。研究团队指出,现有推测解码技术虽尝试通过草稿模型加速,但存在明显缺陷:串行草稿模型生成延迟随候选长度攀升,并行草稿模型则因缺乏token间依赖关系导致大量无效计算。

DSpark框架的核心创新在于构建了"并行生成+顺序校验"的混合架构。其半自回归生成机制在并行生成主干上嵌入轻量级顺序模块,该模块通过两种实现方式——马尔可夫头与RNN头,动态注入前缀依赖信息。实验表明,仅需两层Transformer结构的DSpark模型,在候选token接受长度指标上已超越五层结构的DFlash模型。这种设计既保持了并行生成的高效性,又通过顺序校验确保了生成质量。

针对传统验证机制算力浪费的问题,研究团队开发了置信度调度验证系统。该系统通过硬件感知前缀调度器,实时评估每个请求的成功概率与系统负载,动态调整验证长度。具体而言,模型在每个候选位置输出置信度分数,调度器据此为不同请求分配差异化算力资源,优先处理预期回报高的token。在线上系统测试中,该机制使推理速度提升60%-85%,同时将高并发场景下的吞吐损耗控制在合理范围。

目前,DSpark技术已深度集成至DeepSeek-V4系列模型,在真实线上流量中验证了其有效性。研究团队同步开源了模型检查点与训练框架DeepSpec,该代码库包含Eagle3、DFlash和DSpark等推测解码训练模块,为学术界和产业界提供了完整的技术解决方案。值得注意的是,DeepSeek创始人梁文锋作为核心成员参与了该项研究,其技术积累为项目突破提供了重要支撑。

vivo X Fold6折叠屏新机来袭!7月1日开售,处理器系统定制亮点多
愿意买折叠屏手机的消费者,相比前几年已经是越来越多了,我其实也挺建议预算充足能买iPhone的消费者,可以尝试一下折叠屏手机,因为现在的折叠屏手机比之前进步了很多,越发轻薄的同时折痕也越来越不明显了,关键是拿…

2026-06-28

三星或重启Galaxy A系列s后缀机型,新机SM-A077F踪迹现Wi-Fi联盟数据库
IT之家 6 月 27 日消息,科技媒体 sammyguru 昨日(6 月 26 日)发布博文,报道称基于 Wi-Fi联盟数据库信息,三星有望为 Galaxy A 系列重启推出 s 后缀机型。 IT之家查询…

2026-06-27

Bigme全球首推大双屏彩墨手机!性能强劲外观独特引期待
目前比较担心的是存储和售价,毕竟墨水屏才是它的主屏,同时价格方面肯定比主流手机更贵。最后提醒两件事:其一是该机的价格应该会很感人,毕竟Bigme Hibreak Dual(如上图)价格就有点高,8GB+12…

2026-06-27

苹果Vision Pro及智能眼镜项目负责人保罗·米德下周离职 加盟OpenAI硬件部门
米德将于下周离开苹果并加入 OpenAI 硬件部门,参与 AI 设备研发工作。现任 Vision Pro 与智能眼镜产品设计负责人弗莱彻 ·罗斯科夫(IT之家注:Fletcher Rothkopf)将接手…

2026-06-27

高通骁龙8系列旗舰芯片方案揭晓,2nm制程多版本可选,Pro版或成高端新宠
结合其中的信息来看,后续似乎会有骁龙8 Elite Gen6 Pro、骁龙8 Elite Gen6两款2nm旗舰芯片。关于这两款芯片,以往的消息显示高通目前正测试 6 个骁龙 8 Elite Gen 6 …

2026-06-27