虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

梁文锋参与!DeepSeek联合北大发布DSpark框架 提升大模型推理效率与速度

2026-06-28来源:天脉网编辑:瑞雪

当行业还在聚焦大模型“智力竞赛”时,DeepSeek另辟蹊径,将研发重心转向提升模型推理效率。近日,该团队联合北京大学在GitHub发布最新研究论文,公开了其自研的推理加速框架DSpark,并同步开源模型权重与训练代码,试图破解大语言模型在高并发场景下的性能瓶颈。

论文核心聚焦于自回归生成机制的固有缺陷——每个新词元的生成均需依赖完整前向传播,导致输出越长、延迟越高。这种特性直接引发两大问题:GPU资源利用率低迷,以及用户等待时间呈指数级增长。尤其在实时对话、多轮智能体协作等对延迟敏感的场景中,该问题已成为制约模型落地的关键障碍。

研究团队指出,现有解决方案存在明显短板:自回归草稿模型(如Eagle3)虽能保证生成质量,但系统吞吐量受限;并行草稿模型(如DFlash)虽提升效率,却牺牲了部分输出准确性。更关键的是,两类方案均缺乏动态负载调节能力,难以适应复杂多变的实际需求。

DSpark框架创新性采用半自回归架构,通过融合并行主干与轻量级串行模块,在保持高吞吐优势的同时,逐词元注入前缀依赖信息。该模块提供两种实现路径:马尔可夫头仅依赖前一词元,实现极低计算开销;RNN头则通过循环状态累积完整上下文,平衡效率与准确性。实验数据显示,两层Transformer结构的DSpark在所有测试领域中,均超越五层DFlash的接受长度。

实际部署效果印证了技术突破的价值。在DeepSeek-V4在线服务系统中,DSpark在相同吞吐量条件下,将用户端生成速度提升60%-85%。当该框架应用于阿里Qwen3系列模型时,4B、8B、14B版本的单轮可接受词元长度,较自回归草稿模型分别提升30.9%、26.7%、30%,较并行草稿模型提升16.3%-18.4%。

值得关注的是,DeepSeek创始人梁文锋直接参与论文研究,这从侧面反映出企业对技术落地的重视程度。通过开源模型权重与训练代码,研究团队不仅为学术界提供研究基准,更为工业界部署高效推理系统开辟新路径。这项突破或将重新定义大模型的应用边界——在追求智能上限的同时,通过工程优化释放底层算力潜能。

马斯克获FTC批准收购Mesh Optical,加速AI数据中心光通信技术布局
月 27 日消息,据彭博社今天报道,埃隆 · 马斯克已获得美国联邦贸易委员会(FTC)批准,收购初创公司 Mesh OpticalTechnologies Corp。 根据 FTC 披露的反垄断审查信息,本…

2026-06-28

存储涨价背景下vivo X Fold6定价7999元引关注 黄韬:销量预期超上代30%
发布会结束后,vivo公司副总裁、产品副总裁黄韬,以及vivoX系列产品总经理韩伯啸一同出席了媒体群访环节,和在场媒体深入聊透了这台新折叠屏背后的产品思考。 现场有媒体问到,上一代X Fold5市场表现非…

2026-06-28

苹果iPhone 18标准版或配9GB内存,A20芯片+新封装方案引关注
值得一提的是,消息源 @Reptalicant 昨日(6 月 26 日)在 X 平台发布推文,分享了苹果 iPhone 18 Pro主板信息, 显示 A20 Pro 芯片将采用 WMCM 封装,替代 A1…

2026-06-28

WPS回应C盘占用难题:新版本将增自定义安装与存储管理 助用户自主管理空间
WPS表示,缓存与备份默认存放在C盘、占用情况不够直观,确实给部分高频用户造成了困扰,此次优化的核心逻辑是"安装有选择、使用可管理",让用户从安装到使用的每个环节中,都能清楚了解本地占用了多少、哪些可以清理…

2026-06-27

vivo X500E新机曝光:6.59英寸中屏配骁龙8系,蔡司影像加持引期待
IT之家 6 月 27 日消息,据博主 @数码闲聊站 今日爆料,某厂 X 系列 E 新成员搭载 6.59 英寸中屏,左上角小方块Deco,配备骁龙 8 系处理器,后置蔡司影像 +IMX8 中底潜望长焦。 I…

2026-06-27