虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

DeepSeek联合顶尖高校发布新论文,DualPath架构破解LLM推理性能瓶颈

2026-02-28来源:互联网编辑:瑞雪

研究团队通过实证分析发现,在典型编程任务场景中,智能体平均需要完成157轮交互,上下文长度累计达32.7K个语言单元,但每轮新增内容仅429个单元。这种"长上下文、短增量"的特性,使得键值缓存(KV-Cache)的加载效率成为决定系统性能的关键因素。实验数据显示,现有架构中存储带宽利用率存在严重失衡——预填充引擎的带宽资源长期处于满负荷状态,而解码引擎的带宽资源却有90%以上处于闲置状态。

硬件发展趋势进一步加剧了这种矛盾。以英伟达GPU架构演进为例,从Ampere到Blackwell架构,计算性能提升了14.4倍,但存储带宽和显存容量的增长幅度不足3倍。这种计算与存储能力发展的非对称性,导致传统预填充-解码分离架构的吞吐量提升遭遇天花板。

该架构的实现面临三大技术挑战:首先是数据传输粒度控制,研究团队设计了分层块传输机制,将缓存数据切割为不同粒度的传输单元,使网络开销降低60%;其次是流量隔离技术,通过引入中心化网络控制器和InfiniBand虚拟通道,确保关键计算任务不受数据加载影响;最后是动态调度算法,系统实时监测GPU负载、网络状态和任务特征,自动调整预填充与解码模块的资源分配比例。

性能评估显示,在包含6600亿参数的DeepSeek-V3.2模型测试中,新架构在离线批处理场景下实现1.87倍吞吐量提升,在线服务场景的智能体处理能力提升近2倍。更值得关注的是其扩展性表现:在由1152块GPU组成的集群测试中,系统从8节点扩展到144节点时,性能提升幅度达到理论值的92%,且延迟波动控制在5%以内。在44个预填充引擎+88个解码引擎的配置下,系统吞吐量较基线系统提升22倍。

DeepSeek V4预览版闭门内测开启:百万tokens上下文与多模态能力引期待
【太平洋科技】2月26日消息,随着发布临近,DeepSeek V4更多技术细节曝光。据消息源@Legit透露,DeepSeek已开始对其代号为“sealion-lite”的V4预览版进行闭门内测,参与方均…

2026-02-27

广汽集团布局具身智能赛道 慧仑科技开启机器人产业规模化发展新篇
2月26日,广汽集团宣布正式宣布孵化成立广东慧仑科技有限公司(下称“慧仑科技”)。 官方介绍,作为广汽集团布局具身智能赛道的核心载体,慧仑科技将以独立主体身份开展市场化运营,全面承接广汽集团在该领域的业务,开…

2026-02-27

AI文生视频领域新突破:快手可灵3.0系列登顶全球榜单引领变革
IT之家 2 月 27 日消息,AI 基准测试机构 Artificial Analysis发布最新一期全球视频生成大模型榜单,在文生视频赛道上,快手可灵 3.0 系列模型(Kling 3.0 Pro)以 1…

2026-02-27

OPPO Find N6折叠屏新突破:AI手写笔加持,浅折痕设计引领体验升级
2月27日消息,OPPO Find系列产品负责人周意保正式对外透露,即将登场的折叠屏新机6将配备手写笔,且并非普通手写笔,而是搭载行业首发AI功能的AI手写笔,将为用户带来“旦用难回”的使用体验。这一消息也让…

2026-02-27

阿里持续加码AI领域:千问与夸克AI眼镜同源研发,多款AI终端将全球发售
据IT之家今日早些时候报道,千问将在西班牙巴塞罗那举行的 2026 年世界移动通信大会(MWC)上发布首款同名 AI 眼镜,并于 3 月 2日开启线上线下全渠道预约。千问 App 点外卖、打车等能力,也将…

2026-02-27

石头科技再获外观专利:清洁机器人交互革新,开启智能家居新体验
这一创新不仅展现了公司在智能清洁技术领域的深厚积累,也为提升用户交互体验提供了新的可能。第三方机构的报告显示,87%的用户关注清洁机器人与智能家居系统的联动功能,76%的用户愿意为可视化交互界面支付溢价。 总…

2026-02-27