虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

英伟达Blackwell平台适配DeepSeek-V4系列模型 助力开发者高效部署与推理

2026-04-25来源:互联网编辑:瑞雪

英伟达近日宣布,其NVIDIA Blackwell平台已完成对DeepSeek-V4-Pro与DeepSeek-V4-Flash两款大模型的适配工作。开发者可通过NVIDIA NIM微服务直接下载部署,或基于SGLang、vLLM框架实现定制化推理,为AI应用开发提供更灵活的技术路径。

在模型参数配置上,DeepSeek-V4-Pro以1.6万亿总参数量与490亿激活参数的组合,专注于复杂推理场景;而DeepSeek-V4-Flash则采用2840亿总参数量与130亿激活参数的轻量化设计,主打高速响应需求。两款模型均支持百万级Token上下文窗口与最高38.4万Token的输出能力,可覆盖长文档分析、代码生成等核心应用场景,并采用MIT开源协议保障技术共享。

性能测试显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72集群上实现每用户每秒150个token的基准性能,通过vLLM框架的Day 0优化方案,可在Blackwell B300架构上快速完成部署。随着Dynamo编译器、NVFP4量化技术及CUDA内核的持续优化,模型推理效率有望进一步提升。

在部署生态构建方面,SGLang框架提供低延迟、均衡负载及最大吞吐量三种优化模式,满足不同场景的性能需求;vLLM框架则支持跨100个以上GPU节点的分布式推理,并集成工具调用与推测解码功能,为大规模AI服务提供技术支撑。这种多框架兼容的设计,显著降低了开发者将模型落地至生产环境的门槛。

iPhone18ProMax厚度近14mm成“砖机”?性能影像升级或成新亮点
据最新爆料,iPhone18ProMax 整机厚度(含摄像头凸起)达到 13.77mm,接近 14mm,相比 iPhone17ProMax 的12.92mm 增厚 0.85mm,机身本体厚度也从 11.23…

2026-04-25

一加Ace 6至尊版4月28日发布:大底主摄+120W闪充,游戏手柄成亮点
IT之家 4 月 25 日消息,一加 Ace6 至尊版手机将于 4 月 28 日 19:00 发布,博主 @数码闲聊站 今日对新机规格进行汇总。IT之家整理如下: 6.78 英寸 1.5K+165Hz L…

2026-04-25

华为Pura 90 Pro Max深度评测:影像出众设计新,6499元起成热门之选
本次评测我们将以 Pura 90 Pro Max 为核心展开体验,作为华为 Pura系列的最新旗舰,这一次在设计和影像上,还真有一些值得说道的细节—— 虽然这颗 1/1.28 英寸、2 亿像素的 4× 长…

2026-04-24

小米再推语音新模型:MiMo-V2.5-TTS与ASR补齐语音全链路,支持方言混说
4月24日,继前一日MiMo-V2.5系列大模型公测后,小米技术团队今日再次加码,正式发布MiMo-V2.5-TTS系列与MiMo-V2.5-ASR,补齐语音输入与输出全链路。MiMo-V2.5-TTS:内置…

2026-04-24

古尔曼爆料:苹果进军新领域,AI AirPods等6大新品蓄势待发
IT之家援引播客内容,古尔曼指出苹果正在积极拓展生态边界,主要包括可穿戴设备与智能家居两大核心赛道,其中 AI AirPods是现有耳机产品的延伸,但其余 5 款均代表苹果从未涉足的全新领域。 在智能家居…

2026-04-24