虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

AMD集成DeepSeek-V3模型至MI300X GPU,AI推理能力再升级!

2025-01-25来源:ITBEAR编辑:瑞雪

AMD近期宣布了一项重大进展,成功将经过优化的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这一模型通过SGLang进行了强化,专为AI推理设计,旨在提升性能。

事实上,早在去年12月26日,AMD已在Github上发布了支持DeepSeek-V3模型的SGLang v0.4.1版本,为这一集成奠定了基础。

据AMD透露,DeepSeek V3是目前性能最强的开源大型语言模型(LLM),其表现甚至超越了GPT-4。这一成就得益于SGLang与DeepSeek团队的紧密合作,使得DeepSeek V3在发布首日便能在英伟达和AMD的GPU上顺利运行。AMD还特别感谢了美团搜索与推荐算法平台团队以及DataCrunch提供的GPU资源支持。

DeepSeek-V3模型采用了混合专家(MoE)架构,总参数量高达6710亿,每个token激活370亿参数,展现出强大的处理能力。为了实现高效推理和高经济效益的训练,该模型引入了多头潜在注意力(MLA)和DeepSeekMoE架构。

DeepSeek-V3开创性地采用了一种无辅助损失的负载平衡策略,并设置了多标记预测训练目标,进一步提升了模型的性能。这使得开发人员能够利用高级模型,同时处理文本和视觉数据,从而广泛获取先进功能,并享受更多功能带来的便利。

AMD Instinct GPU加速器与DeepSeek-V3的结合,为AI模型的运行带来了显著改善,特别是在推理方面。AMD表示,ROCm中广泛的FP8支持有助于解决内存瓶颈和高延迟等关键问题。这使得平台能够在相同的硬件限制下处理更大的模型或批处理,从而提高了训练和推理过程的效率。

FP8降低精度计算减少了数据传输和计算中的延迟。AMD ROCm扩展了其对FP8的支持,从框架到库,全面提升了性能和效率。这一技术革新为AI模型的高效运行提供了有力保障。

华为新品发布会火力全开:降价堆料,鸿蒙生态迎来新生命力
今下午华为也是如期举办了 Mate 80 & Mate X7系列以及全场景新品发布会,两个多小时里发布了十几款新品,涵盖手机、手表、平板、PC 、耳机等等种类。 不过 9020 的性能咋样大家已经很熟悉了…

2025-11-26

华为Mate 80系列11月28日开售,起售价下调800元,多版本价格公布
【太平洋科技】11 月 25 日消息,华为于今日下午正式发布 Mate 80 系列,新品起售价定为 4699 元,并宣布将于 11 月 28日上午 10 点 08 正式开售。值得关注的是,此次定价较前两…

2025-11-26

高通骁龙8 Gen5登场:3nm工艺全自研核心 性能功耗双突破
骁龙8 Gen5采用骁龙8 Elite Gen5同款的3nm工艺制程,并搭载高通自研的Oryon CPU与Adreno GPU。此外,在自研CPU与3nm工艺的加持下,骁龙8 Gen5的整体功耗降低13%…

2025-11-26

苹果iPhone Fold或2026年发布:无折痕+屏下前摄+超大电池成亮点
所有迹象都表明苹果已解决了困扰大多数折叠屏手机的折痕问题,爆料称iPhone Fold将成为市场上首款无折痕的折叠屏设备。 iPhone Fold将采用高密度电池,目前苹果正在测试5400-5800毫安时的…

2025-11-26

苹果2025年出货量或创新高,有望超越三星登顶全球手机市场
11月26日消息,据彭博社、businesstimes等多家外媒报道称,受益于iPhone 17系列(不含iPhone Air)的强劲销售表现,苹果公司2025年智能手机出货量预计将达到创纪录的2.55亿部,…

2025-11-26

华为nova 15系列进入工程设计阶段 配置亮点抢先看:影像卫星全升级
【CNMO科技消息】近日,有数码博主披露了华为nova 15系列的详细配置信息,并指出该系列新机已进入工程设计阶段。 根据爆料,华为nova15系列将至少推出标准版、Pro版与Ultra版三款机型。 芯片方…

2025-11-26

骁龙8 Gen 5正式登场:一加Ace 6T首发,多品牌新机将搭载
与“前代”骁龙8 Gen 3对比,骁龙8 Gen 5的CPU提升36%,GPU提升11%,AI提升46%,整体功耗降低13%。 对比骁龙8Gen 3(我们也没想到竟然是和它比),CPU提升36%,GPU提升…

2025-11-26