虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

黄仁勋谈AI芯片内存之争:SRAM容量受限 难撼HBM核心地位

2026-01-10来源:快讯编辑:瑞雪

在近期举办的CES 2026展会上,英伟达首席执行官黄仁勋就行业热议的“是否能用低成本SRAM替代昂贵HBM”问题给出了明确回应。这一讨论源于AI领域对降本增效的迫切需求——随着SRAM加速器、GDDR推理方案及开放权重模型的兴起,部分从业者认为这些技术可减少对英伟达高成本硬件的依赖。

SRAM(静态随机存取存储器)凭借其基于触发器的高速特性,在基准测试中展现出无延迟的访问优势,甚至被视为HBM(高带宽内存)的潜在替代者。黄仁勋承认,对于特定工作负载,SRAM的速度表现“令人惊叹”,但其致命缺陷在于容量限制——当前SRAM可容纳的模型规模仅为HBM系统的百分之一。当AI模型因上下文扩展或功能增加而超出SRAM容量时,系统必须调用外部内存,导致效率优势瞬间丧失。

他进一步指出,现代AI模型的多样性加剧了硬件适配的难度。混合专家模型(MOE)、多模态任务、扩散模型及自回归模型等架构对硬件的需求差异显著:有的依赖显存容量,有的依赖互连带宽(如NVLink),且需求随任务变化动态调整。若硬件过度优化某一特性(如纯SRAM方案),一旦工作负载类型改变,昂贵的芯片将因无法兼容而闲置,造成资源浪费。

基于这一判断,英伟达坚持选择HBM作为核心内存方案。黄仁勋解释,在共享数据中心场景中,硬件的灵活性直接决定经济效益。尽管HBM的物料成本更高,但其能适配算法和模型架构的快速迭代,确保硬件在数周甚至数月的运营周期内保持高利用率。相比之下,专用硬件虽能在5%-10%的任务中表现极致,却无法覆盖其余90%的通用需求,长期来看反而增加成本。

针对“开放模型是否会削弱英伟达技术壁垒”的质疑,黄仁勋回应称,开放并不等同于降低硬件要求。随着开放模型整合更长上下文和更多模态,其内存占用同样会呈指数级增长。英伟达选择承担HBM的高成本与复杂系统设计,正是为了保留“可选性”——既避免客户被锁定在狭窄的性能范围,也保护自身硬件免受模型架构快速迭代的冲击。这一策略的核心在于平衡短期成本与长期适应性,以应对AI技术演进的不确定性。

新一代小米SU7内饰升级引关注,雷军回应黑色内饰争议并揭晓四款选择
雷军表示:“看到黑色的内饰大家觉得是老登风,其实我们做了大量的用户调研,很多用户都希望有纯黑色的内饰。” 雷军还表示,新一代 SU7 将有 4套内饰供选择。 IT之家注意到,在外观设计方面,新一代小米 S…

2026-01-09

苹果M5 Ultra芯片采用新封装技术 或引发与英伟达台积电产能争夺战
月 9 日消息,科技媒体 Wccftech 昨日(1 月 8 日)发布博文,报道称随着 M5 Ultra 和 M6 Ultra芯片将引入更复杂的 3D 封装技术,苹果公司与英伟达在台积电先进产能上的长期“互…

2026-01-09

王腾新公司“今日宜休”收数百简历:优先组研发团队,反内卷倡导随时休息
1月9日,王腾原小米中国区市场部总经理、REDMI品牌总经理王腾在官宣成立新公司“今日宜休”后,今日表示已经收到了几百份简历,目前正在逐个筛选,薪资对标大厂。 王腾表示,公司初期重点组建产品研发团队,计划春节…

2026-01-09

歌尔微电子CES2026展风采:多领域传感器齐亮相,创新实力领航未来
水深气压传感器具备30-550kPa大量程优势,小尺寸设计可适配于智能手表;音频类骨声纹传感器以120-125μA低功耗、通用音频接口等优点,成为TWS耳机、AI眼镜的核心感知组件;距离检测传感器(1D To…

2026-01-09