虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

谷歌发布第八代TPU:8t强训8i快推,为AI智能体发展筑牢算力根基

2026-04-23来源:快讯编辑:瑞雪

在近期举办的 Cloud Next '26 峰会上,谷歌正式推出第八代 TPU 架构,包含专为训练设计的 TPU 8t 和聚焦推理的 TPU 8i。这两款芯片将于 2026 年下半年面向市场开放,采用申请制分配,Google Cloud 用户需通过官网提交使用需求。目前原生 PyTorch 对 TPU 的支持处于预览阶段,谷歌正与特定合作伙伴及早期客户开展小规模测试,以优化算力资源分配策略。

TPU 8t 通过多项技术创新重塑模型训练格局。其搭载的 SparseCore 核心专为混合专家模型优化,可解决此类模型因参数不规则激活导致的内存访问瓶颈。结合谷歌自研的 Virgo 网络拓扑,芯片间通信带宽翻倍,外部数据中心连接带宽提升四倍。通过 Direct Storage 技术绕过 CPU 直接读取高速存储数据,训练速度提升达十倍。在算力集群方面,单个超级计算单元集成 9600 颗 TPU 8t 芯片,共享 2PB 内存,总算力达 121 ExaFlops,单位成本算力较前代提升 2.7 倍,能效比实现两倍增长。

针对实时推理场景,TPU 8i 通过硬件架构革新突破延迟限制。其配备的 288GB 高带宽内存和 384MB 片上 SRAM(容量为前代三倍),可将完整对话上下文缓存于芯片内部,减少外部数据交互。集体通信加速引擎(CAE)将芯片同步延迟降低五倍,互联带宽提升至 19.2 Tb/s。新型 Boardfly 网络拓扑借鉴 Dragonfly 架构思想,使千颗芯片系统中任意两点通信路径缩短 56%,从 16 跳减少至 7 跳。这些改进使推理任务性价比提升 80%,搭配谷歌自研 Arm Axion 架构 CPU 后,系统整体能效再获显著优化。

谷歌此次技术迭代精准回应了 AI 发展对芯片的差异化需求。训练场景需要极致算力与高效协同,推理场景则要求低延迟与高能效。第八代 TPU 通过架构分型实现专业分工,TPU 8t 构建的超级计算集群可支撑千亿参数模型训练,TPU 8i 的长上下文处理能力则推动 AI 从简单预测向复杂决策演进。随着这两款芯片向全球云客户开放,开发者无需掌握新编程语言即可调用算力资源,谷歌提供的开源参考模型代码将进一步降低技术门槛。这一布局或将重新定义智能体时代的算力基础设施标准。

华为携手尼日利亚MTN:全球首启Sub-1GHz Massive MIMO商用新篇章
尼日利亚是非洲人口最多的国家,这次合作直接把当地低频4G网络能力带上新台阶。华为通过材料、架构和算法的改进,解决了低频大天线体积大、重量重、没法商用的老问题,把全频Massive MIMO 的最后一块短板…

2026-04-23

特努斯掌舵前布局AI,重组苹果硬件部门或开启高效开发新篇章
IT之家 4 月 22 日消息,彭博社昨日(4 月 21 日)发布博文,报道称在接棒掌舵苹果公司之前,约翰 · 特努斯(JohnTernus)已着手推动内部改革,开始利用人工智能重塑公司内部运营。 消息称特…

2026-04-23

金标联盟携手vivo等厂商推进“公平运行内存机制” 助力安卓应用体验升级
通知称,随着应用功能日益强大,内存资源变得尤为宝贵。在多样化的终端设备上,内存占用过高是导致卡顿、发热、后台应用被杀乃至闪退的主要原因之一。 为应对上述挑战,金标联盟牵头推进“公平运行内存机制”,旨在为开发…

2026-04-23

小屏与影像能否兼得?OPPO Find X9s Pro堆料出击能否突围?
所以在今年拿到 OPPO Find X9s Pro 的时候,我明显感觉 OPPO 这次是带着点“破釜沉舟”的感觉来的,一台 6.32英寸的小屏机,主摄和长焦竟然都用上了 2 亿像素的镜头,相机 App 从…

2026-04-23

OpenAI意外“剧透”:GPT-5.5等多款前沿AI模型现身Codex CLI终端
IT之家 4 月 22 日消息,OpenAI 今天(4 月 22 日)发布 ChatGPT Images 2.0 生图工具外,其偷跑的GPT-5.5 模型迅速成为网友热议焦点。根据部分网友反馈,在 Code…

2026-04-23