虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

华为携手湖北移动完成全国运营商首个AI推理加速现网测试 成效显著

2026-06-27来源:快讯编辑:瑞雪

华为与中国移动通信集团湖北有限公司(湖北移动)在2026 MWC上海展期间联合宣布,双方成功完成全国运营商首个AI推理加速解决方案的现网测试。这一突破性成果标志着运营商在智算业务领域的技术部署迈出关键一步,为长序列AI推理场景提供了高效解决方案。

测试基于华为OceanStor A800存储系统与昇腾A3超节点架构,通过集成UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了Token吞吐率最高提升372%的显著效果。该方案有效突破了传统架构在处理长上下文时的性能瓶颈,为运营商智算资源的高效利用提供了技术支撑。

在湖北移动现网环境中,测试团队部署了vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K长序列输入场景。结果显示,在MiniMax M2.5模型下,启用UCM后首Token延迟(TTFT)优化幅度达26%至62%,单NPU卡Token输出效率(TPS)显著提升。其中,64K序列长度下TPS提升58%,128K序列长度下提升78%。

GLM-5.1模型的测试数据更为突出:UCM使TTFT优化幅度达到51%至93%,TPS提升范围为56%至372%。具体来看,64K序列长度下TPS提升313%,128K序列长度下最高提升372%。这一成果表明,随着上下文长度的增加,AI推理加速方案的优势进一步放大,有效解决了长序列推理中的KV Cache容量限制问题。

对于运营商而言,该方案的应用将显著提升现网智算资源的利用效率。在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中,运营商可降低长上下文推理带来的性能压力,同时优化用户体验。华为表示,此次测试验证了AI推理加速方案在复杂场景下的可靠性,为运营商智算业务的大规模部署奠定了基础。

苹果调整Mac芯片战略布局:跳过M6高端款,全力聚焦AI计算的M7系列
IT之家 6 月 26 日消息,彭博社的马克 · 古尔曼(Mark Gurman)在最新 Power On 通讯简报中爆料,苹果公司计划调整M6 和 M7 系列芯片规划,跳过 M6 Pro 和 M6 Max…

2026-06-26

CounterPoint:2026年苹果在智能手机平板PC领域市场份额有望迎新高峰
在智能手机市场,Counterpoint 预估 2026 年苹果出货量持平 2025 年,但由于多数主要 OEM手机厂商出货量下滑,甚至可能出现 2 位数下跌,因此苹果 iPhone 的市场占有率将会达到…

2026-06-26

红米K90至尊版月底发布:骁龙8至尊芯+8550mAh电池,或2799元起售
屏幕部分,红米将为K90至尊版提供一块号称支持165Hz高刷新率支持的电竞屏幕,我大概瞄了一下官方目前公布的参数,大概率是与K90 Max同款屏幕,包括6.83英寸的大屏幕、继承M10发光技术,多场景峰值亮…

2026-06-26

三星Galaxy Z Fold8宽折叠手机新爆料:重量约201克,持握轻薄且屏幕折痕优化
月 25 日消息,消息源 yeux1122 昨日(6 月 24 日)在 Naver 平台发布博文,爆料称三星 Galaxy Z Fold8宽折叠手机上手体验“非常轻”,重量约为 201 克。 IT之家援引博…

2026-06-26