虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

华为携手湖北移动完成全国运营商首例AI推理加速测试:性能显著提升

2026-06-26来源:快讯编辑:瑞雪

在2026 MWC上海展期间,华为携手中国移动通信集团湖北有限公司(以下简称“湖北移动”)共同宣布,双方已顺利完成全国运营商首个AI推理加速解决方案的现网测试,标志着AI技术在运营商领域的应用迈出重要一步。

此次测试依托华为OceanStor A800存储系统与昇腾A3超节点架构,并引入UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了显著突破。测试数据显示,Token吞吐率最高提升达372%,为运营商智算业务的高效部署提供了强有力的技术支撑。

测试在湖北移动现网环境中展开,采用vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K的长序列输入场景。这一设计旨在全面评估AI推理加速方案在不同长度上下文下的性能表现。

在MiniMax M2.5模型测试中,启用UCM技术后,首Token延迟(TTFT)优化幅度达到26%至62%,单NPU卡Token输出效率(TPS)显著提升。具体而言,在64K序列长度下,TPS提升58%;在128K序列长度下,TPS提升78%,展现了该方案在长序列推理中的高效性。

而在GLM-5.1模型测试中,UCM的加速效果更为突出。TTFT优化幅度高达51%至93%,TPS提升范围则达到56%至372%。特别是在64K序列长度下,TPS提升313%;在128K序列环境下,TPS最高提升372%,进一步验证了AI推理加速方案在复杂场景下的卓越性能。

华为方面表示,测试结果表明,随着上下文长度的增加,AI推理加速方案的优势愈发明显。该方案有效解决了长序列推理中的KV Cache容量瓶颈问题,为运营商在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中提供了更高效的资源利用方案,同时降低了长上下文推理带来的性能压力。

高通2026年宣布收购Modular,携手打造高效AI系统加速行业转型
本次收购预计将进一步支持高通技术公司跨广泛平台和用例,提供更优化的AI计算层,深化高通技术公司数据中心战略的软件基础,在分布式AI系统中支持更高效的推理、规划与部署,同时加强与模型厂商、开发者、超大规模云服…

2026-06-26

2026毕业季礼物优选:OPPO数码全家桶深度评测,开启智能生活新篇章
更重要的是,它与Find X9s Pro通过ColorOS 16实现了无缝协同,支持通信共享、跨屏镜像、文件拖拽互传等功能。OPPO FindX9s Pro、Pad 5 Pro、Watch X3和Enco …

2026-06-26

vivo X Fold6官宣6月26日登场:2亿像素加持,轻办公与影像体验再升级
其中vivo影像迅速发展,比如2亿像素、影像芯片、外置镜头、色彩技术、蔡司加持等,从硬件到技术、功能均提升,直达专业影像水平,助力各大新机发展。 核心配置已预热,比如折叠屏、天玑芯片超能版、蓝海大电池、蔡司…

2026-06-26

专业版豆包实测:68元付费体验,办公效率升级还是“智商税”?
但AI幻觉的问题依然明显,比如,文心一言、千问等这种面向C端用户免费的AI应用也被它归入收费阵营,还自信编造了价格;而部分AI助手订阅价格则是和官网价格对不上。 说到底,为AI付费买的是服务质量,豆包面前有…

2026-06-26

三星率先发布UFS 5.0存储方案:性能飞跃,为端侧AI应用注入强劲动力
IT之家 6 月 23 日消息,三星电子今日宣布,其率先研发出了行业最快的通用闪存存储(UFS)5.0 解决方案,该产品将为新一代移动终端流畅、高效地运行各类人工智能服务提供支撑。小巧的封装尺寸可大幅提升手机…

2026-06-25