虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

华为数据存储携手中科弘云 推出AI推理加速方案 赋能多行业应用

2025-12-23来源:快讯编辑:瑞雪

华为数据存储与中科弘云近日联合推出了一项AI推理加速解决方案,旨在通过软硬件深度协同优化,为长序列推理场景提供高效算力支撑。该方案以华为OceanStor A系列存储为核心数据底座,结合中科弘云自主研发的HyperCN智算互联网云服务平台,构建起覆盖数据存储、算力调度、推理加速的全栈能力体系。

在技术架构层面,方案创新性地融合了华为UCM推理记忆数据管理技术与中科弘云平台能力。通过KV Cache多级缓存管理机制,将推理过程中的关键数据持久化存储于OceanStor A系列设备,实现推理记忆的全量保存与快速调用。这种设计有效减少了重复计算开销,配合Prefix Cache与GSA稀疏加速算法,在长序列推理场景中可显著降低首Token生成时延(TTFT)。实测数据显示,在智能问答典型场景中,该方案使TTFT降低57.5%,且序列长度与优化效果呈正相关关系。

针对复杂算力环境,方案构建了异构资源管理体系。系统支持英伟达、华为昇腾、寒武纪等多品牌AI芯片的协同调度,兼容MindSpore、vLLM、SGLang等主流开发框架,并通过Kubernetes容器编排技术实现与存储系统的无缝对接。这种设计使得能源电力、智能制造等行业的用户能够灵活整合现有算力资源,避免硬件锁定带来的技术风险。

在算力调度方面,方案采用细粒度资源池化策略,可根据业务需求动态分配计算资源。系统具备集群作业调度、实时健康监测、故障自动恢复等运维能力,支持分钟级任务重启与系统自愈。特别是在长文档处理场景中,结合GSA稀疏加速算法后,当序列长度达到39K时,系统并发处理能力提升86%,整体推理吞吐量增长36%,有效提升了复杂模型的生产部署效率。

为降低AI开发门槛,方案提供覆盖全流程的端到端工具链,涵盖数据标注、模型训练、推理部署等关键环节。工具链同时支持传统机器学习与深度学习开发模式,实现AI资产的标准化管理。目前该方案已在国家实验室、能源电力、智能制造等领域启动试点应用,通过实际场景验证了其在复杂业务环境中的技术可行性。

华为nova 15系列及全场景新品发布,影像性能升级成亮点
据介绍, nova 15 Ultra 搭载 双星镜头模组设计,可选好搭紫、带感绿、零度白、幻夜黑四款配色,以及 2.5D 直屏设计,厚度6.8mm,重量约 209g。 与华为 nova 15 Ultra …

2025-12-23

影石Insta360 Wave悬浮设计+AI赋能,解锁会议与多元场景新体验
为全面了解影石Insta360 WaveAI录音全向麦克风的实际表现,我爱音频网对其进行了详细的测试与体验,主要为外观设计、使用体验和数据实测。 有意思的是,影石Insta360 Wave可以与影石Ins…

2025-12-23

《数字市场法案》显成效 欧盟点赞苹果iOS 26.3系统互操作性新提升
《数字市场法案》要求苹果公司向第三方配件开放与苹果自家产品同等的功能权限和设备功能访问权。在 iOS 26.3系统中,欧盟地区的可穿戴设备制造商现已能够测试近距离配对功能和优化后的通知功能。 通知功能 —…

2025-12-23

阿里千问再发力!1999元G1 AI眼镜登场,性能拉满开启亲民新篇章
与S1不同的是,G1不带显示能力,这一方面对近视用户群体更友好,其可以自由选择配镜功能,另一方面也能缩短发货周期,更快铺货。 在吴嘉看来,用户选择夸克AI眼镜,其实相当于选择了阿里巴巴千问大模型和整个阿里巴…

2025-12-23

华为小艺管家全新升级:四大维度进化,让智能家居“听懂”你的生活
可以看到,小艺管家“场景大师”的能力,真正将场景的自定义自主权还给了用户,而它,就像一位 24 小时在线的智能家居配置专家,让你无需接触 APP,仅凭语音就能完成场景的创建与修改。其在理解、创造、聆听、执行…

2025-12-23