虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

F5中国推出TBLB方案:以Token为核心,破解异构算力调度难题提效能

2026-06-05来源:互联网编辑:瑞雪

在AI大模型推理从实验室走向大规模应用的关键阶段,如何高效调度异构算力资源成为行业焦点。应用交付与安全领域头部企业F5中国近日宣布,推出全球首个基于词元(Token)的负载均衡解决方案(TBLB),通过重新定义算力调度逻辑,为AI推理场景提供更精准的资源分配方案。该方案已在汽车、金融、通信等多个行业完成验证,实测显示可在不增加硬件投入的情况下,将GPU利用率提升最高60%,端到端响应速度提升近50%。

传统负载均衡技术诞生于互联网时代,主要依据连接数或请求数进行流量分配。但随着大模型推理进入高并发阶段,这种"平均分流"模式暴露出明显短板。F5中国区产品负责人指出,在AI场景中,单个请求的计算量可能相差百倍,真正消耗GPU资源的并非请求数量,而是Token规模、上下文长度及推理复杂度。特别是在中国特有的异构算力环境中,企业常混合部署NVIDIA、华为、阿里等不同厂商的GPU,传统方案难以准确感知底层算力状态,导致部分节点过载而其他节点闲置。

TBLB方案的核心突破在于构建了"算力感知"调度体系。该方案通过实时采集Token数量、GPU负载、KV Cache状态、任务队列长度等12项关键指标,运用动态权重算法调整请求分配策略。例如在汽车行业客户案例中,由6块A40与8块L20组成的混合算力集群,在部署TBLB后,Token生成速度提升30.3%,端到端响应时间缩短48%,且未产生任何额外硬件成本。通信运营商采用华为Ascend 910B的测试环境显示,并发用户数提升75%,Token处理效率近乎翻倍。

这种技术革新正推动行业基础设施逻辑发生根本转变。F5北亚区总裁黄彦文强调,AI竞争已从单纯的模型参数比拼,延伸至推理环节的资源调度效率。当前GPU迭代周期缩短至12-15个月,企业面临巨大的资产折旧压力,提升现有设备利用率成为关键。TBLB方案支持跨品牌、跨代际GPU的统一调度,经实测可将混合算力集群的整体利用率提升60%,有效延长硬件生命周期。

值得关注的是,这项源于中国实践的创新正在走向全球舞台。F5已成立专门的AI应用工程部,将TBLB的核心调度算法与全球客户场景深度融合。黄彦文透露,虽然创新发端于中国市场,但"Token中心化"的调度理念已获得国际认可,成为AI基础设施演进的重要方向。这种技术输出与本土创新的双向互动,印证了中国在AI工程化领域的领先地位。

在战略布局层面,F5中国将业务航道升级为"本地AI赋能"与"支持企业出海"双轮驱动。一方面围绕智能原生应用构建本地化能力中心,另一方面针对新能源汽车、高端制造等优势产业的全球化需求,提供覆盖多云环境的应用交付与安全解决方案。这种转变既体现了技术供应商的角色升级,也折射出中国AI产业从应用创新向基础技术输出的路径演进。

苹果战略调整:移除Vision Pro系列,押注AI眼镜或开启大众市场新篇章
北京时间6月4日凌晨,知名苹果分析师郭明錤发布最新供应链调查称,苹果已正式从其XR头显与智能眼镜路线图中移除Vision Pro系列后续产品,资源全面转向更具大众市场潜力的AI眼镜品类。古尔曼此前透露,苹果仍…

2026-06-05

2026年5月安卓次旗舰性能榜揭晓:iQOO Z11夺冠 荣耀600 Pro等多款机型上榜
在iQOO Z11和荣耀600 Pro之后,荣耀WIN Turbo和OPPO K15 Pro分列第三名和第四名。 在硬件配置上,OPPOReno15 Pro这款智能手机搭载联发科天玑 8450 处理器,配…

2026-06-05

AMD高管谈英伟达RTX Spark入局AI PC:欢迎竞争,自信自家产品实力强劲
不过蒂库认为自家 Strix Halo 和后续 Gorgon Halo 足以与 RTX Spark 竞争,他还喊话开发者,称:“就目前而言……我的意思是,如果你不买 Strix Halo 笔记本电脑,那就…

2026-06-05

华为畅享再掀波澜!千元机或配大屏万级电池,性价比卷出新高度
不过退一步讲,从数据仅供参考的角度,现有市场 3000元以下的手机还是有很多可供消费者选择,只要咱不太追求更新的技术配置,取舍之间依旧可以保持乐观。 目前爆料还不多,但仅供参考也直接把市场期待带起来了,这…

2026-06-05

Ideogram 4.0开放权重文生图模型发布,文字绘制突出成全球开源佳作
该模型核心规模为 9.3B 参数,延续近期开源模型的单流架构路线,让文本 tokens 与图像 tokens 共享同 1个自注意力序列,并把设计控制放在训练和推理格式的中心。 官方展示的样例显示,该模型可…

2026-06-05

华为激进策略助力鸿蒙生态,畅享系列新机或成达成1亿目标关键
这还没完,这个王炸系列又有了畅享100 Pro Max的最新爆料。虽然目前爆料还不多,但也已经把市场期待带起来了,更不要说华为一系列的激进打法对手机市场的影响,这是要变天了呀! 看似是简单的价格战,实则背后…

2026-06-04

一加新机屏幕策略揭晓:持续1.5K方案 刷新率迈向更高台阶
据CNMO科技了解,该博主在今年4也透露过别的信息——一加16或采用直屏设计,该机的尺寸约为6.78英寸。一加Ace 6至尊版配备165Hz超高刷东方屏,在行业独家“瞬发战斗显示”技术的加持下,实现0.1m…

2026-06-04

郭明錤透露苹果路线图调整:移除Vision Pro系列,转向AI眼镜布局
IT之家 6 月 4 日消息,北京时间周四凌晨,分析师郭明錤发帖称,苹果 XR 头显和智能眼镜路线图中仅剩两款智能眼镜产品可见。郭明錤还表示,这次重大调整由苹果下一任 CEO 约翰 · 特努斯(John T…

2026-06-04