虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

谷歌发布TurboQuant算法:AI模型内存占用大减,长文本处理能力再升级

2026-03-26来源:快讯编辑:瑞雪

在人工智能技术飞速发展的当下,内存瓶颈已成为制约大模型性能提升的关键因素之一。谷歌研究院近日宣布推出一项名为TurboQuant的极端压缩算法,通过创新技术突破传统量化方法的局限,为解决大语言模型键值缓存(KV Cache)的内存问题提供了全新方案。

键值缓存作为大模型生成文本的核心机制,通过存储历史计算结果避免重复运算,但高维向量存储需求导致内存占用呈指数级增长。传统量化技术虽能压缩数据,却因需要为每个数据块计算量化常数,反而引入额外内存开销,使得长文本处理和大规模搜索场景仍受限制。谷歌团队此次提出的TurboQuant算法,通过两项底层技术创新实现了质的飞跃。

该算法的核心突破在于完全重构了数据压缩范式。第一步采用PolarQuant技术,将传统笛卡尔坐标系下的向量转换为极坐标表示,使数据自然映射到边界固定的圆形网格。这种转换消除了昂贵的数据归一化步骤,从根源上杜绝了内存开销的产生。第二步则通过量化Johnson-Lindenstrauss(QJL)算法处理微小误差,仅需1比特残差压缩即可实现数学级纠错,确保注意力分数计算精度不受影响。

实验数据验证了新算法的卓越性能。在Gemma和Mistral等开源模型测试中,TurboQuant无需任何模型调整即可将键值缓存压缩至3比特,在"大海捞针"等长上下文任务中实现零精度损失,同时将内存占用降低至原来的1/6。更令人瞩目的是,在H100 GPU加速器上,4比特版本的运行速度较32比特基准提升达8倍,彻底改变了量化必然牺牲性能的传统认知。

这项突破性成果不仅为AI基础设施优化提供了新思路,更可能重塑整个搜索业务的底层架构。随着模型参数规模持续扩大,TurboQuant展现的极致压缩能力与零精度损失特性,或将推动大模型在移动端、边缘计算等资源受限场景的广泛应用,为人工智能技术的普及化进程注入新动能。

荣耀600跑分库曝光:8GB内存+骁龙7 Gen4,中端市场新选择值得期待
3月25日消息,日前,一款疑似荣耀600标准版的设备现身Geekbench跑分库,根据曝光信息,这款新机对应型号为VKJ-NX9,页面显示其搭载代号为SM7750的芯片、配备8GB内存,并运行Android …

2026-03-26

苹果测试独立Siri应用:交互升级整合搜索,或随iOS 27亮相引期待
【iMobile爱科技资讯】3月25日,彭博社记者马克·古尔曼报道称,苹果内部正在测试代号为“Campo”的独立Siri应用,计划于今年6月WWDC全球开发者大会随iOS 27系统正式推出,这或许是Siri…

2026-03-26

苹果AI转型再加速:独立Siri应用将至,6月WWDC或重塑人机交互新生态
智东西3月25日消息,今日,彭博社援引知情人士报道,苹果公司正在测试一款可记录历史对话、支持上传文件分析的独立Siri应用,并计划推出系统级“Ask Siri”入口,允许用户在任意应用中直接调用AI处理选中…

2026-03-26

苹果硬件革新大动作:折叠屏iPhone与20周年纪念版蓄势待发
【太平洋科技】3月24日消息,马克·古尔曼近期透露,苹果正由硬件工程高级副总裁约翰·特努斯亲自挂帅,推进iPhone史上最大规模的一次产品革新,计划未来两年内推出折叠屏iPhone与iPhone 20周年…

2026-03-26