虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

谷歌TurboQuant技术:内存压缩六倍,AI应用或将迎来新突破

2026-03-26来源:快讯编辑:瑞雪

谷歌近日发布了一项名为TurboQuant的AI推理优化技术,引发存储行业震动。美光、SK海力士等存储巨头股价应声下跌,其中美光单日跌幅超4%,SK海力士在韩国股市开盘后迅速下挫3%,闪迪母公司西部数据股价更是一度暴跌6.5%。这项技术通过革新内存管理方式,直接冲击了存储芯片市场的供需预期。

作为AI推理阶段的"内存压缩算法",TurboQuant的核心突破在于将KV Cache(键值缓存)的内存需求降低至少6倍。这项技术采用双管齐下的策略:通过PolarQuant方法将32位高精度数据无损压缩至3bit级别,再利用QJL算法修正压缩过程中产生的误差。这种创新使得AI模型在保持性能的同时,显著减少了短期记忆所需的存储空间。

在AI应用场景中,内存消耗始终是制约发展的关键因素。当前主流模型在处理长对话时,需要持续记录上下文信息,导致内存占用随对话长度线性增长。TurboQuant的出现可能改变这一局面——以OpenClaw等Agent类产品为例,这些依赖长上下文记忆的AI系统,将有机会在相同硬件条件下处理更复杂的任务流程。

这项技术若实现大规模应用,将产生连锁反应。推理成本可能降至现有水平的六分之一,使更多AI服务具备商业化可行性;终端设备运行大型模型的可能性大幅提升,智能手机、车载系统甚至工业传感器都有望搭载更强大的AI功能。特别在边缘计算领域,内存需求的下降将突破硬件限制,推动AI应用向更多场景渗透。

不过技术落地仍面临挑战。目前TurboQuant仅在Gemma与Mistral等开源模型上完成验证,能否适配Gemini等闭源模型尚未可知。更关键的是,该技术仅优化推理阶段的内存使用,对模型训练成本和核心能力并无改进。存储行业分析师指出,虽然短期股价波动反映市场担忧,但长期影响取决于技术普及速度和实际效果。

时隔24年再续经典!ELECOM携手士郎正宗推出《攻壳机动队》联名鼠标复刻款
IT之家 3 月 26 日消息,日本硬件制造商 ELECOM 宜丽客在 2002 年的时候曾邀请漫画《攻壳机动队》作家士郎正宗与 ACG机械设定师 KATOKI 合作打造了两款名为 M.A.P.P. (机械…

2026-03-26

马斯克推进Terafab项目,特斯拉与SpaceX或合并以造芯片巨擘
根据Wedbush分析师的研究报告,随着Terafab计划的推进,预计特斯拉的德州超级工厂预计耗资将会高达250亿美元,而特斯拉与SpaceX或也因此合并,时间点很可能就是在明年,也就是2027年。 如果特…

2026-03-26

华为Pura X“阔折叠”新机或4月亮相,独特设计引领折叠屏新潮流
普通小折叠展开后是细长比例,而Pura X直接用了16:10的“阔比例”屏幕。 它拥有传统小折叠的便携性,同时也有可以比肩大折叠的生产力,随着越来越多厂商对这类产品的重视,“阔折叠”或将为用户带来更多出众的…

2026-03-26

苹果AI胸针新动向:或成iPhone“耳目”,搭载新Siri未来可期
硬件方面,该 AI 胸针内置麦克风,支持 Siri 语音方式和用户交互,但消息称苹果尚未决定是否加入扬声器。 在产品定位上,这款 AI胸针并非独立设备,而是作为 iPhone 的“眼和耳”存在。 系统层面…

2026-03-26

一加15T新机3月25日开售:电竞三芯加持,小直屏旗舰性能续航双突破
对比上一代,史诗级提升,比如电竞三芯、冰川大电池+百瓦闪充、旗舰小直屏、双防大满贯、OPPO影像、OPPO晶盾玻璃等方面,不愧是合并品牌,多方面资源共享。 电竞三芯,还有两芯分别是自研“电竞网络芯片G2”,…

2026-03-26

苹果iOS及iPadOS 26.4正式版更新:影音强化、无障碍升级与CarPlay新生态
iOS 26.4 正式版为丰富用户的日常沟通,在此次更新中新增了 8 个全新 Emoji表情,其中包括虎鲸、长号、山体滑坡、芭蕾舞者以及扭曲的人脸。 苹果在本次更新中,为进一步优化系统的包容性,在无障碍辅…

2026-03-26