一篇尚未正式发布的学术论文,在国际科技圈与金融市场掀起轩然大波。3月26日,全球存储芯片板块遭遇剧烈震荡,多家内存巨头市值单日蒸发超900亿美元,这场风波的源头指向谷歌研究院即将在国际学习表征会议(ICLR 2026)上展示的论文“TurboQuant”。
当前AI模型与用户交互时,需持续记录对话历史上下文,这部分临时存储的数据报道存在夸大成分。当前主流推理模型已普遍采用4-bit量化技术,谷歌宣称的“8倍性能提升”是基于与32位老旧模型的对比结果。
摩根士丹利引用经济学中的“杰文斯悖论”分析长期影响:技术效率提升虽能降低单位使用成本,但往往会因应用门槛降低而刺激整体需求增长。富国银行分析师Andrew Rocha则强调,压缩算法从未改变硬件采购的总体规模,这类技术更多是通过降低单次查询成本,推动AI模型从云端向本地设备迁移,从而扩大部署范围。
从供应链数据看,2026年服务器DRAM需求预计增长39%,HBM需求年增幅达58%。市场分析认为,TurboQuant的优化效果可能被行业整体增长趋势所稀释。截至目前,谷歌尚未公布该技术在Gemini等自研模型中的具体应用时间表,相关技术讨论将于4月的ICLR 2026会议上持续深入。