谷歌近日推出了一种新的压缩算法TurboQuant,旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大,这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下,将键值缓存压缩至3比特精度,并且基本保持模型准确率不受影响。
测试结果显示,TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中,与未量化的键向量相比,该算法最高可实现约8倍的性能提升。研究人员表示,这项技术不仅适用于AI模型,还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。
“中东第一网红”阿波哥开启深圳行 打卡荣耀旗舰店体验科技魅力
5月29日,被称为“中东第一网红”的阿波哥访问了深圳,并专程前往深圳湾万象城的荣耀阿尔法全球旗舰店。他深度体验了荣耀手机、PC、平板、智能穿戴等全品类前沿产品,近距离感受中国品牌在端侧AI领域的技术突破与创新实力
0评论2026-05-3016
国内航司燃油附加费自6月5日起下调 出游成本降低
自2026年6月5日起,国内多家航空公司下调燃油附加费。具体来说,800公里以上航线每位成人旅客的燃油附加费将调整为150元,800公里及以下航线则为80元。相比之前的收费标准,分别降低了20元和10元。这一调整有助于降低旅客的出游成本
0评论2026-05-3014
张雪机车位列超级杆位赛第二名 法国车手表现出色
在刚刚结束的2026世界超级摩托车锦标赛(WSBK)阿拉贡站WorldSSP组别比赛中,中国摩托车制造商“张雪机车”的法国车手瓦伦丁·德比斯获得了超级杆位赛第二名
0评论2026-05-3013