谷歌近日推出了一种新的压缩算法TurboQuant,旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大,这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下,将键值缓存压缩至3比特精度,并且基本保持模型准确率不受影响。
测试结果显示,TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中,与未量化的键向量相比,该算法最高可实现约8倍的性能提升。研究人员表示,这项技术不仅适用于AI模型,还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。
广深机场出现大面积延误 强对流天气影响航班
受强对流天气影响,3月30日广州白云机场出现大面积航班延误,延误比例达88%,成为国内临时取消航班量最多的机场。同一时间,深圳宝安机场的进港航班延误率为41.46%,有12班次备降
0评论2026-03-3114
欧洲航空机构关注冲突引发的安全风险 战争重塑空域安全
欧洲最高航空安全监管机构表示,随着飞行走廊被挤压和无人机的普及,战争正在加剧航空业的风险。伊朗战争持续一个月,重塑了中东地区的空域,增加了对航班的干扰,堵塞了亚洲和欧洲之间以前中转或飞越该地区的航线
0评论2026-03-3115
阿里千问上线全模态大模型 支持多语种音视频输入
3月30日,阿里千问宣布全模态大模型Qwen3.5-Omni上线。该系列包括Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文
0评论2026-03-3115
下半年猪价或温和上涨 消费旺季拉动
3月30日午盘,市场避险情绪明显,农业ETF华夏(516810)出现回落。截至14:18,跌幅为0.11%。持仓股中,北大荒、天马科技和苏垦农发领涨,农发种业、扬农化工和广信股份等股票跟随上涨
0评论2026-03-3114