推广 热搜: 广州  SEO  贷款  深圳    医院  用户体验  网站建设  贵金属  机器人 

谷歌推出压缩算法 实现约6倍内存节省(图)

   2026-03-27 互联网顺发之窗网3

谷歌近日推出了一种新的压缩算法TurboQuant,旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大,这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下,将键值缓存压缩至3比特精度,并且基本保持模型准确率不受影响。

测试结果显示,TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中,与未量化的键向量相比,该算法最高可实现约8倍的性能提升。研究人员表示,这项技术不仅适用于AI模型,还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。

 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。顺发之窗网对此不承担任何保证责任,顺发之窗网仅提供信息存储空间服务。。如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!
收藏 0 打赏 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行

网站首页  |  网站地图  |  排名推广  |  广告服务  |  RSS订阅  |  SiteMap
免责声明:本站所有信息均来自互联网,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!顺发之窗网对此不承担任何相关法律责任!
友情提示:买产品需谨慎 网站信息处理与建议邮箱:sfzcw@qq.com