标签：vector search

科技资讯

Google提出TurboQuant方法，显著降低LLM的KV缓存与向量搜索内存占用

admin 2026-03-27 167浏览

谷歌研究团队发布TurboQuant，将该量化方法应用于大语言模型的KV缓存与向量搜索压缩。该研究旨在解决高维向量在推理与检索过程中占用大量内存，进而推高缓存与相似度搜索成本的问...

科技资讯

admin 2026-03-13 195浏览

谷歌发布新一代多模态嵌入模型：文本、图片、视频、音频、PDF 一网打尽谷歌刚刚推出了 Gemini Embedding2，一个能同时理解文字、图片、视频、音频和PDF文档的全新嵌入模型。过去，处...