- 10 倍 - 内存节省
在 2023 年,RAG 模型被广泛认为是向量数据库的最主要应用之一。我们发现,在文档被分割成块之后,一个含有 500 个 Token 的 Chunk(通常 1000 字节)会转换成一个 1536 维的 float32 向量(通常 6000 字节),这意味着向量数据的体积可能会超过原始文档的大小,给成本带来了重大挑战。
作为第一个支持基于磁盘索引的开源向量数据库,Milvus Cloud、 通过磁盘混合存储实现了五倍的内存节省。2023 年末的 Milvus Cloud、 新版本允许通过内存映射文件(MMap)将标量和向量数据/索引加载到磁盘,与传统的内存索引相比,这可以实现超过 10 倍的内存节省。特别值得注意的是,RAG 应用常展现出对冷热数据不同的使用模式,这使得 MMap 数据缓存能力对于 RAG 应用尤其有益。
- 20 次 - 版本迭代
2023 年对 Milvus