7月16日,2024 可信数据库发展大会在北京隆重举行。大会以“自主、创新、引领”为主题,近百位数据库领域的专家、学者齐聚一堂,带来高质量的数据库技术洞察与实战经验。
本次可信数据库发展大会中,中国信通院正式公布 2024 年上半年“可信数据库”系列评测结果。拓数派旗下的云原生向量数据库 PieCloudVector 通过了向量数据库基础能力测试并获得证书, 同时入选中国信通院《中国数据库产业图谱(2024)》
至今,所有参加信通院向量数据库测评的产品中,只有两款通过了全部测试项目,而 PieCloudVector 是其中之一。
1 PieCloudVector 通过信通院“可信数据库”评测
“可信大数据”系列评估测试是面向大数据产品的权威测试体系,旨在从基础能力、性能、可靠性、安全等维度全面衡量企业级大数据产品的能力。
本次评测依据《向量数据库技术要求》,经过严格的测试与评审, PieCloudVector 在基本功能、运维管理、安全性、兼容性、扩展性、高可用、工具生态七大能力方面表现优异。测试结果表明,PieCloudVector 在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。
据信通院公布:“历史所有参测产品的测评结果显示,‘备份与恢复’、‘数据生命周期’、‘计算异构的向量索引’、‘数据加密’、‘多模态数据向量化能力’是通过率最低的测试项目。所有测试项整体通过率为 90.07%,可选项平均通过率为 76.67%。” 而 PieCloudVector 在本次测评中以优异的成绩全项通过了所有测试项目,充分证明了 PieCloudVector 的产品能力。
2 关于 PieCloudVector
PieCloudVector,作为拓数派大模型数据计算系统(PieDataCS)第二款云原生向量计算引擎,是大模型时代的分析型数据库升维。
2.1 PieCloudVector 主要功能
- 高效的索引能力
PieCloudVector 支持主流向量索引,包括 IVF、HNSW、混合索引以及 Binary 索引等,并对向量索引的创建进行多线程优化,单节点多线程模式可以充分调度所有计算资源,大幅提升索引创建效率。支持 L2 距离、内积(IP)、余弦相似度(Cosine)、Jaccard 和 Hamming 等,检索的关键性指标(QPS、召回率和时延)优异。
- 高性能向量与标量的混合查询
PieCloudVector 不仅可以处理向量数据,还可以处理标量数据,支持主流的向量检索 KNN-ANN 算法。
- 全面兼容 SQL 兼容性
高度兼容 SQL:2016 标准,完全支持 SQL:1992 标准,以及大部分的 SQL:1999 标准和部分 SQL:2003 标准(主要支持其中的 OLAP 特性);兼容 PostgreSQL 协议,支持标准数据库接口(ODBC、JDBC 等)。
- 异构算力支持
支持主流的 CPU 和 GPU 等硬件,同时也适配认证了国产的芯片服务器,并进行了相关性能优化。
- 灵活的 Embedding 算法
支持内置 Embedding 功能,可以根据需求扩展和集成大语言模型(LLM),支持矩阵分解、基于内容的嵌入、基于物品序列的嵌入、基于图的嵌入等多种方法。
- 高性能向量存储
基于向量压缩(Product Quantization,PQ)技术对多种类型的原始向量数据(包括图片、视频、音频、文本和矩阵等)进行存储和压缩以减小存储空间的占用,实现了在处理大规模数据集的同时可以更有效地管理内存,并加快相似性搜索和最近邻搜索的速度。
- 可视化管控
人性化的运维管理界面,不仅提供监控告警功能,而且具有完善的集群和主机监控指标体系,同时支持查询监控、日志收集和分析以及数据库操作等功能,实现了智能化的运维管理。
2.2 PieCloudVector 核心优势
2.3 PieCloudVector 主要应用场景