九章云极DataCanvas公司DingoDB完成中国信通院权威多模数据库测试

在这里插入图片描述

2024年5月16日,九章云极DataCanvas公司自主研发和设计的开源多模向量数据库DingoDB顺利完成中国信息通信研究院(以下简称中国信通院)多模数据库产品测试。本次测试的成功标志着DingoDB在技术能力、性能表现和产品稳定性方面得到了权威机构的高度认可,并进一步印证其为用户提供可靠高效数据管理解决方案的能力,以及在多模数据库领域的领先地位和卓越品质。目前,DingoDB已完成中国信通院《向量数据库标准》和《多模数据库技术要求》两大数据库领域的重量级测试。
在这里插入图片描述

图1 DingoDB多模向量数据库的多重能力

中国信通院作为国家级科研机构,承担了多项国家级重大科研任务和标准制定工作,具有极高的权威性和公信力,其测试和认证在业内广受认可。中国信通院定期对数据库产品进行全面测试,为用户选择合适的数据库产品提供权威指南,本次多模数据库产品测试正是基于《多模数据库技术要求》的标准。该标准由中国信通院云计算与大数据研究所联合多家企业专家制定,涵盖了多模数据库的基本能力、管理能力、兼容能力、安全能力、扩展能力、高可用等六大能力域,共33个测试项(包括21个必选项和12个可选项),测试产品需要满足所有必选项方可通过。

DingoDB——功能完全内建的数据库,而非多组件的简单堆砌

DingoDB集成了关系型、文档、向量和键值四种数据模型,能为用户提供高效多模型数据库解决方案。区别于市场上很多多模数据库厂商,它不是多个数据模型组件的简单堆砌,而是一款具备在线强一致性的完全内建的数据库。

DingoDB产品特性:

  • 企业级存储可靠性:基于Multi-Raft多副本存储,确保数据强一致性,满足企业级容灾需求。

  • 多模数据联合检索:支持通过SQL进行执行关系、向量、文档的联合检索,并提供丰富的索引类型,简化RAG应用的开发复杂度,满足各种场景需求。

  • 多模数据库的能力:部署一套DingoDB即可拥有键值缓存加速、关系数据库和向量数据库和文档的服务能力,减少多个数据库系统的维护和管理成本,提高整体系统的效率和灵活性。

  • 兼容MySQL协议:用户可以直接使用原生的MySQL客户端访问,无需学习新的数据库语法和工具,降低用户的使用门槛。

  • 水平扩缩容:基于存算分离的架构设计,DingoDB能够实现对性能和资源的一键水平扩容和缩容,使得企业能够根据业务需求快速调整数据库规模,有效应对流量变化。

  • 多存储引擎兼容:支持多种存储引擎,使得企业可以根据业务特点选择最适合的存储引擎,最大化性能效益。

  • 分布式事务:支持多种数据模态下的分布式事务,同时提供多种隔离级别,既兼容乐观事务和悲观事务,确保事务在分布式环境下的完整性和一致性。

  • 多租户支持:原生支持多租户,服务隔离防止数据泄露与干扰。支持请求级动态流控,灵活分配资源。支持混合存储与按租户和资源组隔离,确保资源的合理分配和高效利用。

  • 开源开放:完整开放数据库源代码,提供丰富的多语言SDK及详尽的开发文档,满足用户在不同应用开发场景中的需求。

DingoDB场景应用:

1)基于RAG技术的场景的应用

DingoDB覆盖关系型、文档、向量和键值等多种数据模型的特点,使得它在基于RAG技术(Retrieval Augmented Generation)的场景中得到广泛应用,例如企业知识管理场景。该场景的目标是从海量的技术文档中找到与问题相关的片段并生成回答。这个过程需要结合大语言模型(LLM,large language model)和多模数据库的能力。其中,LLM因为无法直接生成与技术内容相关的答案,只起到辅助性作用,效果好坏是由执行检索任务的多模数据库决定。在该场景,DingoDB提供两种不同的检索方式来召回相关文本数据,包括向量检索和关键词检索。向量检索依赖于DingoDB的向量数据库功能,而关键词检索则依赖于其文档数据库功能。这种多模检索方式能有效提高生成内容的准确性、连贯性和信息量,确保用户获得更高质量的响应。

使用DingoDB的企业知识管理场景的流程如下(图2),分为下列三个步骤:
在这里插入图片描述

图2 基于DingoDB多模向量数据库的RAG构建流程

Step1.文档解析入库

将企业的技术文档上传,通过Text Splitter模块进行分割,生成多个文本块(段落、句子等)。对文本块进行标注提取,生成标题或标签,便于检索。对于包含表格的数据,生成描述性句子,确保表格内容能被准确理解和检索。最后,通过Embedding模型将文本块向量化,生成用于向量检索的表示,存入DingoDB。

Step2. 基于DingoDB的向量检索和关键词检索

用户提出问题后,通过Embedding模型生成向量表示,在DingoDB中进行向量检索,找到最相关的多个文本块。关键词检索是为解决用户口头表达与专业文档不匹配而造成的检索不准确问题。关键词检索通过LLM提取关键词,输入DingoDB进行关键词匹配(match召回),找到相关文本块。DingoDB支持标量向量联合检索,结合关键词匹配和向量召回进行混合召回,返回TopN相关文本块。

Step3. 答案生成

将检索到的TopN相关文本块通过预定义的Prompt模板传递给LLM,由LLM生成详细且准确的答案。

综上所述,在大语言模型时代的RAG典型应用企业知识管理场景,DingoDB可以高效地处理和检索海量技术文档,提供精准、及时的答案,支持企业内部的信息查询和知识管理。依托该场景,DingoDB在多家央企客户得到应用。

2)分布式KV场景的应用

在金融行业的实时风控、反欺诈、精准营销、产品推荐等需要亚秒级决策的场景,DingoDB以其高性能和低延迟的特点,轻松驾驭亚秒级大规模数据处理与分析,为实时决策提供坚实的服务支撑。DingoDB采用先进的数据复制与故障转移机制,并通过持久化技术确保数据安全可靠。同时,能根据业务需求灵活扩展计算与存储资源,从容应对数据处理需求的持续增长。DingoDB具备满足信创标准的高频Serving计算能力,使企业在面对实时数据处理和决策时能够快速响应。

3)其他场景的应用

除上述两类场景,DingoDB还在多种丰富场景应用中展现了其强大的功能和多样化的能力(图3)。

在这里插入图片描述

图3 DingoDB多模向量数据库支撑多种业务场景

Vector Ocean数据支撑:Vector Ocean是九章云极DataCanvas对数据架构的一种全新设想。DingoDB在Vector Ocean中提供结构化和非结构化数据的存储,支持多模态数据分析能力和科学计算能力。其强大的数据处理能力使得企业能够在一个平台上处理多种数据类型,简化数据管理流程。

大模型记忆体:DingoDB辅助大语言模型生成前的Prompt管理,提供高效并发的搜索答案能力。这在大语言模型时代尤为重要,能够为AI模型提供可靠的数据支持,提升模型生成答案的准确性和效率。

结构化与非结构化数据的融合分析:DingoDB支持音频、视频、文本等非结构化数据的向量化存储,提供结构化与向量数据的联合分析和计算能力。这种融合分析能力使得企业能够从多维度进行数据分析,获取更全面的洞察。

总结

综上所述,DingoDB作为一款多模数据库,在企业知识管理、实时决策、数据支撑、大语言模型应用以及多类型数据检索和分析等方面展现出强大的应用能力,获得了广泛的认可和好评。DingoDB不仅可以充当海量数据的存储中心,还是推动数据驱动决策的核心动力。在数字化转型的浪潮中,DingoDB成为传统业务与前沿技术的重要桥梁。无论是云计算的高效处理、大数据的深度分析、人工智能的智能决策,还是物联网的实时数据交换,DingoDB都能提供坚实的数据分析和处理支撑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/660310.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AI绘画(Stable Diffusion)喂饭级教程-第2篇(SD大模型详解)

SD大模型的概念及基础知识 先做一个比喻 如果SD是一个画师,那么大模型就是画师的大脑! 就是可惜,这个大脑有点轴,它只能想象出自己喜欢的画面。 比如你用了一个二次元的大脑,它想出来的画面就是这样的: …

杨校老师课题之基于Idea的SSM实训项目案例开发之在线手机商城开发(一)【非常适合初学者】

1.前期配置 2.开发涉及技术栈和工具 2.1 技术栈 后端: SSM前端:Html、CSS、BootStrap(官方定义好的CSS样式)数据库: MySQL 2.2 开发环境(工具) 进行本次开发,需要具备如下环境: JDK a. JDK8.0/1.8 b. 注意: 没有JDK是无法运行IdeaIDEA a. …

OpenCV:入门(四)

形态学操作 形态学,即数学形态学(Mathematical Morphology),是图像处理过程中一个非常重要的研 究方向。形态学主要从图像内提取分量信息,该分量信息通常对于表达和描绘图像的形状具有 重要意义,通常是图像…

番外篇 | YOLOv8改进之引入YOLOv9的RepNCSPELAN4模块 | 替换YOLOv8的C2f

前言:Hello大家好,我是小哥谈。YOLOv9,作为YOLO(You Only Look Once)系列的最新成员,代表着实时物体检测技术的又一重要里程碑。自YOLO系列算法诞生以来,它就以其出色的性能和简洁的设计思想赢得了广泛的关注和认可。从最初的YOLOv1到如今的YOLOv9,这个系列不断地进行技…

【学习Day2】计算机基础

✍🏻记录学习过程中的输出,坚持每天学习一点点~ ❤️希望能给大家提供帮助~欢迎点赞👍🏻收藏⭐评论✍🏻指点🙏 1.4 校验码 奇偶校验 ● 奇偶校验码的编码方法是: 由若干位有效信息的头部或者…

JAVA云HIS医院管理系统源码 云HIS系统源码 云HIS的优势 云HIS的发展

JAVA云HIS医院管理系统源码 云HIS系统源码 云HIS的优势 云HIS的发展 HIS系统,即医院信息系统(Hospital Information System),在医院的运营和管理中扮演着至关重要的角色。关于HIS系统的溯源,简单从以下几个方面进行讲…

失落的方舟 命运方舟台服封号严重 游戏封IP怎么办

步入《失落的方舟》(Lost Ark),这款由Smilegate精心打造的宏大规模在线角色扮演游戏(MMORPG),您将启程前往阿克拉西亚这片饱经沧桑的奇幻大陆,展开一场穿越时空的壮阔探索。在这里,一…

zabbix客户端启用ping脚本 , 采集结果返回服务端

1.Zabbix-agent配置 (1) 查看自定义配置的目录位置 # more /etc/zabbix/zabbix_agentd.conf (2) 将配置的脚本放在指定的目录下 # cd /etc/zabbix/zabbix_agentd.d # vi get_ping.conf UserParameter=get_ping[*], /bin/ping -c 1 -W 1 $1 &> /dev/null &a…

一文读懂Apollo客户端配置加载流程

本文基于 apollo-client 2.1.0 版本源码进行分析 Apollo 是携程开源的配置中心,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到应用端,并且具备规范的权限、流程治理等特性。 Apollo支持4个维度管理Key-Value格式的配…

「异步魔法:Python数据库交互的革命」(二)

哈喽,我是阿佑,上篇文章带领了大家跨入的异步魔法的大门——Python数据库交互,一场魔法与技术的奇幻之旅! 从基础概念到DB-API,再到ORM的高级魔法,我们一步步揭开了数据库操作的神秘面纱。SQLAlchemy和Djan…

如何使用 .htaccess 删除文件扩展名

本周有一个客户,购买Hostease的虚拟主机,询问我们的在线客服,如何使用 .htaccess 删除文件扩展名?我们为用户提供相关教程,用户很快解决了遇到的问题。在此,我们分享这个操作教程,希望可以对您有…

C# 数组/集合排序

一&#xff1a;基础类型集合排序 /// <summary> /// 排序 /// </summary> /// <param name"isReverse">顺序是否取反</param> public static void Sort<T>(this IList<T> array, bool isReverse false)where T : IComparable …

洗地机什么品牌质量好?家用洗地机排行榜

一年一度的大促节又到了&#xff0c;各大电商平台和实体店纷纷推出力度不小的折扣活动&#xff0c;吸引着消费者的关注和购买欲望。很多家庭也趁着这个机会&#xff0c;购置一些智能家居产品来提升生活品质。其中&#xff0c;洗地机作为近年来发展迅速的明星产品&#xff0c;受…

Mac安装tomcat

代码 brew install tomcat 运行结果如下&#xff1a; 如果要启动输入&#xff1a; brew services start tomcat

鸿蒙课程培训 | 讯方技术与鸿蒙生态服务公司签约,成为鸿蒙钻石服务商

3月15日&#xff0c;深圳市讯方技术股份有限公司与鸿蒙生态服务公司签署合作协议&#xff0c;讯方技术成为鸿蒙钻石服务商&#xff0c;正式进军鸿蒙原生应用培训开发领域。讯方技术总裁刘国锋、副总经理刘铭皓、深圳区域总经理张松柏、深圳区域交付总监张梁出席签约仪式。 作…

【全开源】防伪溯源一体化管理系统源码(FastAdmin+ThinkPHP和Uniapp)

一款基于FastAdminThinkPHP和Uniapp进行开发的多平台&#xff08;微信小程序、H5网页&#xff09;溯源、防伪、管理一体化独立系统&#xff0c;拥有强大的防伪码和溯源码双码生成功能&#xff08;内置多种生成规则&#xff09;、批量大量导出防伪和溯源码码数据、支持代理商管理…

3D模型展示适合哪些类型的产品?

3D模型展示特别适合那些需要全面展示产品细节和特性的商品&#xff0c;产品3D交互展示具有直观性、动态性、交互性等显著优势&#xff0c;可以通过51建模网一站式完成商品3D建模、3D展示、3D定制、AR试穿等功能&#xff0c;以下是一些适合使用3D模型展示的产品类型&#xff1a;…

低代码开发难吗?

在软件开发的多样化浪潮中&#xff0c;低代码开发平台以其简化的编程模型&#xff0c;为IT行业带来了新的活力。作为一位资深的IT技术员&#xff0c;我对低代码开发平台的易用性和强大功能有着深刻的认识。今天&#xff0c;我将分享我对YDUIbuilder这一免费开源低代码平台的使用…

29-ESP32-S3-WIFI_Driver-00 STA模式扫描全部 AP

ESP32-S3 WIFI_Driver 引言 ESP32-S3是一款集成了Wi-Fi和蓝牙功能的芯片。关于WIFI的部分&#xff0c;其实内容比我想象的要多得多。所以通常来说&#xff0c;如果你想要编写自己的Wi-Fi应用程序&#xff0c;最快捷的方法就是先找一个类似的示例应用&#xff0c;然后将它的相…

图片去水印工具(低调用哦)

一、简介 1、它是一款专业的图像编辑工具&#xff0c;旨在帮助用户轻松去除照片中不需要的元素或修复照片中的缺陷。无论是修复旧照片、消除拍摄时的不良构图&#xff0c;还是删除照片中的杂乱元素&#xff0c;都能帮助用户快速实现这些目标。其功能强大且操作简单&#xff0c…