Oracle Database 23ai 于2024年5月2日正式发布。快速了解可以看官网主页和官方博客。
官网主页
23ai的3个要点,核心都是数据:
-
数据的人工智能
主要指数据库内置机器学习和AI向量搜索。这实际是Oracle融合数据库策略的延续,避免了复杂的数据集成和数据不一致,并且可以利用已有的安全,可用性和性能特性。AI向量搜索使得LLM可以与用户的私域数据结合,形成专用的业务解决方案。
补充:还有SQL,Python,R的支持,OGG 23ai和Exadata卸载向量搜索。 -
数据的开发
支持所有的主流数据类型,工作负载和开发模式。这一点本质上还是融合数据库,可以简化开发。主要的特性就是JSON关系二元性和Graph关系二元性,还有APEX用于低代码开发,以及通过PDB实现微服务。
补充:还有JavaScript存储过程,对于长时间事务的Lock Free Updates和Transactional Microservice。 -
数据的关键任务
关键特性是True Cache,内置的SQL防火墙,以及全局分布式数据库支持RAFT复制。
官方博客
23c改名为23ai,于5月2日发布。23ai是长期支持版,和上一个长期支持版19c相隔4年。23ai关注AI,开发者效率和关键任务
数据的人工智能
2个目的:
- 让开发者更容易的把AI功能加入到应用中。(也就是将AI带入数据,而非将数据带到AI)
- 具有AI能力的数据库让DBA,开发者和分析人员更有效率。
第1个特性是向量搜索,便于实现RAG方案,也就是可以结合私域数据,让LLM特定于您的企业和业务,也就是更准。技术上,可以很方便的用SQL执行向量搜索。
可以利用ONNX标准将AI模型嵌入到数据库中,从而实现实时编码和避免敏感数据拿到外部去编码。
第2个特性是Select AI,就是将自然语言问题转变为SQL。需要外接大模型,如Llama和Cohere。
数据的开发
第1个特性是JSON关系二元性,或者统一性。此特性结合了JSON和关系型模型的优点,实现方式比ORM更简单。JSON 提供了一种优雅的数据建模方法,其中查询所有相关数据都包含在单个对象中,而无需跨表执行复杂的联接。关系型方法提供了灵活、存储高效、一致的数据模型,易于使用 SQL 等语言进行查询。
第2个特性是SQL增强,如增加了Boolean数据类型,向量搜索,Data Usecase Domain等。详见Oracle Database 23c Free Developer Release - 10 features you should know。
第3个特性是Property Graph,其实就是Property关系二元性,支持使用Graph SQL查询关系型数据。
数据的关键任务
第1个特性是全局分布式数据库(在12c推出时的名字是Sharding)支持Raft复制。分片的目的可能是合规性要求,或者是避免延迟。这个特性的好处是自动复制和快速错误切换。
第2个特性是True Cache。可以更简单的配置和编码。
第3个特性是SQL Firewall。由于其是数据库的一部分,因此配置简单,无法绕过,而且开销很小。
最后,看一下MOS 742060.1的数据库发布和支持时间表: