OceanBase开发者大会实录 - 阳振坤:云时代的数据库

本文来自2024 OceanBase开发者大会,OceanBase 首席科学家阳振坤的演讲实录——《云时代的数据库》。完整视频回看,请点击这里 >> 

1713958126

在去年的开发者大会中,我跟大家分享了我对数据库产品和技术一些看法,包括单机分布式一体化,事务与分析处理一体化,还有公有云与私有云服务。今年,我把视角聚焦到数据库的云服务,与大家分享我对云上数据库的几点看法。

这第一张 PPT 其实去年就有的,今年的内容跟去年差不多。关于云上数据库,有两个部分要关注,一个是数据库,一个是云,让我们从数据库开始。

1713958328

大家知道数据库要做事务处理,要做分析处理,是当今整个社会的基础设施的基础设施。数据库又是这么复杂,这使得一个数据库,尤其事务处理数据库,成长起来非常困难,需要有大量业务长时间打磨。直白地说,数据库的成长需要大量业务做“小白鼠”,可没有一个业务愿意做数据库的“小白鼠”。

这张 PPT 可以看得到,数据库从诞生到今天,主流的数据库是一只手都能数得过的数量。很多人会问一个问题,既然数据库这么难成长起来,那么这些数据库他们是怎么成长起来的?

1980 年代诞生了一批的商业数据库,那时候的数据库连事务都还没有,稳定性和可靠性也都不好,用户没有更好的选择。现在的这几个主流商业数据库,它们是伴随着整个产业一起成长起来的。

到了 90 年代,一些人觉得商业数据库太贵了,希望能够做一些让大家都用得起的数据库,所以出来了开源数据库。这两个开源数据库在市场上经过了十多年时间的打磨,从边缘业务到中心一点的业务,再到更重要一点的业务,逐步稳定、逐步成熟和逐步成长起来的。

之后,直到今天,再也没有新的数据库能成长起来。数据库还有希望吗?1990 年代出现的互联网,由于其极大的并发、海量的数据,以及对性价比的更高需求,既对数据库带来了很大的挑战,也给数据库带来了新的需求和新的机会。

我们可以看到,互联网出现之后全球出现了不少新的数据库,尽管没有一个像前面说到的那几个数据库那么普及、那么流行。

如果把它们分分类,大家能看得到这些系统一些典型的特点,就是容量可以几乎不受限制,处理能力可以不受限制。

1713958351

但是它们都缺少一个关键的特性,就是事务处理的能力。有的系统号称能处理事务,但是如果你问它在什么生产环节里得到过考验,你就发现没有。事务处理真正在生产系统里得到考验的仍然只有关系数据库。

一些人说,今天单机处理能力那么强,磁盘容量那么大,对绝大部分用户单机数据库就够用了。然而,越高配的计算机,其性价比肯定是越不好的。在云上,如果允许单个虚拟机可以扩容到很高的配置,对应的物理机的计算资源的复用和超卖就受到更多的限制,否则扩容的成功率就会很低,因此经济上越不合算。所以真正能够让数据库处理能力自由伸缩的,还是原生分布式数据库。

曾经有用户问我,分库分表他们告诉我自己是分布式,你们也告诉我自己是分布式,这两个有什么差别?我说这是大飞机和小飞机的差别,大飞机是一架飞机,小飞机是多架飞机。小飞机可以运人,可以运轻武器,但是重武器、重设备只有大飞机才能运输,多架小飞机也无法运输。

1713958400

现在让我们看看云。云根本的特点是资源池化、共享和复用。很多人知道,在几乎所有的企业生产系统里,计算机资源利用率很低,比如 CPU 的利用率,大部分是个位数,比如 3%~5%,因此这些机器大部分的计算资源浪费掉了。

云做了什么?云把它们集中起来,通过复用把这些 CPU 利用率提高。大家想想,如果你的 CPU 利用率 5%,云上做到 30%,相当于用一份资金买了六倍的设备,经济效益是非常可观的。

1713958417

云同样实现了对人的复用,一两百人的企业要雇一个 DBA,这个成本其实非常高,而且 DBA 没有成长空间,因为企业业务小。但是,云上一个优秀 DBA 可以支持几十个企业,甚至更多,他有足够大的业务量和成长空间,他的成本也被这么多企业分摊了,人本身的资源得到共享和复用。

云还有很多好处,比如计算和存储等资源随时可用,按使用付费,不需要自己买设备、自己运维等。

云上的数据库,除了事务处理、分析处理,还要支持各种的模态数据,例如半结构化数据,乃至非结构化数据等。

更重要的一点,云上数据库也是云的一部分,所以资源共享和复用至关重要。我相信在不久的将来,云上数据库能做到计算和存储都随时按需使用和付费,比如:

1713958437

○   一个用户的数据量很大,但是计算量很小,可能需要一个PB的存储却只要一个CPU 核。可以,没问题。

○   或者反过来,一个用户计算量很大,但是数据量不大,要 10 万甚至 100 万 CPU 核,却只有几十 GB 数据。可以,没问题。

这样就是把云上数据库的计算能力、存储能力都池化,让它们得到共享和复用,就像云上其他资源一样。

这就是我跟大家分享的内容,谢谢大家!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/577148.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

字符函数·字符串函数·C语言内存函数—使用和模拟实现

字符函数字符串函数C语言内存函数 1.字符分类函数2. 字符转换函数3. strlen的使用和模拟实现4.strcpy的使用和模拟实现5.strcat的使用和模拟实现6.strcmp的使用和模拟实现7.strncpy的模拟和实现8.strncat的实现和模拟实现9.strncmp函数使用10.strstr的使用和模拟实现11.strtok函…

备考数通HCIE证书4点经验分享!

大家好,我是来自安阳工学院20级网络工程的刁同学,在2023年12月20日成功通过了华为Datacom HCIE认证,并且取得了笔试900多分,实验B的成绩。在此,我想把我的一些考证心得分享给正在备考的小伙伴们。 关于为什么考证 我…

Vue3+ts(day03:ref和reactive)

学习源码可以看我的个人前端学习笔记 (github.com):qdxzw/frontlearningNotes 觉得有帮助的同学,可以点心心支持一下哈(笔记是根据b站上学习的尚硅谷的前端视频【张天禹老师】,记录一下学习笔记,用于自己复盘,有需要学…

tcp inflight 守恒算法的自动收敛

inflight 守恒算法看起来只描述理想情况,现实很难满足,是这样吗? 从 reno 到 bbr,无论哪个算法都在描述理想情况,以 reno 和 bbr 两个极端为例,它们分别描述两种理想管道,reno 将 buffer 从恰好…

Apollo 7周年大会:百度智能驾驶的展望与未来

本心、输入输出、结果 文章目录 Apollo 7周年大会:百度智能驾驶的展望与未来前言百度集团副总裁、智能驾驶事业群组总裁王云鹏发言 直播回放大会相关内容先了解 Apollo开放平台 9.0架构图 发布产品Apollo 定义自己对于智能化的认知百度集团副总裁 王云鹏…

Grafana系列 | Grafana监控TDengine库数据 |Grafana自定义Dashboard

开始前可以去grafana官网看看dashboard文档 https://grafana.com/docs/grafana/latest/dashboards 本文主要是监控TDengine库数据 目录 一、TDengine介绍二、Grafana监控TDengine数据三、Grafana自定义Dashboard 监控TDengine库数据1、grafana 变量2、添加变量3、配置panel 一…

Docker——数据管理和网络通信

目录 一、Docker的数据管理 1.数据卷 2.数据卷容器 3.容器互联 二、Docker镜像的创建 1.基于现有镜像创建 2.基于本地模板创建 3.基于Dockerfile 创建 3.1联合文件系统(UnionFS) 3.2镜像加载原理 3.3为什么Docker里的Centos大小才200M 4.Dcok…

鸿蒙OpenHarmony【轻量系统 编写“Hello World”程序】 (基于Hi3861开发板)

编写“Hello World”程序 下方将通过修改源码的方式展示如何编写简单程序,输出“Hello world”。请在下载的源码目录中进行下述操作。 确定目录结构。 开发者编写业务时,务必先在./applications/sample/wifi-iot/app路径下新建一个目录(或一…

CSS基础语法

CSS 标签选择器 内嵌式改变标签样式 <!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title><!-- 属于标签选择器 --><style>p{font - size: 16px;color: red;}</style></head><bo…

Git学习路线

1.看书 把这本书看懂就可以了&#xff1b;这个是比较专业的一本书&#xff1b;比较系统&#xff1b;没有书的可以私信我 2.理解Git多个分区和多个分支 多个分区包括&#xff1a;工作区、暂存区、本地仓、本地的远端仓信息、远端仓 多个分区的状态 分支及其变化 3.记住常用命令…

国产麒麟系统下打包electron+vue项目(AppImage、deb)

需要用到的一些依赖包、安装包以及更详细的打包方法word以及麒麟官网给出的文档都已放网盘&#xff0c;链接在文章最后&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&a…

与 Apollo 共创生态:Apollo 七周年大会给带来的震撼

文章目录 一、七年蛰伏&#xff0c;Apollo 迎来“智变”时刻二、Apollo 企业生态计划与开放平台2.1 Apollo X 企业自动驾驶解决方案2.2 Apollo 开放平台携手伙伴共创生态 三、个人感悟 一、七年蛰伏&#xff0c;Apollo 迎来“智变”时刻 让我们把时间倒回到 2013 年&#xff0…

Java设计模式 _创建型模式_原型模式(Cloneable)

一、原型模式 1、原型模式&#xff08;Prototype Pattern&#xff09;是用于创建重复的对象&#xff0c;同时又能保证性能比较好。一般对付出较大代价获取到的实体对象进行克隆操作&#xff0c;可以提升性能。 2、实现思路&#xff1a; &#xff08;1&#xff09;、需要克隆的…

微服务之分布式理论概述

一、分布式技术相关的理论 CAP理论 CAP定理(CAP theorem)&#xff0c;⼜被称作布鲁尔定理(Eric Brewer)&#xff0c;1998年第⼀次提出. 最初提出是指分布式数据存储不可能同时提供以下三种保证中的两种以上: (1) ⼀致性(Consistency): 每次读取收到的信息都是最新的; (2) …

【STM32F407+CUBEMX+FreeRTOS+lwIP之TCP记录】

STM32F407CUBEMXFreeRTOSlwIP之TCP记录 注意TCP client(socket)示例 TCP_server(socket)效果 注意 如果连接失败&#xff0c;建议关一下代理软件。 配置方面可以参考一下上一篇UDP的文章 STM32F407CUBEMXFreeRTOSlwIP之UDP记录 TCP client(socket) #define LWIP_DEMO_PORT 8…

【介绍下如何使用CocoaPods】

&#x1f3a5;博主&#xff1a;程序员不想YY啊 &#x1f4ab;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f917;点赞&#x1f388;收藏⭐再看&#x1f4ab;养成习惯 ✨希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出…

chrome浏览器安装elasticsearch的head可视化插件

head插件简介 elasticsearch-head被称为是弹性搜索集群的web前端&#xff0c;head插件主要是用来和elastic Cluster交互的Web前端 head插件历史 elasticsearch-head插件在0.x-2.x版本的时候是集成在elasticsearch内的&#xff0c;由elasticsearch的bin/elasticsearch-plugin…

ChatGPT/GLM API使用

模型幻觉问题 在自然语言处理领域&#xff0c;幻觉&#xff08;Hallucination&#xff09;被定义为生成的内容与提供的源内容无关或不忠实&#xff0c;具体而言&#xff0c;是一种虚假的感知&#xff0c;但在表面上却似乎是真实的。产生背景 检索增强生成&#xff08;RAG&…

LT9611UXC双端口 MIPI DSI/CSI 转 HDMI2.0,带音频

1. 说明 LT9611UXC 是一款高性能 MIPI DSI/CSI 至 HDMI2.0 转换器。MIPI DSI/CSI 输入具有可配置的单端口或双端口&#xff0c;具有 1 个高速时钟通道和 1~4 个高速数据通道&#xff0c;工作速率最高为 2Gbps/通道&#xff0c;可支持高达 16Gbps 的总带宽。 LT9611UXC 支持突发…

MemFire解决方案-物联网数据平台解决方案

方案背景 随着各种通讯、传感技术发展&#xff0c;数据通讯成本的急剧下降&#xff0c;数以万亿计的智能设备&#xff08;智能手环、智能电表、智能手机、各种传感器设备等&#xff09;接入网络&#xff0c;并源源不断的产生海量的实时数据。这些海量数据的价值挖掘&#xff0…