鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级

在2023年云栖大会上,阿里云数据库产品事业部负责人李飞飞在主题演讲中提到,瑶池数据库推出“DB+存储”一体化能力,结合人工智能、机器学习、存储等方法和创新能力,实现Buffer Pool Extension能力和智能冷温热数据分层能力。在大会的《云数据库RDS年度发布与最佳实践》演讲中,阿里云RDS及OLAP开源产品部负责人彭祥表示,面对当前越来越丰富且复杂的数据环境,性能、弹性、成本是数据库用户的三大重点诉求;阿里云RDS产品在业界率先推出新型存储类型——通用云盘,将云盘的IOPS与容量彻底解耦,增加缓存扩展的能力,用技术提升RDS产品IO性能,降低存储降本。

👉RDS通用云盘IO加速功能现已全网公测,欢迎点击「公测」直达体验。


1. 什么是通用云盘?

介绍通用云盘前,我们先来说说存储。众所周知,数据库架构设计由下至上可分为存储层、引擎层、服务层、网络层。存储层负责数据的持久化存储和读取,处于整个数据库系统架构的最底层。数据存储和数据检索读取是它的两大功能。在数据库中,存储层常见的存储类型,往往有基于物理机本地硬盘的本地盘和基于分布式存储架构的云盘。本地盘存储,数据存储与计算资源位于同一物理服务器节点上,由于数据读写不需要经过网络传输,因此IO延迟通常较低,随机读写性能高,但本地盘的存储容量受限于单个服务器的硬件配置,一旦服务器出现故障,可能影响数据的安全性和可用性,且本地盘存储容量难以独立扩展;云盘基于分布式存储架构,数据存储与计算资源分离,用户可独立地按需调整计算和存储资源,提高了资源的利用率和灵活度,但云盘通过网络为计算节点提供存储服务,多少会对IO延时有所影响,而且,云盘的性能,往往跟其容量绑定,提升性能大部分情况下势必需要提升云盘容量,除此之外,云盘不支持缩容。

而在调研和分析用户业务场景的过程中,我们发现,在多个行业,例如电商行业、新零售行业、游戏行业等,用户业务流量并不是一直持续一个水位,有明显的波峰波谷特征,如何让性能不受容量影响,顺应峰值的到来而提升,如何得到性能(低延迟、高持久)的同时做到完美的成本控制(低成本),已然成为大部分客户在数据库选型中的关注点。阿里云RDS产品,率先推出了通用云盘,同时满足用户关于低成本、低延迟、高持久性的诉求

通用云盘,首先是一种云盘。但与当前业界主流云盘的区别在于,通用云盘深度融合PaaS层和IaaS层的技术创新,改变了传统的数据存储结构,将原有的单一数据存储划分为了三层存储结构:缓存层、数据层、冷存层。热数据存入缓存盘(High Performance Disk),温数据存入数据盘(ESSD云盘),归档数据存入冷存盘(OSS对象存储)。这样的存储结构设计中,将缓存盘作为可扩展的一部分,达到IO加速的效果;基于AliSQL独有的内核能力,轻松应对读写数据库过程中的IO突发情况发生,并支持最小10GB,最大64T的容量空间、云盘缩容以及自动秒级扩容的功能;同时,将不常用的冷数据归档存储于对象存储上,又实现使用成本的节约。通用云盘将IO性能与云盘容量解耦,使得数据层在IO性能与云盘容量两个方面都实现了极致弹性。

image

2. 三层存储是怎样的一种架构?

image

通用云盘的架构设计如上图所示,从左至右依次是缓存层、数据层、冷存层。各层存储各司其职,选择不同的存储介质,在对应存储层中发挥价值最大化。

  • 缓存层处理高IOPS和超低IO时延需求,一般百万级IOPS和微秒级IO时延需求。采用阿里云高速缓存盘(High Performance Disk),结合RDS数据库引擎的缓存技术,实现查询数据库过程中的IO加速功能,带来更高的查询性能。
  • 数据层处理低IO时延和数据可靠性需求,一般万级IOPS和毫秒级IO时延需求。采用阿里云ESSD云盘,保障数据的高可靠性和安全性,并借助基础设施和AliSQL内核的创新能力,以及RDS数据库的管控架构升级,达到IO性能与云盘容量的解耦,实现数据库读写过程的IO突发功能,提升了IO性能与云盘容量的极致弹性。
  • 冷存层处理数据持久化和存储低成本需求,一般存储在冷存层的数据不常被访问,但有超高的数据库可靠性和持久性需求。采用阿里云对象存储(Object Storage Service,OSS),结合RDS数据库引擎的归档技术,实现了数据库的归档功能,并支持通过ALTER TABLE实现表文件在数据层和冷存层的切换,为不常访问的数据表提供了更低成本的存储选择

image

表1:RDS通用云盘三层存储介质对比

3. 通用云盘有哪些特征?

在详解特性技术前,我们整理了一张通用云盘三层存储的特性对比表,如下:

image

表2:RDS通用云盘三层存储特性对比

3.1 缓存层特性——IO加速

IO加速是指提升数据库查询性能的一种特性。该特性主要体现在通用云盘的缓存层,发挥出高速缓存盘的高IO性能优势,从整体上提升数据库的查询性能。相比于ESSD云盘,高速缓存盘具备更高的IOPS上限和带宽上限,以及更低的IO时延。

缓存层通过两种方式实现IO加速:

  • 缓存池扩展(Buffer Pool Extension, BPE):利用高速缓存盘进行缓存池扩展,提高缓存命中率,减少数据层ESSD的访问次数,加快数据库查询速度。
  • 存放临时表/文件:利用高速缓存盘存放临时表/文件,提高临时表/文件的访问速度,进而提高数据库查询性能。

基于此,IO加速特性较适合读负载较高、临时表/文件使用较多的业务场景。当前,RDS的MySQL引擎已支持上述两种方式,RDS的PostgreSQL引擎暂仅支持存放临时表/文件的方式来实现IO加速。

3.1.1 缓存池扩展(Buffer Pool Extension, BPE)

缓存池(Buffer Pool,简称BP)是数据库引擎内存区域的一部分,用于临时存储常用的数据和索引页,从而减少对磁盘的访问次数,提高数据库操作的性能和效率。因此,缓存池越大,缓存命中率就越高,数据库对磁盘的访问次数就越少,整体的查询性能和效率就越高。

但是,缓存池的大小受限于内存资源,而对于数据库系统来说,内存资源的使用往往是比较紧张的。为了能够在不增加内存资源的情况下扩大缓存,并且充分利用高速缓存盘高IO性能的优势,RDS的MySQL引擎实现了缓存池扩展的功能,对内存中的缓存池进行扩充,进一步提高缓存命中率,提升数据库整体查询性能。

图1:缓存池扩展工作原理

缓存池扩展作用原理如上图,一次数据页读取的过程:

        1.客户端侧发起读取数据页的请求。

        2.请求进入内存的缓存池中查找指定数据页:

  • 如果在缓存池中找到数据页,则返回结果给客户端侧,查询和读取结束。
  • 如果在缓存池中未找到数据页,则执行步骤3。

        3.请求进入缓存盘的缓存池拓展中查找指定数据页:

  • 如果在缓存池拓展中找到数据页,则返回数据页给缓存池,再返回结果给客户端侧,查询和读取结束。
  • 如果在缓存池拓展中未找到数据页,则执行步骤4。

        4.请求进入ESSD的数据表文件中查找指定数据页。找到数据页后返回给缓存池,再返回结果给客户端侧。

        5.查询和读取请求结束。

3.1.2 存放临时表/文件

对于数据库引擎来说,内存中的缓存池、磁盘中的临时表/文件都会影响数据库的查询性能。临时表/文件用于当前会话或者查询中,存放数据查询过程中产生的中间结果或者超出内存的结果,一般不需要持久化存储到数据文件中,使用后便会被删除。

基于临时表/文件在业务中的无持久化需求,RDS通用云盘,有别于当前的ESSD云盘,更改了临时表/文件的存储位置。之前,RDS数据库的临时表/文件存放于ESSD数据盘中;而推出通用云盘后,临时表/文件可存储于高速缓存盘中,提升了数据库对临时表/文件的访问效率,进而加快数据库查询速度。

以8核16GB规格为例,IO加速功能测试结果如下:

  • read_only QPS提升80%
  • write_only QPS提升33%
  • read_write QPS提升103%

image

image

image

3.2 数据层特性——IO突发和云盘缩容

通用云盘的数据层采用云盘ESSD作为存储介质,借助ESSD云盘的创新能力实现云盘的IO性能与容量解耦,并结合数据库RDS的管控架构优势和数据拷贝能力实现云盘的缩容,为数据库实现IO性能和云盘容量两方面的极致弹性。

3.2.1 IO突发

高IO负载、波动IO负载是较为常见的两种业务场景。RDS数据库之前接入的ESSD云盘(PL1-3),其云盘IO性能与容量深度绑定,IOPS和带宽上限深受存储容量的限制。在这个限制下,应对高IO负载、波动IO负载的高IO洪峰场景时,云盘扩容成为了获得更高云盘IO性能的唯一解。

RDS的通用云盘在数据库通过技术创新,将云盘的IO性能与存储容量解耦,提供IO性能突发能力,并可根据实际业务的使用量动态调整云盘的IO上限。高IO负载时,自动触发IO突发,提升IO上限,IO负载回落后,自动恢复IO上限,实现IO性能的极致弹性,避免IO性能和成本浪费。

如下测试图例,当开启IO突发后,业务IO高峰时,RDS实例的IOPS使用率会突破100%。

image

图2:RDS通用云盘IO突发测试

目前,RDS通用云盘IO突发功能已支持RDS MySQL、PostgreSQL和SQL Server三款引擎。

3.2.2 云盘缩容

众所周知,云盘不支持缩容。但RDS通用云盘,借助RDS数据库管控架构和AliSQL内核的优势,结合数据拷贝功能,实现了RDS云盘缩容。同时,基于云盘本身的秒级扩容能力,可以让客户根据业务需求自由地调整云盘容量,实现云盘容量的极致弹性。

3.3 冷存层特性——数据归档

通用云盘的冷存层数据层采用对象存储OSS作为存储介质,将表级别数据归档于OSS中,并不影响用户正常查询OSS中归档表数据。开启数据归档功能后,客户可通过ALTER TABLE将表文件在ESSD数据盘与OSS对象存储之间切换,同时在OSS中的归档表支持正常的查询。

OSS存储成本远低于ESSD,所以数据归档功能可以为客户不常访问的表大幅度降低存储成本。数据归档特性较适用于有不常访问或修改的表的业务场景。冷存层通过数据库内核直接访问对象存储和借助JuiceFS访问对象存储OSS两种方式实现数据归档。

3.3.1 数据库内核直接访问对象存储

数据库内核直接访问对象存储是指归档表数据put到OSS中,并通过get访问OSS归档表数据。RDS的MySQL引擎主要采用这种方式。值得注意的是,为确保归档表的兼容性,AliSQL内核采用InnoDB引擎存储格式。因此,缓存池扩展能力(BPE)仍然能够作用于归档表,对其查询性能进行加速。

开启数据归档功能后,可通过执行ALTER TABLE,将正常表上传至OSS转变成归档表,也可通过ALTER TABLE将归档表转为正常表。归档表目前仅支持读操作,用户可通过SELECT语句访问归档表中的内容。MySQL内核会对用户指定的归档表执行具体操作如下:

  • 将数据表对应的ibd文件,按照oss_block_size指定的大小(默认2MB)切分成文件块。
  • 利用OSS的sdk将切分后的文件块上传到OSS中。
  • 在ESSD数据盘上保留space header文件,加速实例的启动和表文件的扫描速度。

image

图3:RDS MySQL冷存归档数据流

3.3.2 借助JuiceFS访问对象存储

借助JuiceFS访问对象存储OSS的数据归档方式,主要用于RDS PostgreSQL引擎。

这种方式下,开启数据归档功能后,RDS PostgreSQL实例除了数据目录外,会增加归档目录/cold-jfs及对应的表空间rds_oss。客户可通过ALTER TABLE语句将对应的表转移到rds_oss表空间中。处于rds_oss表空间中的数据会借助JuiceFS文件系统上传到OSS上,并不占用ESSD数据盘空间。rds_oss表空间中的所有表均为归档表,客户可以用正常的查询语句查询归档表中的数据。

image

图4:RDS PostgreSQL冷存归档数据流

RDS MySQL冷存表只读性能测试结果如下:

相比于正常表,冷存表的QPS是正常表的15%左右。

image

4. 总结

性能、弹性、成本,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的通用云盘,是PaaS层和IaaS层的深度融合的技术最佳实践,通过三层存储架构设计(缓存层、数据层和冷存层),每一层采用使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/362098.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

springboot139华强北商城二手手机管理系统

简介 【毕设源码推荐 javaweb 项目】基于springbootvue 的 适用于计算机类毕业设计,课程设计参考与学习用途。仅供学习参考, 不得用于商业或者非法用途,否则,一切后果请用户自负。 看运行截图看 第五章 第四章 获取资料方式 **项…

使用post-css实现移动端适配

介绍移动端适配以及适配方案 适配原因 移动端不像PC端,有足够大的屏幕展示较多的内容不同的移动端设备,有不同屏幕宽度同样大小的页面元素在不同屏幕宽度设备展示时,布局就会错乱有些元素没有展示在可视范围内有些元素不能撑满整个屏幕&#xf…

RISC-V指令格式

RISC-V指令格式 1 RISC-V指令集命名规范2 RISC-V指令集组成2.1 基础整数指令集2.2 扩展指令集 3 RISC-V指令格式3.1 指令表述3.2 指令格式 本文属于《 RISC-V指令集基础系列教程》之一,欢迎查看其它文章。 1 RISC-V指令集命名规范 前面提到过RV32I,这是…

ArcGIS雨涝风险模拟

所谓雨涝模拟分析, 就是模拟降雨量达到一定强度, 城市的哪些区域容易被淹没形成内涝。 雨涝模拟更重要的是提前预测, 可在预测结果的基础上进行实地勘察, 为项目规划、风险防控等工作提供指导作用。 雨涝模拟的原理和思想多种…

八数码问题dfs

import java.util.*;public class Main{static String end "12345678x";public static void swap(char[] arr,int x,int y){char temp arr[x];arr[x] arr[y];arr[y] temp;}public static int bfs(String start){//key:String 存放12345678x这种格式的字符//value…

Quartus生成烧录到FPGA板载Flash的jic文件

简要说明: Altera的FPGA芯片有两种基本分类,一类是纯FPGA,另一类是FPGASoc(System on chip),也就是FPGAHPS(Hard Processor System,硬核处理器),对应两种Flash烧录方式&a…

SAM:基于 prompt 的通用图像分割模型

Paper: Kirillov A, Mintun E, Ravi N, et al. Segment anything[J]. arXiv preprint arXiv:2304.02643, 2023. Introduction: https://segment-anything.com/ Code: https://github.com/facebookresearch/segment-anything SAM 是 Meta AI 开发的一款基于 prompt 的通用视觉大…

LabVIEW潜油电泵数据采集系统

LabVIEW潜油电泵数据采集系统 介绍一个基于LabVIEW的潜油电泵数据采集系统。该系统目的是通过高效的数据采集和处理,提高潜油电泵的性能监控和故障诊断能力。 系统由硬件和软件两部分组成。硬件部分主要包括数据采集卡、传感器和电泵等,而软件部分则是…

2023.1.31 关于 Redis 分布式锁详解

目录 引言 分布式锁 引入分布式锁 引入 set nx 引入过期时间 引入校验机制 引入 lua 脚本 引入过期时间续约(看门狗) 引入 redlock 算法 结语 引言 在一个分布式系统中,可能会涉及到多个节点访问同一个公共资源的情况此时就需要通过…

JAVA Web 学习(二)ServLet

二、动态web 资源开发技术——Servlet Servlet(小服务程序)是一个与协议无关的、跨平台的Web组件,由Servlet容器所管理。运行在服务器端,可以动态地扩展服务器的功能,并采用“请求一响应”模式提供Web服务。 Servlet的…

【JavaScript】JS实用案例分享:DOM节点转JSON数据 | 标签输入框

🖥️ NodeJS专栏:Node.js从入门到精通 🖥️ 博主的前端之路(源创征文一等奖作品):前端之行,任重道远(来自大三学长的万字自述) 🖥️ TypeScript知识总结&…

对称和非对称加密算法

对称加密算法 对称加密算法依赖于一个共享的加密密钥,该密钥会被分发给所有参与通信 的对象。所有通信对象都使用这个密钥对消息数据进行加密和解密。当使用越长 的密钥对消息进行加密时,密文数据越难被破解。对称加密算法主要应用于批量 加密的数据&…

【开源】SpringBoot框架开发海南旅游景点推荐系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 用户端2.2 管理员端 三、系统展示四、核心代码4.1 随机景点推荐4.2 景点评价4.3 协同推荐算法4.4 网站登录4.5 查询景点美食 五、免责说明 一、摘要 1.1 项目介绍 基于VueSpringBootMySQL的海南旅游推荐系统&#xff…

力扣之2619.数组原型对象的最后一个元素-JS

Array.prototype.last function () {const a this.length;if (a 0) {return -1;}return this[a - 1]; };const nums [null, {}, 3]; console.log(nums.last());说明: 在 JavaScript 中,Array.prototype 是每个数组对象的原型。通过在 Array.prototy…

探索智慧文旅:科技如何提升游客体验

随着科技的迅猛发展,智慧文旅已成为旅游业的重要发展方向。通过运用先进的信息技术,智慧文旅不仅改变了传统旅游业的运营模式,更在提升游客体验方面取得了显著成效。本文将深入探讨科技如何助力智慧文旅提升游客体验。 一、智慧文旅的兴起与…

认识Spring 中的日志

这篇文章你将了解到Spring生态中日志框架是如何演化集成的 Spring Boot 日志 众说周知,Spring Boot 统一了日志框架,统一使用Logback进行日志输出,不管内部依赖框架使用的何种日志,最终都以Logback输出,他为什么需要统…

FCIS 2023:洞悉网络安全新前沿,引领未来安全创新狂潮

在数字化浪潮席卷全球的今天,网络安全问题愈发凸显其重要性。 FCIS 2023网络安全创新大会作为业界瞩目的盛会,不仅汇聚了国际顶尖的网络安全专家,更展示了最前沿的安全技术与研究成果。那么,参与这场大会,我们究竟能学…

05 MyBatis之表关系的声明+事务+SqlSession三件套的作用域

MyBatis 支持一对一,一对多,多对多查询。XML 文件和注解都能实现关系的操作。多对多实质就是一对多 1. 表关系的维护 1.1 One一对一 一对一查询和多表(两表)查询很相似, 都能查询两表的全部属性 区别是一对一可以在对象中嵌套对象, 呈现包含关系; 多表…

ele-h5项目使用vue3+vite开发:第一节、页面头部实现

实现页面 确认需求 顶部提示栏搜索框搜索提示 normalize.css:处理不同浏览器的默认样式 安装 npm i normalize.css 使用 src\App.vue<style scoped> import normalize.css;#app {/** 让字体抗锯齿&#xff0c;看起来更清晰 */-webkit-font-smoothing: antialiased;-moz-o…

python打造光斑处理系统4:裁切光斑感兴趣区域

文章目录 图像裁切给定坐标裁切手动阈值裁切 光斑处理&#xff1a;python处理高斯光束的图像 光斑处理系统&#xff1a;程序框架&#x1f31f;打开图像&#x1f31f;参数对话框/伪彩映射 图像裁切 一般来说&#xff0c;光斑只占图像很小一部分&#xff0c;为了更好的观感和更…