[每周一更]-(第99期):MySQL的索引为什么用B+树?

在这里插入图片描述

文章目录

    • B树与B+树的基本概念
      • B树(Balanced Tree)
      • B+树(B-Plus Tree)
      • 对比
    • 为什么MySQL选择B+树
      • 1. **磁盘I/O效率**
      • 2. **更稳定的查询性能**
      • 3. **更高的空间利用率**
      • 4. **并发控制**
    • 其他树结构的比较
    • 参考

索引是一种 数据结构,用于帮助我们在大量数据中快速定位到我们想要查找的数据。MySQL索引有三类:B+树索引、Hash索引、全文索引

在数据库系统中,索引是提高数据检索效率的关键工具。而在MySQL中,B+树索引是最常用的一种索引结构。理解为什么MySQL选择使用B+树而不是B树或其他树结构,首先需要深入了解B+树和B树的特性及其在数据库检索中的表现。

B树与B+树的基本概念

B树(Balanced Tree)

B树是一种自平衡的多叉树数据结构,其中每个节点可以包含多个子节点和键。B树的每个节点都包含键和子节点指针,叶子节点不需要保持在同一层。

B树的特性包括:

  1. 每个节点包含多个键:每个节点至少包含 ⌈m/2⌉−1个键,至多包含 m−1 个键,m 为B树的阶数。
  2. 所有叶子节点在相同深度:树的所有叶子节点处于同一深度。
  3. 平衡性:插入和删除操作保持树的平衡。

B+树(B-Plus Tree)

B+树是B树的一种变体,具有以下特点:

  1. 叶子节点链表:所有叶子节点通过链表相连,形成一个有序链表。
  2. 非叶子节点只存储键:非叶子节点不存储数据,只存储键和子节点指针,数据仅存储在叶子节点中。
  3. 更高的节点分支因子:因为非叶子节点只存储键,B+树相对于同阶的B树可以存储更多的键,从而减少树的高度。

对比

特性B树B+树
节点存储键和数据内部节点存储键,叶子节点存储数据
键的数量⌈m/2⌉−1到 m−1⌈m/2⌉−1到 m−1
子节点指针数量⌈m/2⌉ 到 m⌈m/2⌉ 到 m
数据存储位置内部节点和叶子节点仅在叶子节点
叶子节点链表不存在存在(叶子节点通过链表连接)
查询效率O(logmN),从根节点到叶子节点O(logmN),从根节点到叶子节点
插入/删除操作相对复杂,需要调整节点相对复杂,需要调整叶子节点链表和节点
范围查询效率较差,需要遍历多个节点优秀,叶子节点通过链表有序连接
顺序访问较差,需要中序遍历树优秀,通过链表遍历叶子节点
空间利用率较高较高,叶子节点存储更多数据
适用场景频繁插入、删除操作高效范围查询、顺序访问、数据库索引

B树

  • 适用于需要频繁插入和删除操作的场景。
  • 数据既存储在内部节点也存储在叶子节点。
  • 查询和更新操作效率较高,但范围查询和顺序访问效率较低。

B+树

  • 适用于需要高效范围查询和顺序访问的场景。
  • 数据仅存储在叶子节点,内部节点只存储键。
  • 叶子节点通过链表连接,提高了范围查询和顺序访问的效率。

为什么MySQL选择B+树

1. 磁盘I/O效率

数据库检索的效率很大程度上取决于磁盘I/O操作的效率。B+树的结构有利于减少磁盘I/O操作:

  • 叶子节点链表:B+树的所有叶子节点通过链表相连,支持顺序访问。当进行范围查询时,只需在链表中遍历叶子节点即可,大大提高了范围查询的效率。
  • 更高的节点分支因子:由于非叶子节点只存储键,B+树可以在同样大小的节点中存储更多的键和子节点指针,从而减少树的高度。更少的高度意味着在检索时需要更少的磁盘I/O操作。

2. 更稳定的查询性能

B+树的查询性能更加稳定,尤其是在范围查询和排序操作中表现突出:

  • 范围查询:B+树的叶子节点通过链表相连,进行范围查询时只需遍历链表,性能较为稳定。
  • 排序:B+树的叶子节点本身是有序的,支持高效的排序操作。

3. 更高的空间利用率

B+树的空间利用率更高,因为它将数据仅存储在叶子节点中,而非叶子节点只存储键和指针。相比之下,B树的每个节点都存储数据和指针,导致空间利用率较低。

4. 并发控制

B+树的结构有助于提高并发控制能力:

  • 分裂和合并操作:在插入和删除操作时,B+树的分裂和合并操作相对简单且对树的结构影响较小,这有助于提高并发操作的性能和稳定性。

与 B 树相比,B+树具有以下优点:

  • 更矮胖的树: B+树的非叶子结点不存储数据,因此可以存储更多的索引,从而使树更加矮胖。这使得查询数据时需要访问的树的层数更少,从而提高查询效率。
  • 更快的范围查询: B+树的叶子结点按关键字顺序存储,并且相邻的叶子结点之间有指针相连,因此可以很有效地支持范围查询。

B树与B+树比较

  • B+树层级更少,查找更快
  • B+树查询速度稳定:由于B+树所有数据都存储在叶子节点,所以查询任意数据的次数都是树的高度h
  • B+树有利于范围查找
  • B+树全节点遍历更快:所有叶子节点构成链表,全节点扫描,只需遍历这个链表即可
  • B树优点:如果在B树中查找的数据离根节点近,由于B树节点中保存有数据,那么这时查询速度比B+树快。

其他树结构的比较

虽然B+树在数据库索引中表现优异,但了解其他树结构的优缺点也有助于全面理解数据库索引的选择:

  • AVL树:AVL树是一种高度平衡的二叉搜索树,每次插入和删除操作都会导致旋转,以保持平衡。虽然AVL树的查找效率高,但由于频繁的旋转操作,其插入和删除效率较低,不适合频繁更新的数据库环境。
  • 红黑树:红黑树是一种自平衡的二叉搜索树,通过颜色标记节点并进行旋转操作来保持平衡。红黑树的插入和删除效率高于AVL树,但由于其二叉结构,相对于多叉树的B+树,磁盘I/O效率较低。

各种树解决的问题以及面临的新问题

  • 二叉查找树(BST):解决了排序的基本问题,但是由于无法保证平衡,可能退化为链表;

  • 平衡二叉树(AVL):通过旋转解决了平衡的问题,但是旋转操作效率太低;

  • 红黑树:通过舍弃严格的平衡和引入红黑节点,解决了AVL旋转效率过低的问题,但是在磁盘等场景下,树仍然太高,IO次数太多;

  • B树:通过将二叉树改为多路平衡查找树,解决了树过高的问题;

  • B+树:在B树的基础上,将非叶节点改造为不存储数据的纯索引节点,进一步降低了树的高度;此外将叶节点使用指针连接成链表,范围查询更加高效。

MySQL选择B+树作为索引结构是基于其在磁盘I/O效率、查询性能、空间利用率和并发控制等方面的优势。B+树通过将数据存储在叶子节点并使用链表连接叶子节点,实现了高效的范围查询和排序操作,同时减少了磁盘I/O操作的次数,提供了稳定的查询性能。这些特点使得B+树成为MySQL数据库索引的首选结构。

参考

  • 知乎 - MySQL 为什么使用 B+ 树来作索引?
  • Github - B树和B+树详解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/667576.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

文件夹损坏0字节:全面解析、恢复技巧与预防策略

在数字时代,数据的完整性和安全性至关重要。然而,我们时常会遭遇文件夹损坏并显示为0字节的棘手问题。这种情况一旦发生,用户可能会面临数据丢失的风险。本文将详细探讨文件夹损坏0字节的现象,分析其背后的原因,并提供…

Java对象的比较——equals方法,Comparable接口,Comparator接口

Java对象的比较——equals方法,Comparable接口,Comparator接口 1. equals方法2. Comparable接口3. Comparator接口 1. equals方法 在判断两个整数是否相同时,我们可以使用以下方式: System.out.println(1 2); System.out.printl…

【传知代码】基于知识引导提示的因果概念提取(论文复现)

前言:在当今信息爆炸的时代,我们被海量的数据所包围,然而,这些数据中的真正价值往往隐藏在深层的因果关系之中。无论是科学研究、商业决策,还是日常生活中的选择,理解并准确把握事物之间的因果关系&#xf…

Nginx 文件下载 限速设置 限制访问频率 下载速率 并发连接数 简单实用教程

1 没有限速之前 2 nginx配置 #增加如下配置 limit_conn_zone $binary_remote_addr zoneaddr:10m; location / {limit_conn addr 1; #按照来源,限制每个IP 的连接数为1limit_rate_after 1000k;不限速下载的数据量limit_rate 100k; #限制最大传输速率root /data/log…

Lesson6--排序(初级数据结构完结篇)

【本节目标】 1. 排序的概念及其运用 2. 常见排序算法的实现 3. 排序算法复杂度及稳定性分析 1.排序的概念及其运用 1.1排序的概念 排序 :所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来…

随身wifi和手机流量卡,你知道该怎么选吗?

网络已经成为我们这个时代的代名词! 那么,在上网的时代,我们有很多问题都要考虑,比如如何选择上网方式,是选择一张流量卡,还是一个随身WIFI? 听小编一句劝,先不要着急买&#xff0c…

2024年中国CRM行业发展方向和前景 | 《连接型CRM》文章精选

01、创新突破,技术为本 中国经济发展处于增速换挡期,企业数字化需求旺盛,同时云计算、大数据、物联网、区块链、5G等新技术的发展,为CRM系统的应用与发展提供了更多的机遇和可能。 近些年来,技术的发展对CRM的重要性…

打造你的专属Vue组件:超实用“高级筛选弹窗组件“实战

打造你的专属Vue组件:超实用“高级筛选弹窗组件“实战 在现代前端开发中,组件化思想是提高开发效率、维护性和代码复用性的关键。本文将通过一个实例——创建一个自定义的“高级筛选”弹窗组件,来展示如何在Vue框架下利用Composition API和E…

AI图书推荐:使用GPT-4和ChatGPT开发AI应用APP

这本书是面向想要学习如何使用大型语言模型构建应用程序的 Python 开发人员的全面指南。作者 Olivier Caelen 和 Marie-Alice Blete 涵盖了 GPT-4 和 ChatGPT 的主要特征和好处,并解释了它们的工作原理。您还将获得使用 GPT-4 和 ChatGPT Python 库开发应用程序的逐…

解决3D模型变黑及贴图不显示的问题---模大狮模型网

在3D建模和渲染过程中,模型变黑或贴图不显示是常见的挑战之一。这不仅影响了模型的视觉效果,还可能导致后续的工作流程受阻。本文将针对这两个问题,提供详细的解决方法和步骤,帮助读者快速有效地解决问题。 一、检查并调整光照设置…

【SpringBoot】怎么在一个大的SpringBoot项目中创建多个小的SpringBoot项目,从而形成子父依赖

父子项目工程创建 步骤 先创建父项目 具体操作步骤请看本文章:使用maven工程创建spring boot项目 创建子项目 file- project structure module–new module 剩下步骤请看创建父工程时的操作使用maven工程创建spring boot项目 应用 确认即可 之后创建启动类…

【实战JVM】-实战篇-05-内存泄漏及分析

【实战JVM】-实战篇-05-内存泄漏及分析 1 内存溢出和内存泄漏1.1 常见场景1.2 解决内存溢出的方法1.2.1 发现问题1.2.1.1 top1.2.1.2 ViusalVM1.2.1.3 arthas1.2.1.4 PrometheusGrafana 1.2.2 堆内存状况对比1.2.3 内存泄漏原因-代码中1.2.3.1 equals()-hashCode()1.2.3.2 内部…

倪师哲学。能让我好,我就接受

还有有些人更搞笑的是,把自己的行为啊,建立在别人的基础之上,如果那个人么样对我,我肯定能怎么样对这个人。 生而为人呐,你是一个独立的人,不要去总是拿着各种各样的前提,来限制了自己个人的成长…

工作流 Activiti7 初始

文章目录 ☃️1.1 Activiti 介绍☃️1.2 Activiti 开发流程☃️1.3 BPMN 2.0 规范是什么☃️1.4 BPMN 2.0 基本流程符号❄️❄️1.4.1 事件 Event❄️❄️1.4.2 活动❄️❄️1.4.3 网关 Gateway ☃️1.5 Activiti API 服务接口❄️❄️1.5.1 核心Service接口及其获取 ☃️1.1 A…

单片机按键处理模块

一 介绍 1.key_board用于单片机中的小巧多功能按键支持,软件采用了分层的思想,并且做到了与平台无关,用户只需要提供按键的基本信息和读写io电平的函数即可,非常方便移植,同时支持多个矩阵键盘及多个单io控制键盘。 …

儿童节快乐!探索图形化编程桌面的“童年”成长之路

在这个充满童真与快乐的儿童节,我要向在CSDN平台上努力拼搏的每一位朋友,送上我最热切、最深情的祝福!愿你们心中那份孩童般的纯真与对世界无尽的好奇永不褪色,愿你们的人生道路如同这个美好的节日,流光溢彩、欢乐永恒…

nginx搭建简单负载均衡demo(springboot)

目录 1 安装nignx 1.1 执行 brew install nginx 命令(如果没安装brew可百度搜索如何安装brew下载工具。类似linux的yum命令工具)。 1.2 安装完成会有如下提示:可以查看nginx的配置文件目录。 1.3 执行 brew services start nginx 命令启动…

【qt】多窗口开发

多窗口开发 一.应用场景二.嵌入的窗口1.设计Widget窗口2.创建窗口3.添加窗口4.总代码 三.独立的窗口1.创建窗口2.显示窗口 四.总结 一.应用场景 多窗口,顾名思义,有多个窗口可以供我们进行操作! 截个小图,你应该就知道了 OK,话不多说,直接开干,先来设计我们的主窗口 需要蔬菜…

Mysql基础教程(13):GROUP BY

MySQL GROUP BY 【 GROUP BY】 子句用于将结果集根据指定的字段或者表达式进行分组。 有时候,我们需要将结果集按照某个维度进行汇总。这在统计数据的时候经常用到,考虑以下的场景: 按班级求取平均成绩。按学生汇总某个人的总分。按年或者…

如何让Google收录网站?

Google收录网站的前提条件是确保网站可以公开访问,并且页面加载速度需要快,这样Google爬虫才可以访问到你的网站,并且索引你网站中的内容。实现了上面的前提条件,可以通过优化数据结构、创建站点地图、使用Google Search Console、…