深入解析MySQL索引结构:从数组到B+树的演变与优化

前言: 在数据库查询中,索引是一种关键的性能优化工具。然而,索引的失效可能导致查询效率大幅下降。为了更好地理解索引的工作原理及规避其失效,深入了解索引结构的演变过程尤为重要。

  • MySQL 的索引数据结构从简单到复杂,主要经历了以下几个阶段:

1. 数组和链表:简单但低效的起步

  • 特点
    • 数组:支持快速等值查找,但插入和删除效率低,时间复杂度为 O(n)。
    • 链表:动态插入删除效率高,但查找需要线性扫描,效率低。
  • 局限性
    • 不适合范围查询和频繁插入、删除的场景。
    • 对于大规模数据,查找性能难以满足需求。

2. 二叉搜索树:提升效率但不稳定

  • 特点

    • 左子树的节点值 < 根节点,右子树的节点值 > 根节点。
    • 查找、插入和删除的时间复杂度为 O(log n)。
  • 问题

    • 数据分布不均衡时,可能退化为链表,复杂度降为 O(n)。
    • 不适合大规模数据的磁盘 I/O 场景。

3. 红黑树:平衡性与效率的折中

  • 特点

    • 通过颜色属性(红/黑)及旋转操作保持平衡。
    • 时间复杂度稳定为 O(log n),插入、删除效率较高。
  • 局限性

    • 树的高度仍较大,对于磁盘 I/O 敏感的场景性能不足。
    • 更适合内存索引,不适用于大规模数据存储。

4. B-树:为磁盘优化的多叉平衡树

  • 特点

    • 节点可容纳多个关键字,减少树的高度。
    • 支持等值查询和范围查询,插入和删除通过节点分裂保持平衡。
  • 优点

    • 更少的树高意味着更少的磁盘 I/O,适合海量数据查询。
  • 局限性

    • 叶子节点和非叶子节点都存储数据,占用更多空间。
    • 查询路径不稳定,非叶子节点也可能存储数据,影响效率。

5. B+树:数据库索引的主流选择

  • 改进点

    • 所有数据存储在叶子节点:非叶子节点只存储索引,减少节点大小,进一步降低树高。
    • 叶子节点链表连接:支持高效范围查询,链表可直接顺序扫描。
  • 优点

    • 查询性能稳定:所有查找操作都到达叶子节点,路径固定,效率更高。
    • 适配范围查询:链表结构使范围查询更加高效。
    • 磁盘 I/O 优化:单节点存储更多索引值,减少访问磁盘的次数。
  • 缺点

    • 非叶子节点为冗余索引,占用空间稍多。

6. B+树 vs B-树:直观对比

特点B-树B+树
数据存储数据存储在叶子节点和非叶子节点数据存储仅在叶子节点
非叶子节点的功能既存储索引也存储数据仅存储索引信息
叶子节点的连接无链表连接叶子节点通过链表连接
查找效率每次查找到达某个节点即可必须查找到叶子节点(范围查询效率更高)
空间占用较少较多
范围查询需要在树中逐层遍历叶子节点链表可以直接实现范围查询

7. 哈希:精准查询的快刀

在这里插入图片描述

  • 优点

    • 时间复杂度 O(1),适合精确匹配查询。
    • 实现简单,广泛用于 NoSQL 数据库和缓存系统(如 Redis、Memcached)。
  • 局限性

    • 不支持范围查询,随机化存储导致无法顺序访问。
    • 数据冲突处理(如链表法、开放地址法)会影响性能。

8. 为什么 MySQL 选用 B+树?

  • 优化磁盘 I/O

    • 非叶子节点仅存储索引,减少节点大小,提高磁盘页的利用率。
    • 树高降低,减少查询时的磁盘访问次数(通常仅需 3-4 次 I/O)。
  • 查询性能稳定

    • 所有查找都需到叶子节点,路径长度固定,性能更均匀。
  • 支持范围查询

    • 叶子节点链表连接,可顺序扫描,天然适配范围查询和分页。
  • 维护成本低

    • 插入和删除操作只需局部调整,不影响整体结构。
  • 数据库特性匹配

    • B+树索引性能适配高并发查询、大规模数据存储等场景。

结束语:MySQL 索引结构的演变从简单的数组、链表到红黑树、B-树,再到 B+树的最终选择,背后折射的是对性能、存储效率和功能适配的不断优化。这不仅仅是一种技术选择,更是一种工程智慧。
——如果觉得有帮助,😊点个赞支持一下吧!——

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/945248.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

window如何将powershell以管理员身份添加到右键菜单?(按住Shift键显示)

window如何将powershell以管理员身份添加到右键菜单&#xff1f; 在 Windows 中&#xff0c;将 PowerShell 以管理员身份添加到右键菜单&#xff0c;可以让你在需要提升权限的情况下快速打开 PowerShell 窗口。以下是详细的步骤&#xff0c;包括手动编辑注册表和使用注册表脚本…

Redis--持久化策略(AOF与RDB)

持久化策略&#xff08;AOF与RDB&#xff09; 持久化Redis如何实现数据不丢失&#xff1f;RDB 快照是如何实现的呢&#xff1f;执行时机RDB原理执行快照时&#xff0c;数据能被修改吗&#xff1f; AOF持久化是怎么实现的&#xff1f;AOF原理三种写回策略AOF重写机制 RDB和AOF合…

uniapp-vue3(下)

关联链接&#xff1a;uniapp-vue3&#xff08;上&#xff09; 文章目录 七、咸虾米壁纸项目实战7.1.咸虾米壁纸项目概述7.2.项目初始化公共目录和设计稿尺寸测量工具7.3.banner海报swiper轮播器7.4.使用swiper的纵向轮播做公告区域7.5.每日推荐滑动scroll-view布局7.6.组件具名…

计算机网络 (16)数字链路层的几个共同问题

一、封装成帧 封装成帧是数据链路层的一个基本问题。数据链路层把网络层交下来的数据构成帧发送到链路上&#xff0c;以及把接收到的帧中的数据取出并上交给网络层。封装成帧就是在一段数据的前后分别添加首部和尾部&#xff0c;构成了一个帧。接收端在收到物理层上交的比特流后…

操作系统论文导读(八):Schedulability analysis of sporadic tasks with multiple criticality specifications——具有多个

Schedulability analysis of sporadic tasks with multiple criticality specifications——具有多个关键性规范的零星任务的可调度性分析 目录 一、论文核心思想 二、基本定义 2.1 关键性指标 2.2 任务及相关参数定义 2.3 几个基础定义 三、可调度性分析 3.1 调度算法分…

「教程」抖音短剧小程序源码开发后上架的教程及好处

上线抖音短剧小程序的步骤 注册账号与准备资料&#xff1a;首先需要在抖音开放平台官网注册一个抖音小程序账号&#xff0c;并完成相关认证&#xff0c;获取小程序开发权限。同时&#xff0c;要准备好短剧相关的素材&#xff0c;如视频、音频、剧本、封面图片等 开发或选择小程…

omi friend实战记录

一、简介 omi friend是国外githab上开源的一个“AI硬件”的制作教程&#xff0c;它的形状是个三角形&#xff0c;属于项链佩戴这类的。可以接入llm进行对话&#xff0c;他有麦克风、扬声器&#xff0c;还有电池。外形好看&#xff0c;功能实用。还有专属的一系列app可以供方便…

活动预告 |【Part2】 Azure 在线技术公开课:迁移和保护 Windows Server 和 SQL Server 工作负载

课程介绍 通过 Microsoft Learn 免费参加 Microsoft Azure 在线技术公开课&#xff0c;掌握创造新机遇所需的技能&#xff0c;加快对 Microsoft 云技术的了解。参加我们举办的“迁移和保护 Windows Server 和 SQL Server 工作负载”活动&#xff0c;了解 Azure 如何为将工作负载…

hive-sql 连续登录五天的用户

with tmp as (select 梁牧泽 as uid, 2023-03-03 as dt union allselect 梁牧泽 as uid, 2023-03-04 as dt union allselect 梁牧泽 as uid, 2023-03-05 as dt union allselect 梁牧泽 as uid, 2023-03-07 as dt union allselect 梁牧泽 as uid, 2023-03-08 as dt union allsel…

(NDSS2024)论文阅读——仅低质量的训练数据?用于检测加密恶意网络流量的稳健框架

文章基本信息 作者&#xff1a;Yuqi Qing et al. &#xff08;清华大学李琦团队&#xff09; 代码 文章 摘要 存在问题&#xff1a;收集包含足够数量的带有正确标签的加密恶意数据的训练数据集是具有挑战性的&#xff0c;当使用低质量的训练数据训练机器学习模型时&#xff…

【心随行动】让行动轨迹和复盘形成闭环螺旋式上升

为何会迷茫&#xff0c;因为不知过去未谋将来。认真复盘可以帮达到理想的彼岸&#xff01;&#xff01;&#xff01; 文章目录 为何会迷茫&#xff0c;因为不知过去未谋将来。认真复盘可以帮达到理想的彼岸&#xff01;&#xff01;&#xff01;日复盘模板&#xff1a;时间&…

LabVIEW生物医学信号虚拟实验平台

介绍了一款基于LabVIEW的多功能生物医学信号处理实验平台的设计和实现。平台通过实践活动加强学生对理论的理解和应用能力&#xff0c;特别是在心电图(ECG)和脑电图(EEG)的信号处理方面。实验平台包括信号的滤波、特征提取和频谱分析等功能&#xff0c;能直观体验和掌握生物医学…

Ubuntu安装MinIO

注&#xff1a;本文章的ubuntu的版本为&#xff1a;ubuntu-20.04.6-live-server-amd64。 Ubuntu&#xff08;在线版&#xff09; 更新软件源 sudo apt-get update 通过wget下载MinIO二进制文件 sudo wget -P /usr/local/bin https://dl.min.io/server/minio/release/linux…

光纤收发器技术参数详解

1.1系统架构 1.2光纤收发器发展历程 数据速率 模块 最新修订年份 描述 应用 1 Gbps GBIC 2000年 千兆接口转换器 千兆以太网、SDH/SONET (2.5 Gb/s) 和光纤通道 (4Gb/s) 10 Gbps SFP 2001年 小型可插拔 千兆以太网、SDH/SONET (2.5 Gb/s) 和光纤通道 (4Gb/s)…

数据结构--顺序表(详解)

欢迎大家来到我的博客~欢迎大家对我的博客提出指导&#xff0c;有错误的地方会改进的哦~点击这里了解更多内容 目录 一、线性表二、顺序表 一、线性表 线性表&#xff08;linear list&#xff09;是n个具有相同特性的数据元素的有限序列。 线性表是一种在实际中广泛使用的数据结…

C#高级篇 反射和属性详解【代码之美系列】

&#x1f380;&#x1f380;&#x1f380;代码之美系列目录&#x1f380;&#x1f380;&#x1f380; 一、C# 命名规则规范 二、C# 代码约定规范 三、C# 参数类型约束 四、浅析 B/S 应用程序体系结构原则 五、浅析 C# Async 和 Await 六、浅析 ASP.NET Core SignalR 双工通信 …

C语言程序设计:程序设计和C语言

文章目录 C语言程序设计&#xff1a;程序设计和C语言一、计算机程序和语言计算机语言C语言的发展及其特点C语言的发展历程C语言的特点 二、编译器安装三、最简单的C 语言程序简单的C语言程序介绍程序执行流程&#xff1a;输出&#xff1a; 求两个整数之和运行结果&#xff1a; …

I2C(一):存储器模式:stm32作为主机对AT24C02写读数据

存储器模式&#xff1a;在HAL库中&#xff0c;I2C有专门对存储器外设设置的库函数 I2C&#xff08;一&#xff09;&#xff1a;存储器模式的使用 1、I2C轮询式写读AT24C02一页数据2、I2C轮询式写读AT24C02多页数据3、I2C中断式写读AT24C02一页数据4、I2C使用DMA式写读AT24C02一…

发表文章去哪里投稿?软文推广常见的几种渠道类型

在互联网高度繁荣的当下&#xff0c;人们获取信息的门槛愈发降低&#xff0c;投放信息渠道的类型也五花八门。但想要获得理想的推广效果&#xff0c;信息投放渠道在其中发挥着不小的作用。发表文章去哪里投稿&#xff1f;下面就让我们来了解一下软文推广常见的几种渠道类型。 一…

QComboBox中使用树形控件进行选择

事情是这样的&#xff0c;要在一个ComboBox中通过树形结构进行内容的选择。 默认的QComboBox展开是下拉的列表。因此需要定制一下。 效果就是这样的 实现上面效果的核心代码就是下面这样的 MainWindow::MainWindow(QWidget *parent) : QMainWindow(parent) { treenew…