【MySQL数据库】| 索引以及背后的数据结构

🎗️ 主页:小夜时雨
🎗️ 专栏:MySQL数据库
🎗️ 如何优雅的活着,是我找寻的方向
优雅

目录

    • 1. 基本知识
    • 2. 索引背后的数据结构
      • 总结

1. 基本知识

  1. 概念

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中一列或者多列创建索引,并指定索引的类型,各类的索引有各自的数据结构来实现。

索引存在的意义就是就是为了加快查询速度!!!(因为实际开发中,查询场景用的多)。
但是也付出了一定的代价:

  1. 需要付出额外的空间来保存索引的数据。
  2. 索引可能会拖慢新增,删除和修改的速度。
  1. 作用
  • 数据库中的表,数据,索引之间的关系,类似于书架上的图书,书籍内容和目录的关系。
  • 索引所起的作用类似于数据目录,可以快速定位,检索数据。
  • 索引对于提高数据库的性能有很大的帮助。
  1. 使用场景

要考虑对数据库表的某列或者几列创建索引,需要考虑以下几点:

  • 数据量较大,且经常要对这些列进行条件查询
  • 插入和修改操作较少
  • 索引会占用额外的磁盘空间

那么也就引申出什么时候不要用索引?

  1. 经常增删改的列不要建立索引
  2. 有大量重复的列不建立索引

2. 索引背后的数据结构

索引背后使用的是 B+ 树。

1. 为什么不使用 二叉搜索树或者哈希表来存储索引数据?

  • 对于二叉搜索树:二叉搜索树的特点是,每个非叶子节点都有两个孩子节点,
    如果元素的个数多了,那么树的高度就会很高,自根节点向下搜索需要访问的叶子结点也会非常多,这就大大降低了查询的效率。树的高度相当于是比较次数,对于数据库来说就是 IO 的访问次数。

  • 对于哈希表: 虽然查询的快,但是哈希表是 key-value 结构的,需要知道 key 是多少,通过哈希函数来计算到下标,进而查找到数据,但是模糊查询的时候,key 值无法确定,也就查询不到数据了,即是不支持范围查询和模糊查询。

2. 索引结构为什么不使用 B 树(或者B- 树) ?

B 树可以认为是一个N叉搜索树 ,结构如下:
在这里插入图片描述

B 树的特点:

每个节点都可以存储多个数据,这些多个数据就划分出了一定的区间,在搜索的时候就不用访问那么多的叶子节点,而是直接在细分的区间去查找,提高了效率。

MySQL索引结构–B+ 树

结构如下:
在这里插入图片描述
B+树的特点:

  1. 一个节点可以存储 N 个key,N 个key又划分出 N 个区间 (不是 N+1 个区间,看图可知)
  2. 整个树的数据都是在 叶子节点上的,所有非叶子节点上的数据都会在叶子节点中出现(同时也是叶子结点的最大值)。也就是每个节点中的 key 值,都会在子结点中出现,同时该key也是子节点的最大值。
  3. B+ 树的叶子节点是首尾相连的,类似于链表结构的。
  4. 由于叶子节点保存完整的数据,只在叶子节点这里存储每一行的数据,而非叶子节点只保存key值即可

B+ 树的优势:

  • 一个节点中保存更多的key值,所以最终树的高度是相对矮的,也就是查询的时候减少了 IO 的访问次数。(这里 IO 特值硬盘的访问)
  • 所有的查询都会落在叶子节点,也就是查询任何一个数据,访问 IO 的次数是一样的,也就意味着查询更加稳定(稳定可以对执行效率有一个判断)。
  • B+ 树的叶子节点类似于链表结构,方便进行范围查询。
  • 由于所有数据都是在叶子节点上,非叶子节点只存储key值,所以非叶子节点占用的空间是比较小的,这些叶子节点可能就是在内存中缓存,有进一步减少了 IO 的访问次数。

总结

  • B+树对于哈希表来说,可以处理模糊匹配的场景;
  • B+树对于二叉搜索树来说,深度更低,查找效率更高;
  • B+树对于B树来说,
    • B树只适合随机检索,而B+树同时支持随机检索和顺序检索;
    • 单一节点可以储存更多的数据,降低查询的IO次数;
    • 所有的查询都需要查找到叶子结点,使得查询性能更稳定;
    • 兄弟节点之间相连形成有序链表,便于范围内查找,增删效率也更高;

🎗️🎗️🎗️ 好啦,到这里有关 数据库索引 的分享就没了,如果感觉做的还不错的话可以点个赞,关注一下,你的支持就是我继续下去的动力,蟹蟹大家了,我们下期再见,拜了个拜~ ☆*: .。. o(≧▽≦)o .。.:*☆

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/126124.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode刷题详解—— 找出所有子集的异或总和再求和

1. 题目链接:1863. 找出所有子集的异或总和再求和 2. 题目描述: 一个数组的 异或总和 定义为数组中所有元素按位 XOR 的结果;如果数组为 空 ,则异或总和为 0 。 例如,数组 [2,5,6] 的 异或总和 为 2 XOR 5 XOR 6 1 。…

95 课程表

课程表 题解1 BFS(拓扑图模板)题解2 DFS 你这个学期必须选修 numCourses 门课程,记为 0 到 numCourses - 1 。 在选修某些课程之前需要一些先修课程。 先修课程按数组 prerequisites 给出,其中 prerequisites[i] [ai, bi] &am…

【halcon】halcon 函数文件 以及 脚本引擎如何调用外部函数文件 上篇

前言 halcon有几种文件: 本地程序函数(.hdev)外部函数文件(.hdvp)库函数(.hdp) 说多了容易混淆,今天就说,我觉得最有用的:外部函数文件(.hdvp) 步骤 先写一段halcon脚本&#x…

php冒泡算法实现倒序和正序排列

冒泡排序是一种简单的排序算法,其主要思想是比较相邻的两个元素,根据需要交换位置,将较大(或较小)的元素逐渐冒泡到数组的一端,从而实现排序。 1、从小到大排序 function bubbleSort($arr) {$len count(…

剪贴板管理软件 Paste Wizard mac中文版功能特色

Paste Wizard mac是一款剪贴板管理工具,它可以帮助用户更高效地管理剪贴板中的文本、图片、链接等内容。 Paste Wizard mac特色功能 提供了多种方式来保存和管理剪贴板中的内容。用户可以创建自定义的标签,将内容按照标签进行分类,方便快速查…

springboot,spring框架返回204 status code的时候,会吞掉返回值

背景 发现有个有意思的现象,就是当你的接口返回204的 HTTP status code 的时候,会自动把 response body 吃掉,即使代码里是有返回的。例如 (其实204本身就是NO_CONTENT的意思,不过我是真没想到真干掉了返回&#xff0…

5G-A 商用加速,赋能工业互联网

2019 年 6 月,中国工业和信息化部发放 5G 商用牌照。同年 10 月,三大运营商公布 5G 商用套餐,11 月 1 日正式上线 5G 商用套餐,标志中国正式进入 5G 商用新纪元。今年是 5G 商用的第五年,在当前数字经济蓬勃发展的催化…

Mathematica清除全局变量以及避免与内置命令冲突

自己在使用MMA的时候之前遇到过一个问题,就是发现使用 ClearAll["Global*"]这个命令并不能清除某些变量,例如 如果想要清除K这个变量则需要单独清除 Clear[K]。 实际上这是由于和MMA内部的一些预定义的命令或函数冲突的结果。其实其他变量都…

求极限问题:x趋于0时的等价替换及其适用条件、洛必达法

x趋于0时的等价替换及其适用条件 等价无穷小的定义: 若 lim ⁡ β α 1 \lim\dfrac{\beta}{\alpha}1 limαβ​1,则 β \beta β 与 α \alpha α 是等价无穷小的,记作 α ∼ β \alpha \sim \beta α∼β. 即当两个函数相比取极限&…

php 二分查询算法实现

原理:二分查找算法(Binary Search)是一种针对有序数组的查找算法。它的原理是通过将查找区间逐渐缩小一半来快速定位要查找的目标值。 应用场景: 数据库或文件系统索引查找:在数据库或文件系统中,索引是有…

谷歌插件报错 Manifest version 2 is deprecated, and support will be removed in 2023.

点开错误发现 高亮部分有问题。 下面是这个插件的解压后的原始包:我们主要就去找json结尾的东西 就这两个 一个个排除 找到了 把2 改成3就可以了 一定要记得保存!!!!!!!&#xff0…

计算机考研408有多难?25考研经验贴,开个好头很有必要

前言 大家好,我是陈橘又青,相信关注我的各位小伙伴们中,大多都是在计算机专业的大学生吧! 每天都有许多人在后台私信我,问我要不要考研,我想说这个东西是因人而异的,像我本人就选择了就业&…

网络通信——与Socket交换数据(三十一)

1. 与Socket交换数据 1.1 知识点 (1)通过Android与Socket完成基本的Echo程序实现; (2)通过对象序列化进行大数据的传输; 1.2 具体内容 对于网络的开发而言,最常使用的交互模式:W…

力扣197. 上升的温度

【版本1】: select w2.id from Weather w1 inner join Weather w2 on w1.recordDate subdate(w2.recordDate,1) where w2.Temperature > w1.Temperature【小记】 1、遇到这种某个字段与自身相比(今天温度和昨天温度比,是温度这个字段…

11.8 33oj 模拟赛总结(时间安排 + 题解(数学 + 二分 + 括号匹配DP + 性质DP))

文章目录 考试时间及策略考试结果赛后总结题解Balance AddictsBoboniu and StringBracket InsertionConveyor 考试时间及策略 7:40 - 8:00 开题。T1 应该是个dp, 但是好像有点恶心。T2是个神秘构造。T3是个求随机括号匹配的概率,一眼应该是个 n 3 n^3 n3 的…

一篇博客读懂单链表——Single-List

目录 一、初识单链表 单链表是如何构造的: 单链表如何解决顺序表中的问题: 二、单链表的初始定义 三、尾插和头插 3.1 新建结点CreateNode 3.2 打印SLTPrint 3.3 尾插SLTPushBack 3.4 头插SLTPushFront 四、尾删和头删 4.1 尾删SLTPopBack…

蓝牙安全管理(SM:Security Manager)规范详解

总述 配对(Pairing)分为三个阶段,前两个阶段是必须的,而第三阶段是可选的,三个阶段如下: 阶段1:配对功能交换(Pairing Feature Exchange) 阶段2(LE传统配对 LE legacy pairing):短期密钥(STK:Short Term…

【Python大数据笔记_day04_Hadoop】

分布式和集群 分布式:多台服务器协同配合完成同一个大任务(每个服务器都只完成大任务拆分出来的单独1个子任务) 集群:多台服务器联合起来独立做相同的任务(多个服务器分担客户发来的请求) 注意:集群如果客户端请求量(任务量)多,多个服务器同时处理不同请求(不同任务),如果请求量…

为什么推荐从Linux开始了解IT技术

IT是什么,是干什么的呢? 说起物联网,云计算,大数据,或许大家听过。但是,你知道,像云计算的底层基座是什么呢?就是我们现在说的Linux操作系统。而云计算就是跑在Linux操作系统上的一个…

商越科技:渗透测试保障平台安全,推动线上采购高效运转

商越科技是数字化采购解决方案提供商,在同赛道企业中始终保持前列。商越科技通过自主研发的智能采购中台、SaaS应用及运营服务等为企业搭建专属的互联网采购平台,帮助企业实现采购数字化以及智能化转型,提高工作效率、降低采购成本。 打造数字…