一.什么是索引?
索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引
二.无索引的情况
找到了还会继续往下面找。
三.索引概述
1.优
(1)提高数据检索的效率,降低数据库的IO成本
(2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
2.缺
(1)索引也是要占用空间的。
(2)索引大大提高了查询效率,同时却也降低更新表的速度,如果对表进行INSERT,UPDATE,DELETE时,效率降低。
四.索引结构
(1)B+Tree索引
最常见的索引类型,大部分引擎都支持B+树索引
(2)Hash索引
底层结构是用哈希表实现的,只能精确匹配索引列的查询才有效,不支持范围查询。
(3)R-Tree(空间索引)
空间索引是MyiSAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少
(4)Full-text(全文索引)
是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucence,Solr,ES。
默认情况下使用B+tree索引。
五.二叉树
二叉树缺点:顺序插入时,会形成一个链表,查询性能大大降低。大数据量情况下,层级较深,检索速度慢。
红黑树:大数据量情况下,层级较深,检索速度慢。
六.B-Tree(多路平衡查找树)
以一颗最大度数(max-degree)为5(5阶)的b-tree为例(每个节点最多存储4个key,5个指针):
(2)B树构建案例
插入100 65 169 368 900 556 780 35 215 1200 234 888 158 90 1000 88 120 268 2580数据为例
七.B+Tree
以一颗最大度数(max-degree)为4(4阶)的b+tree为例:
所有的元素都会出现在叶子节点
所有的节点形成了一个单向链表
八.Hash索引结构
哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。
九.Hash索引特点
1.Hash索引只能用于对等比较(=,in),不支持范围查询(between,>,<,...)
2.无法利用索引完成排序操作
3.查询效率高,通常只需要一次检索就可以了,效率要高于B+tree索引
十.为什么InnoDB存储引擎选择使用B+tree索引结构?
相对于二叉树,层级更少,搜索效率高;
对于B-tree,无论是叶子节点还是非叶子节点,都会保存数据,这样导致一页中存储的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低;
相对Hash索引,B+tree支持范围匹配及排序操作;