一. 索引的相关知识
1. 索引的概念
- 是一个排序的列表,存储着索引值和这个值所对应的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度
- 是表中一列或者若干列值排序的方法
- 需要额外的磁盘空间
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容
- 建立索引的目的是加快对表中记录的查找或排序
2. 索引的作用和副作用
2.1 作用
- 数据库利用各种快速定位技术,能够大大加快查询速率,这是创建索引的最主要的原因
- 当表很大或查询涉及到多个表时,可以成干上万倍地提高查询速度
- 可以降低数据库的IO成本,并且还可以降低数据库的排序成本
- 通过创建唯一性索引保证数据表数据的唯一性
- 可以加快表与表之间的连接
- 在使用分组和排序时,可大大减少分组和排序时间
2.2 副作用
- 索引需要占用额外的磁盘空间。
- 对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。而InnoDB引擎的表数据文件本身就是索引文件。当表很大或查询涉及到多个表时,可以成干上万倍地提高查询速度
- 在插入和修改数据时要花费更多的时间,因为索引也要随之变动
2.3 知识拓展
MySQL 数据库的数据文件存放在/usr/local/mysql/data目录下,每个数据库对应一个子目录,用于存储数据表文件。每个数据表对应为三个文件,扩展名分别为“.frm”、“.MYD”和“.MYI”。
".MYD"文件是MyISAM存储引擎专用,存放MyISAM表的数据。每一个MyISAM表都会有一个“.MYD”文件与之对应,同样存放于所属数据库的文件夹下,和“.frm”文件在一起。
“.MYI”文件也是专属于 MyISAM 存储引擎的,主要存放 MyISAM 表的索引相关信息。对于 MyISAM 存储来说,可以被 cache 的内容主要就是来源于“.MYI”文件中。每一个MyISAM 表对应一个“.MYI”文件,存放于位置和“.frm”以及“.MYD”一样。
MyISAM 存储引擎的表在数据库中,每一个表都被存放为三个以表名命名的物理文件
(frm,myd,myi)。 每个表都有且仅有这样三个文件做为 MyISAM 存储类型的表的存储,也就是说不管这个表有多少个索引,都是存放在同一个.MYI 文件中。
另外还有“.ibd”和 ibdata 文件,这两种文件都是用来存放 Innodb 数据的,之所以有两种文件来存放 Innodb 的数据(包括索引),是因为 Innodb 的数据存储方式能够通过配置来决定是使用共享表空间存放存储数据,还是独享表空间存放存储数据。独享表空间存储 方式使用“.ibd”文件来存放数据,且每个表一个“.ibd”文件,文件存放在和 MyISAM 数据相同的位置。如果选用共享存储表空间来存放数据,则会使用 ibdata 文件来存放,所有表共同使用一个(或者多个,可自行配置)ibdata 文件。
3. 创建索引的原则依据
- 表的主键、外键必须有索引
- 记录数超过 300 行的表应该有索引
- 经常与其他表进行连接的表,在连接字段上应该建立
- 经常出现在where子句中的字段,特别是大表的字段应该建立索引
- 索引应该建在选择性高的字段上
- 索引唯一性太差的字段,不适合建立索引
- 更新太频繁地字段,不适合创建索引
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引
4. 数据结构上索引的分类
在数据结构的角度上,索引的分类并不统一,但从数据库管理系统(DBMS)的实现来看,我们可以归纳如下几种常见索引的数据结构:
B树(B-Tree)和B+树(B+Tree):
- B树是一种自平衡的树数据结构,适合范围查询和点查询,广泛应用于磁盘上的文件系统以及数据库系统中。每个节点不仅存储键值,还存储对应的数据或者指向数据的指针。
- B+树是B树的一个变体,叶子节点包含了所有的键值和对应的数据,非叶子节点仅存储键值,不保存数据。B+树更适合数据库索引,因为它在叶子节点之间形成了连续的链表,方便进行范围查询,并且索引本身只存储键值,减少了索引大小,提高内存利用率。
哈希索引(Hash Index):
哈希索引基于哈希表实现,能够实现O(1)的平均时间复杂度查找。哈希索引主要用于支持等值查询,但在不支持范围查询和排序操作时效率很高。
有序数组(Static Sorted Array):
对于静态且数据量较小的情况,有序数组可以作为高效的索引结构。但由于其插入和删除操作复杂度较高,一般不直接用于动态数据库场景。
LSM树(Log-Structured Merge Tree):
LSM 树是一种为了提高写入性能而设计的数据结构,广泛应用在很多NoSQL数据库系统中,比如LevelDB、RocksDB等。它通过批量合并和延迟排序的方式平衡读写性能。
Bitmap索引(BitMap Index):
位图索引适用于低基数(少量不同值)且频繁进行多值查询的场景。每个索引项对应一个bit位,通过位运算快速确定哪些记录满足查询条件。
R树(R-Tree)和R+树(R+Tree):
R树及其变种主要用于多维空间数据索引,如地理信息系统(GIS)中的空间查询。
全文索引(Full-text Index):
全文索引是对文本数据进行词语级别的索引,允许用户进行关键词的模糊查询和短语匹配。这类索引通常基于词典树(Trie)、倒排索引(Inverted Index)等结构实现。
组合索引(Composite/Index Covering):
组合索引不是特指某种数据结构,而是指在多个列上创建的索引,其内部可能结合了上述多种数据结构的特点。
5. 逻辑划分中索引的分类
从逻辑划分来看,索引的运用主要有五种,分别为:普通索引,唯一索引,主键索引,组合索引和全文索引(模糊索引)
- 普通索引(Basic Index):没有特殊限制,单纯为了加速查询速度。
- 唯一索引(Unique Index):索引的键值必须唯一,除了加速查询外还能保证数据的唯一性。
- 主键索引(Primary Key Index):特殊的唯一索引,每个表只能有一个,不允许为空,并决定了聚集索引的顺序。
- 组合索引(单列索引与多列索引)
- 全文索引(Full-text Index):针对文本列的特殊索引,用于对文本内容进行全文搜索。
二. 创建索引
创建测试用表,并导入数据。
2.1 普通索引的创建
最基本的索引类型,没有唯一性之类的限制。
2.1.1 直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项。如果忽略 length 的值,则使用整个列的值作为索引。如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。
#索引名建议以“_index”结尾。
2.1.2 修改表方式创建
ALTER TABLE 表名 ADD INDEX 索引名 (列名);
2.1.3 创建表的时候指定索引
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
2.2 唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。
唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
2.2.1 直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
2.2.2 修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
2.2.3 创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
2.3 主键索引
是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。
一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
2.3.1 创建表的时候指定
CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
2.3.2 修改表方式创建
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
2.4 组合索引
可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为 select 语句的 where条件是依次从左往右执行的,所以在使用 select 语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
判断组合索引是否生效?
对以上的表进行select
select name,id from pj04;
#会触发组合索引
而:
select id,name from pj04;
#按照索引从左到右检索的顺序,则不会触发组合索引
2.5 全文索引
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在 MySQL5.6 版本以前 FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
2.5.1 直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
2.5.2 修改表方式创建
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
2.5.3 创建表的时候指定索引
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
##数据类型可以为 CHAR、VARCHAR 或者 TEXT
2.5.4 使用全文索引查询
select * from 表名 where 列名='查询内容';
SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
三. 查看索引和删除索引
1. 查看索引
show create table 表名;
show index from 表名;
show index from 表名\G; 竖向显示表索引信息
show keys from 表名;
show keys from 表名\G;
mysql> mysql> show index from test1;
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| test1 | 0 | name_index | 1 | name | A | 8 | NULL | NULL | | BTREE | | |
| test1 | 0 | cardid_index | 1 | cardid | A | 8 | NULL | NULL | YES | BTREE | | |
| test1 | 1 | phone_index | 1 | phone | A | 8 | NULL | NULL | YES | BTREE | | |
| test1 | 1 | address_index | 1 | address | A | 5 | NULL | NULL | YES | BTREE | | |
| test1 | 1 | remark_index | 1 | remark | NULL | 8 | NULL | NULL | YES | FULLTEXT | | |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
5 rows in set (0.00 sec)
mysql> show keys from test1;
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| test1 | 0 | name_index | 1 | name | A | 8 | NULL | NULL | | BTREE | | |
| test1 | 0 | cardid_index | 1 | cardid | A | 8 | NULL | NULL | YES | BTREE | | |
| test1 | 1 | phone_index | 1 | phone | A | 8 | NULL | NULL | YES | BTREE | | |
| test1 | 1 | address_index | 1 | address | A | 5 | NULL | NULL | YES | BTREE | | |
| test1 | 1 | remark_index | 1 | remark | NULL | 8 | NULL | NULL | YES | FULLTEXT | | |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
5 rows in set (0.00 sec)
各字段含义:
Table | 表的名称 |
Non_unique | 如果索引内容唯一,则为 0;如果可以不唯一,则为 1 |
Key_name | 索引的名称 |
Seq_in_index | 索引中的列序号,从 1 开始 |
Column_name | 列名称 |
Collation | 列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类) |
Cardinality | 索引中唯一值数目的估计值 |
Sub_part | 如果列只是被部分地编入索引,则为被编入索引的字符的数目(zhangsan)。如果整列被编入索引,则为 NULL |
Packed | 指示关键字如何被压缩。如果没有被压缩,则为 NULL |
Null | 如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO |
Index_type | 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE) |
Comment | 备注 |
2. 删除索引
2.1 直接删除索引
DROP INDEX 索引名 ON 表名;
2.2 修改表方式删除索引
ALTER TABLE 表名 DROP INDEX 索引名;
2.3 删除主键索引
ALTER TABLE 表名 DROP PRIMARY KEY;
总结:
① 普通索引 :针对所有字段,没有特殊的需求/规则
② 唯一索引 : 针对唯一性的字段,仅允许出现一次空值
③ 组合索引 (多列/多字段组合形式的索引)
④ 全文索引(varchar char text)MySQL为了优化对文本内容搜索的一种机制
⑤ 主键索引 :针对唯一性字段、且不可为空,同时一张表只允许包含一个主键索引
创建索引:
① 在创建表的时候,直接指定 index
② alter修改表结构的时候,进行add 添加index
③ 直接创建索引 index
PS:主键索引——》直接创建主键即可