目录
概述
概念:
单列索引
普通索引
创建索引
查看索引
删除索引
唯一索引
创建唯一索引
删除唯一索引
主键索引
组合索引
创建索引
全文索引
概述
使用全文索引
空间索引
内部原理
相关算法:
hash算法
二叉树算法
平衡二叉树
⭐Btree树算法
MylSAM引擎使用B+Tree
InnoDB引擎使用B+Tree
特点总结
优点
缺点
使用原则
概述
概念:
- 索引是通过某种算法,构建出一个数据模型,用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。
- 索引类似一本书的目录,比如要查找'student'这个单词,可以先找到s开头的页然后向后查找,这个就类似索引。
- 按照实现方式可以分为hash索引、B+tree索引
单列索引
单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引;
普通索引
普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。
创建索引
-- 方式1 创建表的时候直接指定
create table student(
sid int primary key,
card_id varchar(20),
name varchar (20),
gender varchar (20),
age int,
birth date,
phone_num varchar(20),
score double,
index index_name(name) -- 给name列创建索引
)
-- 方式2 直接创建
create index index_gender on student(gender);
-- 方式3 修改表结构(添加索引)
alter table student add index index_age(age);
查看索引
-- 1、查看数据库所有索引
-- select * from mysql.innodb_index_stats a where a.database_name = '数据库名'
select * from mysql.innodb_index_stats a where a.database_name = 'mydb2';
-- 2、查看表中所有索引
-- select * from mysql.innodb_index_stats a where a.database_name = '数据库名' and a.table_name like '%表名%';
select * from mysql.innodb_index_stats a where a.database_name = 'mydb2' and a.table_name like '%student%';
-- 3、查看表中所有索引
-- show index from 表名
show index from student;
删除索引
-- 删除索引
drop index index_name on student;
alter table student drop index index_gender;
唯一索引
- 唯一索引与前面的普通索引类似,不同的就是:
- 索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。它有以下几种创建方式:
创建唯一索引
删除唯一索引
主键索引
- 每张表一般都会有自己的主键,当我们在创建表时,MySQL会自动在主键列上建立一个索引,这就是主键索引。主键是具有唯一性并且不允许为NULL,所以他是一种特殊的唯一索引。
组合索引
- 组合索引也叫复合索引,指的是我们在建立索引的时候使用多个字段,例如同时使用身份证和手机号建立索引,同样的可以建立为普通索引或者是唯一索引。
- 复合索引的使用复合最左原则。
创建索引
-- 组合索引
create index index_phone_name on student(phone_num,name);
-- 删除索引
drop index index_phone_name on student;
全文索引
概述
- 全文索引的关键字是fulltext
- 全文索引主要用来查找文本中的关键字,而不是直接与索引中的值相比较,它更像是一个搜索引擎,基于相似度的查询,而不是简单的where语句的参数匹配。
- 用like +%就可以实现模糊匹配了,为什么还要全文索引? like +%在文本比较少时是合适的,但是对于大量的文本数据检索,是不可想象的。全文索引在大量的数据面前,能比 like +%快N倍,速度不是一个数量级,但是全文索引可能存在精度问题。
- 只有字段的数据类型为char、varchar、text及其系列才可以建全文索引;
- 在数据量较大时候,现将数据放入一个没有全局索引的表中,然后再用create index创建fultext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多
- 测试或使用全文索引时,要先看一下自己的MysQL版本、存储引擎和数据类型是否支持全文索引。
- MySQL中的全文索引,有两个变量,最小搜索长度和最大搜索长度,对于长度小于最小搜索长度和大于最大搜索长度的词语,都不会被索引。通俗点就是说,想对一个词语使用全文索引搜索,那么这个词语的长度必须在以上两个变量的区间内。这两个的默认值可以使用以下命令查看: show variables like '%ft%'
使用全文索引
create table t_article(
id int primary key auto_increment,
title varchar(255),
content varchar(1000),
writing_data date
-- fulltext(content) 可以在这里创建全文索引,但是效率比较低
)
insert into t_article values(null, "Yesterday Once NMore","when 1 was young 1 listen to the radi " , '2021-10-01');
insert into t_article values(null, "Right Here waiting" ,'oceans apart,day after day,and I slowly go insane',' 2021-10-02' );
insert into t_article values(null, "ly Heart will Go on", " every night in my dreams,i see you, i feel you",' 2021-10-03');
insert into t_article values(null, 'Everything I Do',' eLook into my eyes , vou will see what you mean to me' , '2021-10-04')
insert into t_article values(null, "called To Say I Love you","say love you no new yean 's day,to celebrate" ,'2021-10-05');
insert into t_article values(null, "Nothing s Gonna Change Ny Love For You","if i had to live my life without you nearme"," 2021-10-06");
insert into t_article values(null, "Everybody", "we 're gonna bring the flavor show U how." , '221-10-07');
-- 修改表结构
alter table t_article add fulltext index_content(content);
-- 添加全文索引
create fulltext index index_content on t_article(content);
-- 使用全文索引
select * from t_article where match(content) against('you') -- 有结果
select * from t_article where match(content) against('yo') -- 没结果
select * from t_article where content like '%you%';
空间索引
- MySQL在5.7之后的版本支持了空间索引,而且支持OpenGIs几何数据模型
- 空间索引是对空间数据类型的字段建立的索引,MYSQL中的空间数据类型有4种,分别是GEOMETRY、POINT、LINESTRING、POLYGON。
- MYSQL使用SPATIAL关键字进行扩展,使得能够用于创建正规索引类型的语法创建空间索引。创建空间索引的列,必须将其声明为NOT NULL。
- 空间索引一般是用的比较少,了解即可。
内部原理
- 一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上这样的话,索引查找过程中就要产生磁盘I/O消耗,相对于内存存取,I/O存取的消耗要高几个数量级,所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘I/O操作次数的渐进复杂度。
- 换句话说,索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数。
相关算法:
hash算法
二叉树算法
平衡二叉树
⭐Btree树算法
MylSAM引擎使用B+Tree
InnoDB引擎使用B+Tree
特点总结
优点
- ·大大加快数据的查询速度
- ·使用分组和排序进行数据查询时,可以显著减少查询时分组和排序的时间·创建唯一索引,能够保证数据库表中每一行数据的唯一性
- ·在实现数据的参考完整性方面,可以加速表和表之间的连接
缺点
- ·创建索引和维护索引需要消耗时间,并且随着数据量的增加,时间也会增加
- ·索引需要占据磁盘空间
- ·对数据表中的数据进行增加,修改,删除时,索引也要动态的维护,降低了维护的速度
使用原则
- 更新频繁的列不应设置索引
- 数据量小的表不要使用索引(毕竟总共2页的文档,还要目录吗? )
- 重复数据多的字段不应设为索引(比如性别.只右里和女,一般来说:重复的数据超过百分之15就不该建索引)
- 首先应该考虑对 where 和 order by 涉及的列上建立索引