MySQL数据库 - 索引

一. 索引的相关知识

1. 索引的概念

  • 是一个排序的列表,存储着索引值和这个值所对应的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)
  • 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度
  • 是表中一列或者若干列值排序的方法
  • 需要额外的磁盘空间
  • 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容
  • 建立索引的目的是加快对表中记录的查找或排序

2. 索引的作用和副作用

2.1 作用

  • 数据库利用各种快速定位技术,能够大大加快查询速率,这是创建索引的最主要的原因
  • 当表很大或查询涉及到多个表时,可以成干上万倍地提高查询速度
  • 可以降低数据库的IO成本,并且还可以降低数据库的排序成本
  • 通过创建唯一性索引保证数据表数据的唯一性
  • 可以加快表与表之间的连接
  • 在使用分组和排序时,可大大减少分组和排序时间

2.2 副作用

  • 索引需要占用额外的磁盘空间。
    •  对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。而InnoDB引擎的表数据文件本身就是索引文件。当表很大或查询涉及到多个表时,可以成干上万倍地提高查询速度
  • 在插入和修改数据时要花费更多的时间,因为索引也要随之变动

2.3 知识拓展

MySQL 数据库的数据文件存放在/usr/local/mysql/data目录下,每个数据库对应一个子目录,用于存储数据表文件。每个数据表对应为三个文件,扩展名分别为“.frm”、“.MYD”和“.MYI”。

".MYD"文件是MyISAM存储引擎专用,存放MyISAM表的数据。每一个MyISAM表都会有一个“.MYD”文件与之对应,同样存放于所属数据库的文件夹下,和“.frm”文件在一起。

“.MYI”文件也是专属于 MyISAM 存储引擎的,主要存放 MyISAM 表的索引相关信息。对于 MyISAM 存储来说,可以被 cache 的内容主要就是来源于“.MYI”文件中。每一个MyISAM 表对应一个“.MYI”文件,存放于位置和“.frm”以及“.MYD”一样。

MyISAM 存储引擎的表在数据库中,每一个表都被存放为三个以表名命名的物理文件
(frm,myd,myi)。 每个表都有且仅有这样三个文件做为 MyISAM 存储类型的表的存储,也就是说不管这个表有多少个索引,都是存放在同一个.MYI 文件中。

另外还有“.ibd”和 ibdata 文件,这两种文件都是用来存放 Innodb 数据的,之所以有两种文件来存放 Innodb 的数据(包括索引),是因为 Innodb 的数据存储方式能够通过配置来决定是使用共享表空间存放存储数据,还是独享表空间存放存储数据。独享表空间存储 方式使用“.ibd”文件来存放数据,且每个表一个“.ibd”文件,文件存放在和 MyISAM 数据相同的位置。如果选用共享存储表空间来存放数据,则会使用 ibdata  文件来存放,所有表共同使用一个(或者多个,可自行配置)ibdata 文件。

3. 创建索引的原则依据

  • 表的主键、外键必须有索引
  • 记录数超过 300 行的表应该有索引
  • 经常与其他表进行连接的表,在连接字段上应该建立
  • 经常出现在where子句中的字段,特别是大表的字段应该建立索引
  • 索引应该建在选择性高的字段上
  • 索引唯一性太差的字段,不适合建立索引
  • 更新太频繁地字段,不适合创建索引
  • 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引

4. 数据结构上索引的分类

在数据结构的角度上,索引的分类并不统一,但从数据库管理系统(DBMS)的实现来看,我们可以归纳如下几种常见索引的数据结构:

B树(B-Tree)和B+树(B+Tree)

  • B树是一种自平衡的树数据结构,适合范围查询和点查询,广泛应用于磁盘上的文件系统以及数据库系统中。每个节点不仅存储键值,还存储对应的数据或者指向数据的指针。
  • B+树是B树的一个变体,叶子节点包含了所有的键值和对应的数据,非叶子节点仅存储键值,不保存数据。B+树更适合数据库索引,因为它在叶子节点之间形成了连续的链表,方便进行范围查询,并且索引本身只存储键值,减少了索引大小,提高内存利用率。

哈希索引(Hash Index)

哈希索引基于哈希表实现,能够实现O(1)的平均时间复杂度查找。哈希索引主要用于支持等值查询,但在不支持范围查询和排序操作时效率很高。

有序数组(Static Sorted Array)

对于静态且数据量较小的情况,有序数组可以作为高效的索引结构。但由于其插入和删除操作复杂度较高,一般不直接用于动态数据库场景。

LSM树(Log-Structured Merge Tree)

LSM 树是一种为了提高写入性能而设计的数据结构,广泛应用在很多NoSQL数据库系统中,比如LevelDB、RocksDB等。它通过批量合并和延迟排序的方式平衡读写性能。

Bitmap索引(BitMap Index)

位图索引适用于低基数(少量不同值)且频繁进行多值查询的场景。每个索引项对应一个bit位,通过位运算快速确定哪些记录满足查询条件。

R树(R-Tree)和R+树(R+Tree)

R树及其变种主要用于多维空间数据索引,如地理信息系统(GIS)中的空间查询。

全文索引(Full-text Index)

全文索引是对文本数据进行词语级别的索引,允许用户进行关键词的模糊查询和短语匹配。这类索引通常基于词典树(Trie)、倒排索引(Inverted Index)等结构实现。

组合索引(Composite/Index Covering)

组合索引不是特指某种数据结构,而是指在多个列上创建的索引,其内部可能结合了上述多种数据结构的特点。

5. 逻辑划分中索引的分类

从逻辑划分来看,索引的运用主要有五种,分别为:普通索引,唯一索引,主键索引,组合索引和全文索引(模糊索引) 

  • 普通索引(Basic Index):没有特殊限制,单纯为了加速查询速度。
  • 唯一索引(Unique Index):索引的键值必须唯一,除了加速查询外还能保证数据的唯一性。
  • 主键索引(Primary Key Index):特殊的唯一索引,每个表只能有一个,不允许为空,并决定了聚集索引的顺序。
  • 组合索引(单列索引与多列索引)
  • 全文索引(Full-text Index):针对文本列的特殊索引,用于对文本内容进行全文搜索。

二. 创建索引

创建测试用表,并导入数据。

2.1 普通索引的创建

最基本的索引类型,没有唯一性之类的限制。

2.1.1 直接创建索引

CREATE INDEX 索引名 ON 表名 (列名[(length)]);

#(列名(length)):length是可选项。如果忽略 length 的值,则使用整个列的值作为索引。如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。

#索引名建议以“_index”结尾。

2.1.2 修改表方式创建

ALTER TABLE 表名 ADD INDEX 索引名 (列名);

2.1.3 创建表的时候指定索引

CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));

2.2 唯一索引

与普通索引类似,但区别是唯一索引列的每个值都唯一。
唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。

2.2.1 直接创建唯一索引

CREATE UNIQUE INDEX 索引名 ON 表名(列名);

2.2.2 修改表方式创建

ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);

2.2.3 创建表的时候指定

CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));

2.3 主键索引

是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。
一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。

2.3.1 创建表的时候指定

CREATE TABLE 表名 ([...],PRIMARY KEY (列名));

2.3.2 修改表方式创建

ALTER TABLE 表名 ADD PRIMARY KEY (列名); 

2.4 组合索引

可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为 select 语句的 where条件是依次从左往右执行的,所以在使用 select 语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。

CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));

判断组合索引是否生效?

对以上的表进行select 
select name,id from pj04;			
#会触发组合索引

而:
select id,name from pj04;			
#按照索引从左到右检索的顺序,则不会触发组合索引

2.5 全文索引

适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在 MySQL5.6 版本以前 FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。

2.5.1 直接创建索引

CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);

2.5.2 修改表方式创建

ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);

2.5.3 创建表的时候指定索引

CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));

##数据类型可以为 CHAR、VARCHAR 或者 TEXT

2.5.4 使用全文索引查询

select * from 表名  where 列名='查询内容';

SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');

三. 查看索引和删除索引

1. 查看索引

show create table  表名;


show index from 表名;
show index from 表名\G; 竖向显示表索引信息


show keys from 表名;
show keys from 表名\G;


mysql> mysql> show index from test1;
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name      | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| test1 |          0 | name_index    |            1 | name        | A         |           8 |     NULL | NULL   |      | BTREE      |         |               |
| test1 |          0 | cardid_index  |            1 | cardid      | A         |           8 |     NULL | NULL   | YES  | BTREE      |         |               |
| test1 |          1 | phone_index   |            1 | phone       | A         |           8 |     NULL | NULL   | YES  | BTREE      |         |               |
| test1 |          1 | address_index |            1 | address     | A         |           5 |     NULL | NULL   | YES  | BTREE      |         |               |
| test1 |          1 | remark_index  |            1 | remark      | NULL      |           8 |     NULL | NULL   | YES  | FULLTEXT   |         |               |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
5 rows in set (0.00 sec)

mysql> show keys from test1;
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name      | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| test1 |          0 | name_index    |            1 | name        | A         |           8 |     NULL | NULL   |      | BTREE      |         |               |
| test1 |          0 | cardid_index  |            1 | cardid      | A         |           8 |     NULL | NULL   | YES  | BTREE      |         |               |
| test1 |          1 | phone_index   |            1 | phone       | A         |           8 |     NULL | NULL   | YES  | BTREE      |         |               |
| test1 |          1 | address_index |            1 | address     | A         |           5 |     NULL | NULL   | YES  | BTREE      |         |               |
| test1 |          1 | remark_index  |            1 | remark      | NULL      |           8 |     NULL | NULL   | YES  | FULLTEXT   |         |               |
+-------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
5 rows in set (0.00 sec)

各字段含义:

Table表的名称
Non_unique如果索引内容唯一,则为 0;如果可以不唯一,则为 1
Key_name索引的名称
Seq_in_index索引中的列序号,从 1 开始
Column_name列名称
Collation列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)
Cardinality索引中唯一值数目的估计值
Sub_part如果列只是被部分地编入索引,则为被编入索引的字符的数目(zhangsan)。如果整列被编入索引,则为 NULL 
Packed指示关键字如何被压缩。如果没有被压缩,则为 NULL
Null如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO
Index_type用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)
Comment备注

2. 删除索引

2.1 直接删除索引

DROP INDEX 索引名 ON 表名;

2.2 修改表方式删除索引

ALTER TABLE 表名 DROP INDEX 索引名;

2.3 删除主键索引

ALTER TABLE 表名 DROP PRIMARY KEY;

总结:

① 普通索引 :针对所有字段,没有特殊的需求/规则
② 唯一索引 : 针对唯一性的字段,仅允许出现一次空值
③ 组合索引 (多列/多字段组合形式的索引)
④ 全文索引(varchar char text)MySQL为了优化对文本内容搜索的一种机制
⑤ 主键索引 :针对唯一性字段、且不可为空,同时一张表只允许包含一个主键索引

创建索引:
① 在创建表的时候,直接指定 index
② alter修改表结构的时候,进行add 添加index
③ 直接创建索引 index
PS:主键索引——》直接创建主键即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/475340.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

NodeJS 集群模块: 为App创建集群实例

NodeJS 集群模块: 为App创建集群实例 目录 NodeJS 集群模块: 为App创建集群实例Node.js 集群介绍:终极扩展策略使用集群模块开始扩展 Node.js扩展 Node.js 的两种集群策略使用集群受益的 Node.js 应用程序示例没有集群的 Node.js:不可伸缩的原则集群操作:一个扩展的 Node.js…

全新体验|德克萨斯州奥斯汀市登陆 The Sandbox

以前所未有的方式探索德克萨斯州奥斯汀——The Sandbox迎来虚拟旅游,新体验由Smobler工作室打造。 我们的使命是为虚拟旅游创造新机遇,让每个人都能更方便地游览城市和国家。我们非常兴奋地宣布:Cobbleland:Austin,这款…

1.C#对接微信Native支付(准备工作)

近期有需求需要在PC网站接入微信支付,遂了解了一下相关文档。https://pay.weixin.qq.com/static/applyment_guide/applyment_index.shtml 官网文档种有多种支付对接方式比如:jsapi、native、app支付、小程序支付等。大家可自行了解,根据自身…

电子合同和纸质合同有同等法律效力吗?

根据《中华人民共和国民法典》的规定,电子合同是合同的一种形式,只要依法成立,就具有法律效力,和纸质合同具有同样的法律效力。同时,法律也认可了以电子数据交换、电子邮件等方式能够有形地表现所载内容,并…

深度解析:普通人运用ChatGPT10大经典场景,你用过几种?(内含使用教程)

本内容来源---布博士(擎创产品专家)公众号 很长时间没有更新ChatGPT相关内容了,最近一段时间一直在通过各种渠道了解大型语言模型,重点关注其在各个应用领域的使用情况,以此来了解其应用的边界。 在近两个月的学习过…

Emotion Prompt-LLM能够理解并能通过情感刺激得以增强

Large Language Models Understand and Can be Enhanced by Emotional Stimuli 情感智能对我们的日常行为和互动产生了显著的影响。尽管大型语言模型(LLMs)被视为向人工通用智能迈进的一大步,在许多任务中表现出色,但目前尚不清楚…

xercesc库中文保存XML功能实现

目录 一 参考链接 二 运行结果 三 代码 一 参考链接 DOM Programming Guide (apache.org) Xerces-c DOM XML文件的构造_xerces-c domimplementation-CSDN博客 Xerces-c库的使用-CSDN博客 二 运行结果 三 代码 #include "XercesC_Test.h"#if 1//参考链接&…

基于爬虫对山西省人口采集+机器学习的可视化平台

文章目录 数据来源一、研究背景与意义二、研究目标三、研究内容与方法四、预期成果五、代码讲解六、全文总结 数据来源 1.所有原数据均来自:国家统计局-政府的数据网站 2.涉及到的一些预测数据是根据现有数据进行预测而来。 本文从数据来源,研究意义&am…

ideaSSM博物馆网站系统VS开发mysql数据库web结构java编程计算机网页源码maven项目

一、源码特点 idea 开发 SSM 博物馆网站系统是一套完善的信息管理系统,结合SSM框架和bootstrap完成本系统,对理解JSP java编程开发语言有帮助系统采用SSM框架(MVC模式开发),系统具有完整的源代码和数据库&#xff0c…

基于单片机的实时水质监测系统设计

摘要:传统的水质监测存在人工成本高,取样时间长等诸多问题。为了解决这些问题,本文设计了一款基于单片机的实时水质监测系统,通过传感器采集到的数据,单片机通过zigbee 収送至云端,结合上位机软件可以实现实时的信息采集处理,实现了高敁、智能的水质监测工作。 兲键词:…

JavaMySQL高级一(下)

目录 1.常用函数 1.字符串函数 2.时间日期函数 3.聚合函数 4.数学函数 2.分布查询 3.子查询基础 1.简单子查询 1.常用函数 在程序开发过程中,除了简单的数据查询,还有基于已数据进行数据的统计分析计算等需求。因此,在SQL中将一…

【原创】三十分钟实时数据可视化网站前后端教程 Scrapy + Django + React 保姆级教程向

这个本来是想做视频的,所以是以讲稿的形式写的。最后没做视频,但是觉得这篇文还是值得记录一下。真的要多记录,不然一些不常用的东西即使做过几个月又有点陌生了。 文章目录 爬虫 SCRAPYxpath 后端 DJANGO前端 REACT Hello大家好这里是小鱼&a…

企业用大模型如何更具「效价比」?百度智能云发布5款大模型新品

服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%...从一年前国内大模型平台的“开路先锋”到如今的大模型“超级工厂”,百度智能…

【MySQL | 第五篇】MySQL事务总结

文章目录 5.MySQL事务5.1什么是事务?5.2什么是数据库事务?5.3数据库事务四大特性5.4并发事务带来的问题及解决方案?5.4.1脏读/不可重复读/幻读5.4.2不可重复读和幻读有什么区别?5.4.3解决并发事务带来的问题(1&#xf…

雷池 WAF 社区版:下一代 Web 应用防火墙的革新

黑客的挑战 智能语义分析算法: 黑客们常利用复杂技术进行攻击,但雷池社区版的智能语义分析算法能深入解析攻击本质,即使是最复杂的攻击手法也难以逃脱。 0day攻击防御: 传统防火墙难以防御未知攻击,但雷池社区版能有效…

南方某电网公司如何通过代码审计保障能源数字化转型?

​南方某电网公司供电营业区覆盖十几个州市,是所在省域电网运营和交易的主体,也是承担对外供电和培育电力支柱产业的重要企业。近年来该电网公司在数字化转型方面深耕细作,紧跟工业互联网的时代浪潮,打造设备智慧运维数字化场景&a…

tinyrenderer-三角形光栅化和背面剔除

画空心三角形 根据之前的画线算法,可以很简单画出一个空心三角形,对三角形三个顶点,按顺序分别首尾画连线就可以 void triangle(Vec2i t0, Vec2i t1, Vec2i t2, TGAImage &image, TGAColor color) { line(t0, t1, image, color); line(…

Python 批量读取文件夹中图像

两种方法 一、用PIL库 import os from PIL import Imagedef read_images(folder_path):images []for filename in os.listdir(folder_path):if filename.endswith((.png, .jpg, .jpeg, .bmp, .tif, .tiff)):img_path os.path.join(folder_path, filename)image Image.open…

MES管理系统在生产计划与排产调度流程中的应用

在现代工业生产中,MES管理系统已经成为企业优化生产流程、提升生产效率的重要工具。MES管理系统在生产计划与排产调度中的具体应用,不仅能够帮助企业更好地控制生产过程,还能实现资源的合理配置,从而提高企业的整体竞争力。 首先&…

简单几点让你清楚VR全景制作方式,快来免费学习!

VR全景展示作为当下一种新型的宣传方式,能够有效解决商家企业的展示、宣传推广成本高的问题,也成为了实体门店获客引流的全新方式,助力行业实现低成本、高效率的宣传推广。 而从实际全景成品效果来看,不仅没有“美颜嫌疑”&#x…