MySQL索引及优化

MySQL索引及优化

    • 一、MySQL索引
      • 1、什么是索引?
      • 2、了解过索引的数据结构吗?B树和B+树的区别?(底层原理)
      • 3、什么是聚簇索引(聚集索引)?什么是非聚簇索引(二级索引)?什么是回表?
      • 4、什么是覆盖索引?MySQL超大分页处理?
      • 5、MySQL有哪些索引?
      • 6、索引设计的原则?
      • 7、什么情况下索引会失效?
    • 二、MySQL优化
      • 1、如何定位慢查询?
      • 2、SQL语句执行很慢如何优化?
      • 3、MySQL优化经验有哪些?
      • 4、MySQL的主从同步原理
      • 5、分库分表

一、MySQL索引

1、什么是索引?

  • 索引是帮助MySQL高效获取 有序 数据的数据结构,主要是用于提高数据的检索效率,降低数据库的IO成本(不需要全表扫描)。通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。
    在这里插入图片描述

2、了解过索引的数据结构吗?B树和B+树的区别?(底层原理)

  • MySQL的InnoDB存储引擎采用的是B+树的数据结构来存储索引,因其相对于B-树等数据结构来说,阶数更多,路径更短,并且磁盘读写代价B+树更低;非叶子节点只存储指针,叶子节点存储数据;B+树便于扫库和区间查询,叶子节点是一个双向链表。
  • B树是一种多叉路平衡查找树,相对于二叉树,B树每个节点可以有多个分支,即多支。B+树是在B树基础上的一种优化,在B树中,非叶子节点和叶子节点都会存储数据,而B+树的所有数据都存储在叶子节点,B+树查找效率更加稳定。在将进行范围查询时,B+树效率更高,因为B+树的数据都存储在叶子节点上,并且叶子节点是一个双向链表。
    在这里插入图片描述

3、什么是聚簇索引(聚集索引)?什么是非聚簇索引(二级索引)?什么是回表?

  • 聚簇索引(聚集索引):聚簇索引主要是指数据和索引放到一块,B+树的叶子节点保存了整行数据,聚簇索引有且只有一个。
  • 非聚簇索引(二级索引):非聚簇索引是指将数据和索引分开存储,B+树的叶子节点保存对应的主键,非聚簇索引可以有多个,一般自己定义的索引都是非聚簇索引。
  • 回表查询:通过二级索引找到对应的主键值,然后再通过主键值到聚簇索引中查找整行数据,这个过程就是回表。

在这里插入图片描述

4、什么是覆盖索引?MySQL超大分页处理?

  • 覆盖索引:覆盖索引是指查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到。
    使用id查询,直接走聚簇索引查询,一次索引扫描,直接返回数据,性能高
    如果返回的列中没有创建索引,有可能会触发回表查询,所以尽量避免使用select*
// id为主键,默认是主键索引,name为普通索引
select * from user where id = 1;  // 覆盖索引
select id, name from user where name = 'Arm';  // 覆盖索引
select id, name, sex from user where name = 'Arm';  // 非覆盖索引,需回表查询
  • MySQL超大分页处理:优化思路:一般分页查询时,通过创建覆盖索引能够比较好的提高性能,可以通过覆盖索引加子查询形式进行优化。
    超大分页一般都是在数据量比较大时,我们使用了limit分页查询,并且需要对数据进行排序,这个时候效率就很低。我们可以采用覆盖索引和子查询来解决,先分页查询数据的ID字段,确定了ID之后再用子查询来过滤,只查询这个ID列表中的数据就可以了,因为查询ID的时候走的覆盖索引,所以效率可以提升很多。
select * from user limit 10000010;  

在进行分页查询时,如果执行如上 limit 100000,10 ;此时需要MySQL排序前100010记录,然后再仅返回后10条记录,查询排序的代价非常大。

select * from user u, (select id from user order by id limit 10000010)a where u.id = a.id;

子查询select id可以在聚簇索引中查到,无需回表查询,进行关联查询时减少了回表次数。

5、MySQL有哪些索引?

  • 普通索引:即不应用任何限制条件的索引,该索引可以在任何数据类型中创建。
  • 唯一索引:索引列的值必须唯一,但允许有空值。
  • 主键索引:是一种特殊的唯一索引,不允许为空值。
  • 联合索引:索引可以覆盖多个数据列,如INDEX(columnA,columnB)索引。
  • 全文索引(fulltext):通过建立倒排索引,可以极大的提升检索效率,解决判断字段是否包含的问题,是目前搜索引擎使用的一种关键技术。(ALTER TABLE table_name ADD FULLTEXT(column);创建全文索引)

在这里插入图片描述

6、索引设计的原则?

  • 针对数据量较大,且查询比较频繁的表建立索引。
  • 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的子段建立索引。
  • 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度高,使用索引的效率高。
  • 如果是字符串类型的字段,尽量选择长度较短的,可建立前缀索引。
  • 尽量使用联合索引,减少单列索引,查询时联合索引很多适合可以覆盖索引,节省存储空间,避免回表,提高查询效率。
  • 要控制索引的数量,索引越多,维护代价越大,会影响增删效率。
  • 如果索引列不能存储NULL值,在创表时使用NOT NULL约束它,有效

7、什么情况下索引会失效?

  • 违反了最左前缀原则:
  • 范围查询右边的列,不能使用索引。MySQL会从索引的第一个简直一直向右匹配,直到范围查询时( >,< ,< >,or,like)停止匹配。
  • 在索引列上进行了运算操作,索引失效。
  • 字符串不加单引号,造成索引失效。
  • 以%开头的like模糊查询,索引失效,如果仅仅是尾部模糊查询匹配,索引不会失效,如果是头部模糊匹配,索引失效。

假设给user表的name、age、address按此顺序创建了联合索引。
如果索引了很多列,需要遵循最左前缀法则,指的是查询从索引的最左前列开始,并且不跳过索引中的列。如下所示SQL语句命中索引情况。

select * from user where name = 'tom';  // 命中一个索引
select * from user where name = 'tom' and age = '24';  // 命中2个索引
select * from user where name = 'tom' and age = '24' and address = '北京';  // 命中3个索引

但如果跳过中间sex,后面的address索引失效

select * from user where name = 'tom' and address = '北京';  // 命中1个索引name, address索引失效。

使用范围查询,导致后续address索引失效

select * from user where name = 'tom' and age > '24' and address = '北京';  // 命中2个索引, address索引失效。

在索引列上进行运算操作,索引失效

select * from user where substring(name, 3, 2) = 'to';  // 索引失效

如果age是字符串类型,未加单引号,MySQL的查询优化器,会自动进行类型转换,造成索引失效

select * from user where name = 'tom' and age > 24;  // 命中1个索引name, age索引失效。可使用>=或<=代替来命中索引

模糊查询,以%开头,索引失效,仅仅尾部使用,索引不失效

select * from user where name like 'tom%';  // name索引不失效
select * from user where name like '%tom';  // name索引失效
select * from user where name like '%tom%';  // name索引失效

二、MySQL优化

1、如何定位慢查询?

  • 慢查询的主要原因是:聚合查询、多表查询、表数据量过大查询、分表查询
  • MySQL慢日志查询:可修改MySQL的配置文件my.cnf,配置如下信息来开启慢日志查询日志功能。一般只会在调试阶段开启慢查询。
# 开启mysql的慢日志查询开关
slow_query_log=1
# 设置慢日志的时间为2秒,sql语句执行时间超过2s,就会被视为慢查询,记录慢查询日志
long_query_time=2
  • 使用开源工具Arthas、运维工具Prometheus、Skywalking

2、SQL语句执行很慢如何优化?

  • 如果一条sql执行很慢的话,可以采用MySQL自带的执行计划EXPLAIN或者DESC命令查看这条sql的执行情况。如:可以通过key和key_len检查是否命中了索引(索引本身存在是否有失效发情况),然后通过type字段查看sql是否有进一步的优化空间,是否存在全索引扫描或全盘扫描。其次可以通过extra建议判断是否出现了回表的情况,如果出现了,可以尝试添加索引或修改返回字段来修复。
    在这里插入图片描述

3、MySQL优化经验有哪些?

  • SQL语句优化:
    1)尽量避免使用select * ,查询不必要的字段,较少回表查询的可能
    2)在where从句,group by从句, order by从句, on从句中出现的列 尽量使用索引的列,尽量避免不必要的order by
    3)全模糊查询中尽量不要使用子查询,
    4)group by从句, order by从句中尽量避免出现不确定的结果函数,如now(),rand(),否则系统将可能无法正确使用索引。
    5)用exists替代IN、用not exists替代NOT IN,in 和 not in 也要慎用,否则会导致全表扫描(全表扫描是指在查询数据时,需要扫描整个表中的每一行数据来查找符合条件的数据)
    6)应尽量避免在 where 子句中对字段进行 null 值判断、进行表达式操作,否则将导致引擎放弃使用索引而进行全表扫描
    7)尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描
    8)索引字段越小越好
  • 主从复制、读写分离:
    如果数据库的使用场景读的操作比较多的时候,为了避免写的操作操作性能影响,可以采用读写分离的架构
  • 表结构设计的优化
    1)选择合适的数据类型,如char定长效率高,varchar可变长度,效率稍低
    2)把一个很多列的表进行拆分,拆分成多个表:把不常用的字段单独放到一个表中;把大字段独立存放到一个表中;把经常使用的字段放到一起。

4、MySQL的主从同步原理

  • MySQL主从复制的核心就是二进制日志binlog(记录了所有的DDL【数据定义语言】语句和DML【数据操纵语言】语句)
    1)主库在事务提交时,会把数据变更记录在二进制日志文件中。
    2)从库读取主库的二进制文件binlog,写入到从库的中继日志Relay Log中。
    3)从库重做中继日志中的事件,将改变反映它自己的数据。

在这里插入图片描述

5、分库分表

  • 1)垂直分库:以表为依据,根据业务将不同的表参分到不同的库中。
    特点:按业务对数据分级管理、维护、监控、扩展,在高并发下提高磁盘io和数据量连接数。
  • 2)垂直分表:以字段为依据,根据字段属性将不同字段拆分到不同表中。
    拆分规矩:把不常用的字段单独放在一张表里,把text,blob等大字段拆分出来放到附表中。
    特点:冷热数据分离,减少io过度争抢,两表互不影响。
  • 03)水平分库:将一个库的数据拆分到多个库中,解决海量数据存储和高并发的问题。
    路由规则:根据ID节点取模;按ID也就是范围路由。
    特点:解决了单裤大量数据高并发的瓶颈问题;提高了系统的稳定性和可用性。
  • 4)水平分表:将一个表的数据拆分到多个表中(可以在同一个库内),解决单表存储和性能的问题。
    特点,优化单表数据量过大而产生的性能问题,避免io争抢,并减少锁表的几率。

分库之后的问题:
1)分布式事物一致性的问题,跨节点关联查询,跨节点分页、排序函数,主键避重。
2)分库分表中间件:sharding-sphere,mycat

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/593496.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

给Ollama套个WebUI,方便使用

Ollama 基本的安装使用参考前文 https://xugaoxiang.com/2024/05/01/ollama-offline-deploy/&#xff0c;前文使用的模型是 llama2&#xff0c;本篇将使用 llama3&#xff0c;因此在启动时&#xff0c;命令是 ollama run llama3。 Ollama Llama3 Llama3 是 Meta 发布的大语言模…

【AI工具声音克隆】——OpenVoice一键部署modelScope一键使用

一、声音/音色克隆简介 声音或音色克隆的原理实现步骤主要基于深度学习技术&#xff0c;特别是语音合成和生成模型。以下是声音/音色克隆的大致实现步骤&#xff1a; 数据收集&#xff1a; 收集语音数据&#xff0c;作为模型的训练样本。数据应尽可能多样化&#xff0c;包括不…

GRU模块:nn.GRU层的输出state与output

在 GRU&#xff08;Gated Recurrent Unit&#xff09;中&#xff0c;output 和 state 都是由 GRU 层的循环计算产生的&#xff0c;它们之间有直接的关系。state 实际上是 output 中最后一个时间步的隐藏状态。 GRU 的基本公式 GRU 的核心计算包括更新门&#xff08;update gat…

[C++基础学习-04]----C++数组详解

前言 在C中&#xff0c;数组是一种用来存储相同类型元素的数据结构。一维数组是最简单的数组形式&#xff0c;它由一系列按顺序存储的元素组成。二维数组则是由一维数组构成的数组&#xff0c;可以看作是一堆一维数组堆叠在一起形成的矩阵。 正文 01-数组简介 一维数组和二维…

库存管理系统开源啦

软件介绍 ModernWMS是一个针对小型物流仓储供应链流程的开源库存管理系统。该系统的开发初衷是为了满足中小型企业在有限IT预算下对仓储管理的需求。通过总结多年ERP系统研发经验&#xff0c;项目团队开发了这套适用于中小型企业的系统&#xff0c;以帮助那些有特定需求的用户。…

计算机毕业设计springboot基于vue电商抢购限时秒杀系统ch0h8

技术栈 ide工具&#xff1a;IDEA 或者eclipse 编程语言: java 数据库: mysql5.7以上版本 可选框架&#xff1a;ssmspringboot都有的 前端&#xff1a;vue.jsElementUI 详细技术&#xff1a;springbootSSMvueMYSQLMAVEN 数据库工具&#xff1a;Navicat/SQLyog都可以 开发工具 Ec…

【iOS】KVC

文章目录 前言一、KVC常用方法二、key与keypath区别key用法keypath用法 三、批量存值操作四、字典与模型相互转化五、KVC底层原理KVC设值底层原理KVC取值底层原理 前言 KVC的全称是Key-Value Coding&#xff0c;翻译成中文叫做键值编码 KVC提供了一种间接访问属性方法或成员变…

基于stm32的USB虚拟U盘+FATFS+W25Q64

基于stm32的USB虚拟U盘FATFSW25Q64 本文目标&#xff1a;基于stm32的USB虚拟U盘FATFSW25Q64 按照本文的描述&#xff0c;简单跑通USB的MSC类来进行简单交互。 先决条件&#xff1a;拥有C语言基础&#xff0c;装有编译和集成的开发环境&#xff0c;比如&#xff1a;Keil uVis…

mysql其它补充

exist和in的区别 exists 用于对外表记录做筛选。 exists 会遍历外表&#xff0c;将外查询表的每一行&#xff0c;代入内查询进行判断。 当 exists 里的条件语句能够返回记录行时&#xff0c;条件就为真&#xff0c;返回外表当前记录。反之如果 exists 里的条件语句不能返回记…

使用python开发的词云图生成器2.0

使用python开发的词云图生成器2.0 更新部分词云图主要三方库工具介绍和效果工具界面&#xff1a; 代码 更新部分 1.支持选择字体&#xff1b; 2.支持选择词云图形状 词云图 词云图啊&#xff0c;简单来说&#xff0c;它可以把文本数据中的高频关键词变成不同大小、颜色的词汇…

一篇文章带你深入了解“指针”

一篇文章带你深入了解“指针” 内存和地址了解指针指针类型const修饰指针指针的运算指针与整数之间的运算指针与指针之间的运算指针的关系运算 void* 指针传值调用和传址调用数组和指针的关系野指针野指针的形成原因规避野指针 二级指针字符指针指针数组数组指针数组传参一维数…

(三)JVM实战——对象的内存布局与执行引擎详解

对象的内存布局 对象的实例化 对象的创建方式 - new的方式 - Class的newInstance():反射的方式 - Construct的newInstance() - clone:实现Cloneable接口,默认浅拷贝 - 使用反序列化&#xff1a;将二进制流转化为内存对象 创建对象的步骤 - 判断对象对应的类是否加载、链接、初…

基础I/O--文件系统

文章目录 回顾C文件接口初步理解文件理解文件使用和并认识系统调用open概述标记位传参理解返回值 closewriteread总结 文件描述符fd0&1&2理解 回顾C文件接口 C代码&#xff1a; #include<stdio.h> int main() { FILE *fpfopen("log.txt",&…

08 - 步骤 表输出

简介 表输出&#xff08;Table Output&#xff09;步骤是用于将 Kettle 中的数据写入关系型数据库表的步骤。它允许用户将数据流中的数据插入、更新或删除到目标数据库表中。 使用 场景 我要将处理完的数据流中的sysOrgCode 跟 plateNumber 保存记录到mysql 1、拖拽表输出…

2.VAM新建保存修改场景文件

新建场景 点击返回场景预览 打开游戏的时候&#xff0c;本身就有了一个新场景&#xff0c;因为现在场景里什么也没有&#xff0c;所以是一片黑暗 点击星号打开主菜单会返回主界面 做一个最简单的Helloworld场景 底下有两个模式&#xff0c;游玩模式和编辑模式 编辑场景的时候…

OpenCV如何使用 GDAL 读取地理空间栅格文件(72)

返回:OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 上一篇:OpenCV的周期性噪声去除滤波器(70) 下一篇 :OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 目录 目标 代码&#xff1a; 解释&#xff1a; 如何使用 GDAL 读取栅格数据 注意 …

05_G1垃圾收集器

G1垃圾收集器简介 垃圾优先 Garbage-First&#xff08;G1&#xff09;垃圾收集器面向多处理器机器&#xff0c;适用于大内存场景。它尝试在无需太多配置的情况下实现垃圾收集暂停时间目标&#xff0c;并同时实现高吞吐量。G1旨在通过适用于当前目标应用和环境的功能&#xff0…

go mod

常用命令 初始化模块 go mod init 模块名下载 go.mod 文件中指明的所有依赖 go mod download github.com/gin-gonic/ginv1.9.(依赖路径)依赖对其&#xff08;使引用的都是所依赖的&#xff09; go mod tidy编辑go.mod go mod edit go mod edit -require"github.com/g…

记录几种排序算法

十种常见排序算法可以分类两大类别&#xff1a;比较类排序和非比较类排序。 常见的快速排序、归并排序、堆排序以及冒泡排序等都属于比较类排序算法。比较类排序是通过比较来决定元素间的相对次序&#xff0c;其时间复杂度不能突破 O(nlogn)。在冒泡排序之类的排序中&…

数据结构---时间复杂度+空间复杂度

算法(algorithm)简单说就是解决问题的方法。方法有好坏&#xff0c;同样算法也是&#xff0c;有效率高的算法&#xff0c;也有效率低的算法。衡量算法的好坏一般从时间和空间两个维度衡量&#xff0c;也就是本文要介绍的时间复杂度和空间复杂度。有些时候&#xff0c;时间与空间…