MySQL之性能分析和系统调优

MySQL之性能分析和系统调优

性能分析

查看执行计划 EXPLAIN

EXPLAIN作为MySQL的性能分析神器,可以用来分析SQL执行计划,需要理解分析结果可以帮助我们优化SQL

explain selectfrom[where ...]

TABLE

表名 查询的每一行记录都对于着一张表

id

该语句的唯一标识。如果explain的结果包括多个id值,则数字越大越先执行;而对于相同id的行,则表示从上往下依次执行。

select_type

每一个子查询在语句中扮演的角色

  • simple: 不包含union或者子查询的语句
  • primary :最外层的查询
  • union: union中第二个后随后的select被标记为union;如果union被from子句中的子查询包含,那么它的第一个select会被标记为derived
  • dependent union: union中第二个或后面的的查询依赖了外面的查询
  • subquery: 子查询的第一个select
  • dependent subquery: 子查询的第二个或后面的select 依赖了外面的查询
  • derived :表示包含在from子句的子查询中的select,MySQL会将执行结果放在一个临时表中;MySQL内部将其称为derived table,因为该表是从临时查询中派生出来的
  • materialized:将子查询物化之后供外层连接使用

partitions

当前查询匹配记录的分区

type

执行查询时的访问方法

  • system:表中只有一个数据并且使用的存储引擎的统计数据是精确的,有一个变量记录(比如myisam memory)

  • const:根据主键或者唯一的二级索引列等值匹配时

  • eq_ref:被驱动表是通过主键或者唯一的二级索引进行匹配的

  • ref:普通的二级索引进行等值匹配

  • ref_or_null:该类型类似于ref,但是MySQL会额外搜索哪些行包含了NULL。这种类型常见于解析子查询

  • index_merge:此类型表示使用了索引合并优化,表示一个查询里面用到了多个索引

  • unique_subquery:该类型和eq_ref类似,但是使用了IN查询,且子查询是主键或者唯一索引

  • index_subquery:和unique_subquery类似,只是子查询使用的是非唯一索引

  • range:范围扫描,表示检索了指定范围的行,主要用于有限制的索引扫描

  • index:全索引扫描,和ALL类似,只不过index是全盘扫描了索引的数据

    查询仅使用索引中的一部分列时,可使用此类型。有两种场景会触发:

    • 如果索引是查询的覆盖索引,并且索引查询的数据就可以满足查询中所需的所有数据,则只扫描索引树。此时,explain的Extra 列的结果是Using index。index通常比ALL快,因为索引的大小通常小于表数据。
    • 按索引的顺序来查找数据行,执行了全表扫描。此时,explain的Extra列的结果不会出现Uses index。
  • all:全表扫描,性能最差

possible_keys

展示当前查询可以使用哪些索引,这一列的数据是在优化过程的早期创建的,因此有些索引可能对于后续优化过程是没用的。

key

表示MySQL实际选择的索引

key_len

索引使用的字节数。由于存储格式,当字段允许为NULL时,key_len比不允许为空时大1字节
主要针对联合索引,是否充分利用索引

ref

表示将哪个字段或常量和key列所使用的字段进行比较。

如果ref是一个函数,则使用的值是函数的结果。要想查看是哪个函数,可在EXPLAIN语句之后紧跟一个SHOW WARNING语句。

rows

MySQL估算会扫描的行数,数值越小越好。

filtered

表示符合查询条件的数据百分比,最大100。用rows × filtered可获得和下一张表连接的行数。例如rows = 1000,filtered = 50%,则和下一张表连接的行数是500。

extra

  • no tables used:没有from子句
  • impossible where:where始终为false
  • using where:不使用索引;使用索引但包含不使用索引的条件
  • no match min/max:使用聚合函数但没有匹配的where、
  • using index:查询到数据使用二级索引不需要进行回表操作;如果进行回表则是null
  • using index condition:Index condition pushdown索引条件下推

EXPLAIN格式

  • 传统格式:缺少一个衡量执行计划好坏的重要信息–成本
  • JSON格式:在explain和语句之间加上format=JSON 多一些详细信息如成本
  • TREE格式:在8.0.16新增格式 主要由各部分之间的关系和执行顺序决定
  • 可视化输出:workbench

show warmings

展示真实执行的sql语句

数据库设计规范

数据库主键的设计

自增ID

自增ID的问题(缺点太多)核心业务不推荐使用

1.可靠性不高,在集群模式下存在自增ID回溯的问题

2.安全性不高,容易被被爬虫获取数据

3.性能差,需要占用数据库服务端的资源(有AUTO-INC锁来完成)

4.交互多

5.局部唯一性(在一台机器下)

业务字段

与业务有关的字段不能设计为主键,对于数据库维护造成很大困难

UUID

优点:性能高;不依赖网络;使用简单;全局唯一

缺点:占用36个字节,长度过长,没有含义,无序

有序UUID

将时间高位和地位互换,这样时间保证了单调递增,去掉无用‘-’并使用二进制存储

雪花算法

时间戳(数据单调递增)+数据中心ID+机器编码(全局唯一性)+序列号(1ms内生成多个ID的问题)

缺点:

依赖了机器ID的分配,集群的扩容和缩容需要重新分配,可能会导致ID重复

(解决:可以使用zookeeper的临时顺序节点分配ID)

依赖了系统时间,如果集群中的机器时间被回拨,也可能造成ID重复

(解决:一个客户端:在取到新ID后与之前最大的ID比较,如果ID变小则报错或者等待)

(集群:美团的leaf每次有新节点接入zk时会将节点上报的时间和集群平均的时间对比,如果新加入的节点的时间落后于平均时间则报错)

范式

1NF

确保每一个字段的值都有原子性,属性的原子性有主观性(字段不可再分)

2NF

得有主键,且非主键字段必须完全依赖于主键,不能只依赖主键的一部分

一个表只表达一个意思

如果不完全依赖候选键会导致

1.数据冗余(重复数据记录多次)

2.插入异常

3.删除异常

4.更新异常

应该将表拆分直到满足2NF

3NF

非主键字段不能依赖于其他非主键字段(非主键字段之间相互独立)不存在传递性

反范式化

遵循业务优先的原则,为了减少关联查询可以适当增加冗余字段来增强读性能,以空间换时间

一个表中的字段修改那么也应该同步修改另一张表,保证数据一致性

适用场景

增加的冗余字段不需要经常进行修改,查询的时候不可或缺

SQL语句调优

逻辑查询优化

关联查询优化

联接算法

联接算法是MySQL数据库用于处理联接的物理策略。目前MySQL数据库仅支持Nested-Loops Join算法。

两张表的Join的过程:

在这里插入图片描述

上图的Fetch阶段是指当内表关联的列是辅助索引时,但是需要访问表中的数据,那么这时就需要再访问主键索引才能得到数据的过程,不论表的存储引擎是InnoDB存储引擎还是MyISAM,这都是无法避免的,只是MyISAM的回表速度要快点,因为其辅助索引存放的就是指向记录的指针,而InnoDB存储引擎是索引组织表,需要再次通过索引查找才能定位数据。

Fetch阶段也不是必须存在的,如果是聚集索引联接,那么直接就能得到数据,无需回表,也就没有Fetch这个阶段。另外,上述给出了两张表之间的Join过程,多张表的Join就是继续上述这个过程。

接着计算两张表Join的成本,这里有下列几种概念:

外表的扫描次数,记为O。通常外表的扫描次数都是1,即Join时扫描一次外表(驱动表)的数据即可

内表的扫描次数,记为I。根据不同Join算法,内表(被驱动表)的扫描次数不同

读取表的记录数,记为R。根据不同Join算法,读取记录的数量可能不同

Join的比较次数,记为M。根据不同Join算法,比较次数不同

回表的读取记录的数,记为F。若Join的是辅助索引,可能需要回表取得最终的数据

  • Simple Nested-Loops Join(SNLJ,简单嵌套循环联接)

没有索引,小表驱动大表;暴力循环查找

  • Index Nested-Loops Join(INLJ,基于索引的嵌套循环联接)

在内表建立索引,以此降低Nested-Loop Join算法的开销,减少内表扫描次数

外连接消除

我们前边说过,内连接的驱动表和被驱动表的位置可以相互转换,而左(外)连接和右(外)连接的驱动表和被驱动表是固定的,因为有些不满足联接条件的记录会通过外部表行的方式再次添加到结果中。这就导致内连接可以通过优化表的连接顺序来降低整体的查询成本,而外连接却无法优化表的连接顺序。

外连接和内连接的本质区别就是:对于外连接的驱动表的记录来说,如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该记录仍然会被加入到结果集中,对应的被驱动表记录的各个字段使用NULL值填充;而内连接的驱动表的记录如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该记录会被舍弃。

  • Block Nested-Loops Join(BNL,基于块的嵌套循环联接)

引入join buffer缓冲区不是一次一条取驱动表数据而是一块一块取减少IO次数,在8.0.2版本被hash join替代

整体效率:INLJ>BNLJ>SNLJ

优化策略

1.用小的结果集驱动大的结果集

2.为被驱动表的匹配条件字段增加索引减少内层循环次数

3.使用BNLJ时可以适当增大join buffer的大小

4.hash join大数据连接时常用方式:优化器使用较小的表的join key在内存中建立散列表,通过扫描较大的表并探测散列表找出匹配的行

子查询优化

子查询可以帮准我们通过一个SQL来实现较为复杂的的查询但子查询的效率一般都不高

缺点:

1.执行子查询时内层查询会建立一个临时表,撤销临时表都会消耗资源产生大量慢查询

2.产生的临时表没有索引,效率低

建议:使用连接查询JOIN来代替子查询

排序优化

可以通用filesort和index两种方式排序

index :通过有序索引顺序扫描直接返回有序数据,不需要额外的排序,操作效率较高。

filesort:通过对返回数据进行排序,filesort 并不代表通过磁盘文件排序,而是说明进行了一个排序操作,至于排序操作是否使用了磁盘文件或临时表等,则取决于MySQL服务器对排序参数的设置和需要排序数据的大小。

有两种排序算法:

1.双路排序算法:从磁盘取排序的字段,在buffer中排序后再从磁盘中取排好序的数据

2.单路排序算法:从磁盘读取所有需要排序字段的排序数在buffer中排好序输出,内存空间占用大,sort_buffer_size适当调大

sort_buffer_size设置的排序区是每个线程独占的,所以同一时刻,MySQL中存在多个sort buffer排序区。

GROUP BY优化

先排序再分组 遵循最佳左前缀原则

无法使用索引列时增加sort_buffer_size和max_length_for_sort_data

where效率高于having

减少使用order by尽量在客户端进行数据排序,数据库的CPU资源是宝贵的

使用覆盖索引和索引下推

(在索引篇已经说明)

物理查询优化

索引优化

sql语句是否使用索引与优化器的选择有关(数据库版本,数据量,数据选择度),不基于语义,也不基于规则,而是基于const开销

什么会导致索引失效

>、<范围查询(一般将范围查询条件放在最后)

mysql 会一直向右匹配直到遇到索引搜索键使用>、<就停止匹配。一旦权重最高的索引搜索键使用>、<范围查询,那么其它>、<搜索键都无法用作索引。即索引最多使用一个>、<的范围列,因此如果查询条件中有两个>、<范围列则无法全用到索引。

like %xx

如搜索键值以通配符%开头(如:like '%abc'),则索引失效,直接全表扫描;若只是以%结尾,则不影响索引构建

类型转换导致索引失败

如果列是字符串类型,传入条件是必须用引号引起来,不然报错或索引失效

计算或者函数导致索引失效

如果查询条件中含有函数或表达式,将导致索引失效而进行全表扫描

不等于索引失效情况

普通索引使用 !=索引失效,主键索引没影响。
where语句中索引列使用了负向查询,可能会导致索引失效。
负向查询包括:NOT、!=、<>、NOT IN、NOT LIKE等。

or 条件索引问题

or 的条件列除了同时是主键的时候,索引才会生效。其他情况下的,无论条件列是什么,索引都失效。

联合索引违背最左匹配原则

联合索引中,where中索引列违背最左匹配原则,一定会导致索引失效

其他优化策略

exists和in的区别

主要由表的大小决定,in适合用于驱动表比被驱动表小的情况,exists适合用于驱动表比被驱动表大的情况

count*和count(具体字段)的区别

如果是myisam存储引擎,在每一张表都有一个row_count字段存储表数据行数,那么查询数据行数的时间复杂度是o(1)的,但由于InnoDB中支持行级锁和MVCC机制,无法维护这样的变量,所以是全表扫描时间复杂度是o(n)的

count(具体字段)一般推荐使用二级索引,因为二级索引存储的字段更小count(*)和count(1)一般自动选择key_length小的索引

关于select*

mysql中将*通过查询数据字段转变为对应的字段需要花费时间和资源

不能使用覆盖索引

limit 1

对于会进行全表扫描的sql,如果我们确定结果集只有一个,那么加上limit 1后查询到一条数据后就不会再进行查询,加快查询速度

但是如果针对已经是唯一索引的字段就没有必要了

多使用commit

commit会释放相应的资源

1.回滚段记录的用于恢复数据

2.被程序获得的锁

3.redo/undo log buffer中的空间

4.管理上述资源花费的资源

数据库其他调优

选择合适的DBMS

如果对数据安全性以及事务性处理要求高的话可以使用SQL Server或者Oracle

选择合适的存储引擎,innodb支持事务,行锁外键等,适用于事务性要求高,myisam处理大量的更新操作

优化表的设计

表要求遵循第三范式

如果查询应用较多,进行的大量的多表查询操作,可以将经常查询的字段增加来换取查询的效率也是反范式化

表的字段类型的选择

优化查询逻辑

逻辑查询优化:改变SQL语句的内容让SQL执行更高效

物理查询优化:索引优化

使用Redis作为缓存

库级优化

读写分离

数据分片,对数据库分库分表

优化MySQL服务器

服务器硬件优化

优化数据库结构

拆分表:冷热数据的分离(一个页中可以存储更多数据减少磁盘IO)

增加中间表

增加冗余字段(反范式化)

优化数据类型:
1.比如对于非负型整数可以使用unsigned来存储

2.对于文本数据类型大整数占用空间更少

3.避免使用text blog,MySQL内存临时表不支持,必须使用磁盘临时表,性能差

4.避免使用enum,修改enum需要使用alter语句,尽量用tinyint来替代

5.使用timestamp

6.使用decimal避免float double

优化插入记录的速度

myisam:

1.禁用索引

2.禁用唯一性

3.检查使用批量插入

innodb:

1.禁用唯一性检查

2.禁用外键检查

3.禁止自动提交

使用非空约束
分析表检查表优化表

分析表:ANALYZE 分析表各个字段

检查表:CHECK

优化表:OPTIMIZE

大表优化

限定查询范围

读写分离

垂直拆分 分库分表 水平拆分

其他调优策略

服务器语句超时处理

创建全局通用表空间

隐藏索引

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/209433.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】最短路径(Dijskra算法)

一.引例 计算机网络传输的问题&#xff1a; 怎样找到一种最经济的方式&#xff0c;从一台计算机向网上所有其他计算机发送一条消息。 抽象为&#xff1a; 给定带权有向图G&#xff08;V&#xff0c;E&#xff09;和源点v&#xff0c;求从v到G中其余各顶点的最短路径。 即&…

优化问题,详解静态优化

优化问题&#xff0c;尤其静态优化问题&#xff0c;在控制系统设计中随处可见&#xff0c;例如基于燃油经济性和驾驶体验的多目标优化的汽车发动机 MAP 标定&#xff0c;基于性能指标优化的飞行器结构设计参数优化&#xff0c;以实验数据与模型输出匹配为目标的电池 RC 等效电路…

[WP] ISCTF2023 Web 部分题解

圣杯战争!!! 反序列化伪协议读取 where_is_the_flag 环境变量根目录当前目录 绕进你的心里 利用正则最大回溯绕过 easy_website or select 用双写绕过 空格用/**/绕&#xff0c;报错注入 wafr codesystem(ca\t /f*) webinclude 扫描得到index.bak备份文件打开为加密的代码 写…

Linux Spug自动化运维平台本地部署与公网远程访问

文章目录 前言1. Docker安装Spug2 . 本地访问测试3. Linux 安装cpolar4. 配置Spug公网访问地址5. 公网远程访问Spug管理界面6. 固定Spug公网地址 前言 Spug 面向中小型企业设计的轻量级无 Agent 的自动化运维平台&#xff0c;整合了主机管理、主机批量执行、主机在线终端、文件…

SAP_ABAP_编程基础_数据集_创建并填充摘录数据集 / 处理摘录数据集

SAP ABAP 顾问&#xff08;开发工程师&#xff09;能力模型_Terry谈企业数字化的博客-CSDN博客文章浏览阅读494次。目标&#xff1a;基于对SAP abap 顾问能力模型的梳理&#xff0c;给一年左右经验的abaper 快速成长为三年经验提供超级燃料&#xff01;https://blog.csdn.net/j…

【U8+】用友U8修改凭证提示:外部凭证在总账系统中不能修改。

【问题描述】 用友U8中&#xff0c;在总账模块中修改凭证的时候&#xff0c;提示&#xff1a; 外部凭证在总账系统中不能修改。 【原因分析】 在软件中&#xff0c;使用其他模块的情况下&#xff0c; 其他模块生成的凭证都会传到总账模块中&#xff0c;进而这些由其他模块生成…

uniapp设置手机通知权限以及uniapp-push2.0推送

unipush2.0代码 export default function () {// 调用获取用户通知权限setPermissions()// 获取客户端唯一的推送标识&#xff0c;可用于测试uni.getPushClientId({success: (res) > {console.log(res.cid)},fail(err) {console.log(err)}})// 监听推送uni.onPushMessage(r…

windows ssh时出现Bad local forwarding specification的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

TA-Lib学习研究笔记——Cycle Indicators (七)

TA-Lib学习研究笔记——Cycle Indicators &#xff08;七&#xff09; Cycle Indicators 周期指标函数组有HT_DCPERIOD, HT_DCPHASE, HT_PHASOR, HT_SINE, HT_TRENDMODE 。 1.HT_DCPERIOD Hilbert Transform - Dominant Cycle Period 函数名&#xff1a;HT_DCPERIOD 名称&am…

Hertz 整合swagger

文章目录 Swagger安装使用用法项目demoSwagger注释用法通用API信息 swag命令行参数swagger路由配置 Swagger 安装 go get 安装可执行文件需要配合 GOPATH 模式工作。 go get github.com/swaggo/swag/cmd/swag 因为从 Go 1.17 开始&#xff0c;在 go mod 模式下通过 go get 下…

【Web】NISACTF 2022 个人复现

目录 ①easyssrf ②babyupload ③ level-up ④bingdundun~ 明天就新生赛了&#xff0c;练套题保持下手感吧 &#xff08;文章只选取了一部分&#xff09; ①easyssrf 输入/flag 输入file:///fl4g 访问/ha1x1ux1u.php ?filephp://filter/convert.base64-encode/resource/…

uni-app 微信小程序之自定义中间圆形tabbar

文章目录 1. 自定义tabbar效果2. pages新建tabbar页面3. tabbar 页面结构4. tabbar 页面完整代码 1. 自定义tabbar效果 2. pages新建tabbar页面 首先在 pages.json 文件中&#xff0c;新建一个 tabbar 页面 "pages": [ //pages数组中第一项表示应用启动页&#xff…

【小布_ORACLE笔记】Part11-6 RMAN Backups

【小布_ORACLE笔记】Part11-6 RMAN Backups 1.track文件的作用 当做差异性备份时&#xff0c;server process对应的RMAN客户端的server process就不用去每个块每个块的检查&#xff0c;只要到trackfile 里面去读一下&#xff0c;看哪个块改变了就直接把哪个块备份下来&#x…

Java研学-IO流(三)

六 字节流 – 字节输出流系列 OutPutStream体系 1 OutPutStream系列 – 字节输出流 // 表示字节输出流所有类的超类&#xff0c;输出流接受输出字节并将其发送到某个接收器 public abstract class OutputStreamFileOutputStream/BufferedOutputStream 2 FileOutputStream类设…

python 实现链表

链表基础知识 链表是在物理内存中不连续&#xff0c;数据通过链表中的指针来链接到下一个元素。 链表由一系列节点组成&#xff0c;节点在运行时动态生成&#xff0c;节点一般包括两个部分&#xff1a;存储数据的数据域&#xff0c;存储下一个节点的指针域 链表的常用操作&a…

<JavaEE> 什么是线程安全?产生线程不安全的原因和处理方式

目录 一、线程安全的概念 二、线程不安全经典示例 三、线程不安全的原因和处理方式 3.1 线程的随机调度和抢占式执行 3.2 修改共享数据 3.3 关键代码或指令不是“原子”的 3.4 内存可见性和指令重排序 四、Java标准库自带的线程安全类 一、线程安全的概念 线程安全是指…

抑郁症由什么引起?

抑郁症的发生并不是单一原因所导致&#xff0c;而是多种因素相互作用的结果。以下是一些主要的原因&#xff1a; 首先&#xff0c;生物学因素在抑郁症的发病中起到了关键作用。研究显示&#xff0c;抑郁症可能与遗传有关&#xff0c;家族中有患抑郁症的成员会增加个体患病的风…

Android studio Load error:undefined path variables

android stuido 报错 Load error&#xff1a;undefined path variables Gson is undefined 处理方法&#xff1a; 点击进行Sync Project with Gradle Files

了解 ignore_above 参数对 Elasticsearch 中磁盘使用的影响

在 Elasticsearch 中&#xff0c;ignore_above 参数允许你忽略&#xff08;而不是索引&#xff09;长于指定长度的字符串。 这对于限制字段的大小以避免性能问题很有用。 在本文中&#xff0c;我们将探讨 “ignore_above” 参数如何影响 Elasticsearch 中字段的大小&#xff0c…

ESP32 MicroPython WEB蓝牙红外遥控小车⑬

ESP32 MicroPython WEB蓝牙红外遥控小车⑬ 1、蓝牙遥控小车2 、红外遥控小车3 、WEB网页摄像头遥控小车 1、蓝牙遥控小车 实验目的 使用“YQD蓝牙小车”APP控制小车 实验内容 使用小车显示屏显示蓝牙连接情况&#xff0c;开启蓝牙名称为“yqd-car”&#xff0c;并设置连接到小…