【深入浅出MySQL】「性能调优」高性能查询优化MySQL的SQL语句编写

高性能查询优化MySQL的SQL语句编写准则这里写目录标题

  • 总体优化大纲
    • (1)优化查询性能:通过索引降低全表扫描频率
      • 优化方向
      • 案例介绍
      • 问题分析
      • 解决方案
        • 建立复合索引
        • 建立单独索引
    • (2)优化数据表与查询:合理使用非NULL约束与默认值
      • 优化方向
        • 避免`NULL`值带来的潜在问题
        • 案例介绍
      • 解决方案
        • 建表的配置问题
        • 查询的操作处理
    • (3)优化SQL查询:避免在WHERE子句中使用非索引操作符
      • 解决方案
    • (4)优化查询性能:使用UNION替代OR条件以减少全表扫描
      • 案例介绍
      • 优化方向
      • 案例介绍
    • (5)优化查询性能:合理使用BETWEEN替代IN以避免全表扫描
      • 优化方向
      • 案例介绍

总体优化大纲

在这里插入图片描述

(1)优化查询性能:通过索引降低全表扫描频率

提升数据库查询性能的途径时,一个关键的战略就是降低全表扫描的频次。因为全表扫描往往会消耗显著的计算资源,从而导致查询过程变得迟缓且效率低下,为了有效地提高查询的响应速度和整体性能

优化方向

那些在where筛选条件和order by排序操作中频繁使用的列。确保这些列上已经构建了恰当的索引,这样可以帮助数据库系统更快地定位所需的数据,避免不必要的全表遍历,从而达到优化查询性能的目的。

案例介绍

举一个案例,例如,我们有一个名为products的表,用于存储电子商务网站上的商品信息。这个表包含数百万条记录,并且经常需要进行商品搜索和排序操作。

查询试图找出品牌为"Apple",类别为"Phones"的商品,并按价格升序排序,最后只返回前10条记录。

SELECT *  FROM products
WHERE brand = 'Apple' AND category = 'Phones'
ORDER BY price ASC ;

由于缺少适当的索引,这些查询经常触发全表扫描,导致性能问题。

问题分析

  • 性能瓶颈:在表上进行全表扫描是非常耗时的,特别是在表中有数百万条记录时。
  • 索引缺失:该查询中的where子句使用了brand和category字段,而order by子句使用了price字段。由于这些字段上缺少索引,查询性能受到了严重影响

解决方案

建立复合索引

由于查询条件同时涉及brandcategory字段,并且它们是通过AND连接的,因此一个复合索引可能是一个好选择。但请注意,复合索引的顺序很重要。由于brand的值可能相对较少(例如,只有几个不同的品牌),而category的值可能更多(例如,有许多不同的产品类别),因此通常将brand放在索引的前面可能更有效。

CREATE INDEX idx_brand_category_price ON products(brand, category, price);

注意,复合索引(brand, category, price)可能不是所有情况下的最佳选择。例如,如果查询经常只按brandcategory进行筛选,而不是同时按两者进行筛选,那么单独的索引可能更有意义。

建立单独索引

如果你经常单独按brandcategoryprice进行查询或排序,那么单独的索引可能是有用的。但请注意,在存在复合索引的情况下,单独的索引可能不会被使用,除非查询条件或排序方式与复合索引不完全匹配。

CREATE INDEX idx_brand ON products(brand);
CREATE INDEX idx_category ON products(category);
CREATE INDEX idx_price ON products(price);

(2)优化数据表与查询:合理使用非NULL约束与默认值

频繁地在where子句中对字段进行null值判断可能会导致性能下降,并可能使逻辑变得复杂。因此,为了避免这些问题,我们应该审慎地使用null,并考虑在适当的情况下使用not null约束或其他特定的默认值

优化方向

处理数据库中的null值时,我们应该审慎行事,并考虑使用NOT NULL约束、特定的默认值或其他策略来简化查询逻辑并提高性能。

避免NULL值带来的潜在问题

首先,理解NULL在数据库中的含义至关重要。NULL表示字段没有值,这与字段值为0或空字符串(‘’)不同。然而,这种不确定性可能导致查询和逻辑变得复杂,特别是在进行条件判断和联接操作时。

案例介绍
INSERT INTO students (id, name, age, graduation_year)  VALUES   
(1, 'Alice', 20, 2023),  
(2, 'Bob', 21, 2022),  
(3, 'Charlie', 20, NULL), -- 尚未毕业  
(4, 'David', 22, 2021);

当我们想要查询所有已毕业的学生时,我们需要排除graduation_year为NULL的记录。

SELECT * FROM students WHERE graduation_year IS NOT NULL;

在这个查询中,我们需要确保我们只包括那些graduation_year非NULL且年龄大于20岁的学生。

SELECT * FROM students WHERE age > 20 AND graduation_year IS NOT NULL;

解决方案

建表的配置问题
  • 使用NOT NULL约束:如果某个字段在逻辑上总是应该有一个值,那么应该为该字段设置NOT NULL约束。这样做可以确保数据的完整性和一致性,并减少在查询时进行NULL值判断的需要。

  • 使用特定的默认值:对于某些字段,如果确实存在没有值的情况,但又不希望使用NULL来表示,可以考虑为该字段设置一个特定的默认值,如0、-1或某个特定的字符串。这样做可以使数据更具可读性,并简化查询逻辑。

查询的操作处理
  • 避免在WHERE子句中进行NULL值判断:尽量避免在WHERE子句中对字段进行NULL值判断。相反,可以考虑使用其他条件或逻辑来过滤数据。

  • 使用索引优化查询:如果必须对包含NULL值的字段进行查询,那么应该确保该字段已经建立了索引。虽然索引可能不会显著提高对NULL值的查询性能,但它仍然可以帮助优化其他类型的查询。

(3)优化SQL查询:避免在WHERE子句中使用非索引操作符

提高查询效率和性能,我们应尽量避免在WHERE子句中使用!=<>操作符。因为MySQL数据库管理系统在大多数情况下仅对使用<<==>>=BETWEENIN等操作符的列使用索引进行快速数据检索,使用LIKE操作符也可以触发索引的使用,但这通常需要LIKE表达式以非通配符字符开头

解决方案

  • 使用合适的操作符:在WHERE子句中,尽量使用上述提到的能够触发索引使用的操作符。

  • 避免使用非索引操作符:尽量避免使用!=<>这样的非索引操作符,尤其是在涉及大量数据的列上。

  • 考虑查询的改写:必须使用!=<>操作符,是否可以改写查询以使用其他操作符或策略。例如,可以使用NOT IN代替<>

  • 注意LIKE操作符的使用:当使用LIKE操作符时,确保表达式以非通配符字符开头,以便能够利用索引。

(4)优化查询性能:使用UNION替代OR条件以减少全表扫描

在编写SQL查询时,我们应当谨慎地在WHERE子句中使用OR来连接条件,因为这种做法可能会导致数据库引擎放弃使用索引,转而进行全表扫描,从而显著降低查询性能

案例介绍

select id from t where num=10 or num=20

优化方向

优化查询性能,一种有效的策略是利用UNION(或UNION ALL,如果确定结果集中不包含重复行)来合并多个基于相同表但具有不同条件的查询。通过使用UNION ALL,我们将这两个查询的结果合并在一起,从而避免了在WHERE子句中使用OR可能导致的性能问题。

案例介绍

以下是一个优化后的示例,它展示了如何使用UNION ALL来替代OR连接条件,从而提高查询效率:

SELECT id FROM t WHERE num = 10
UNION ALL
SELECT id FROM t WHERE num = 20;

在这个例子中,我们分别执行了两个独立的查询,每个查询都针对num字段的不同值进行筛选。由于这两个查询都是基于索引字段(假设num字段已经被索引),因此它们都可以高效地利用索引来检索数据。

注意,当使用UNION(或UNION ALL)时,确保每个查询选择的列具有相同的数量、类型和顺序,以便能够正确合并结果集。此外,如果可能的话,尽量使用UNION ALL而不是UNION,因为UNION ALL不会尝试消除结果集中的重复行。

(5)优化查询性能:合理使用BETWEEN替代IN以避免全表扫描

在编写SQL查询时,INNOT IN 关键字虽然强大且灵活,但如果不谨慎使用,可能会导致性能下降,尤其是在处理大数据集时

INNOT IN列表中的元素过多时,数据库引擎可能会放弃使用索引,转而进行全表扫描,这会显著增加查询的响应时间。

优化方向

优化查询性能,当查询条件涉及连续的数值范围时,我们应优先使用BETWEEN关键字。BETWEEN能够明确地指定一个数值范围,数据库引擎可以高效地利用索引来检索这个范围内的数据,从而避免全表扫描。

案例介绍

优化后的示例,展示了如何使用BETWEEN关键字来替代IN,以提高查询性能:

SELECT id FROM t WHERE num BETWEEN 1 AND 3;

查询将返回表tnum字段值在1到3(包括1和3)之间的所有记录的id。通过使用BETWEEN,我们确保了数据库引擎能够高效地使用索引(如果num字段上有索引的话),从而显著提高了查询的响应速度。

我们应该尽量避免在WHERE子句中使用过多的INNOT IN关键字,尤其是当列表中的元素过多时。对于连续的数值范围,我们应该优先使用BETWEEN关键字,以提高查询性能并减少全表扫描的可能性。

注意:特此声明:本文章首发文章在掘金:https://juejin.cn/post/7363549357410795559,未经允许,请勿进行侵权私自转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/590447.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

零基础学习数据库SQL语句之操作表中数据的DML语句

我们的数据库是根据页面原型和相关需求完成相关开发的 在表中添加数据 删除数据 修改数据 添加数据 页面模型 当点击保存的时候就能将表单数据提交到服务端 服务端将数据添加到数据库 我们要用insert语句 将数据添加到数据库中 代码演示 CREATE DATABASE Dduo; USE Dduo…

数据库(MySQL)—— 多表查询

数据库&#xff08;MySQL&#xff09;—— 多表查询 多表关系一对多多对多一对一多表查询概述数据准备查询形式笛卡尔积 分类连接查询内连接外连接左外连接右外连接 自连接联合查询 今天我们来进入MySQL中一个非常重要的部分&#xff1a;多表查询&#xff1a; 多表关系 多表关…

生产看板:最直观的车间管理方式之一,是马是马户牵出来溜溜。

可视化生产看板在组织工业生产中扮演着重要的角色&#xff0c;它可以提供实时的信息和可视化的数据&#xff0c;帮助团队和管理层更好地监控和管理生产过程。 以下是可视化生产看板在组织工业生产中的作用&#xff1a; 实时监控&#xff1a;可视化生产看板可以显示实时的生产数…

Spring - 10 ( 9000 字 Spring 入门级教程 )

一&#xff1a;MyBatis 进阶 动态 SQL 是 Mybatis 的强大特性之⼀&#xff0c;能够完成不同条件下不同的 sql 拼接。 1.1 if 标签 在注册用户的时候&#xff0c;可能会有这样⼀个问题&#xff0c;如下图所示&#xff1a; 注册分为两种字段&#xff1a;必填字段和非必填字段&…

原创字幕雨技术,二次剪辑混剪搬运短视频必备,轻松过原创

原创字幕雨素材教程&#xff0c;教你如何制作自己专属的字幕雨&#xff0c; 把素材运营到自己的二次剪辑&#xff0c;提升二创短视频的原创度&#xff0c; 帮助你做搬运或者短视频运营&#xff0c;轻松过原创。 课程目录&#xff1a; 1&#xff1a;什么是字幕雨 2&#xf…

FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

【c++】继承学习(一):继承机制与基类派生类转换

&#x1f525;个人主页&#xff1a;Quitecoder &#x1f525;专栏&#xff1a;c笔记仓 朋友们大家好&#xff0c;本篇文章我们来学习继承部分 目录 1.继承的概念和定义继承的定义继承基类成员的访问方式变化 2.基类和派生类对象赋值转换3.继承中的作用域 1.继承的概念和定义 …

webpack基础---常用loader

webpack 命令式和配置文件 html-webpack-plugin 配置项&#xff1a;{ templete: filename: inject: } 清除上次打包的文件&#xff0c;output: { clear: true } mode选项&#xff1a; none development prodution souce-map&#xff1a;可以精准定位代码行数 { devt…

使用node调用chrome(基于selenium-webdriver包)

下载测试版chrome和chromedriver https://googlechromelabs.github.io/chrome-for-testing/ 把chromedriver复制到chrome的文件里 设置环境变量 编写代码 const { Builder, Browser, By, Key, until } require(selenium-webdriver) const puppeteer require(puppeteer)//查…

Flask模版详解

Flask模版详解 概述Jinja2模板引擎渲染模版的步骤变量控制结构自定义错误页面链接静态文件 概述 模板是一个包含响应文本的文件&#xff0c;其中包含用占位变量表示的动态部分&#xff0c;其具体值只在请求的上下文中才能知道。使用真实值替换变量&#xff0c;再返回最终得到的…

空闲缓冲区(empty) 和 非空缓冲区(full) 的的概念和区别【操作系统 生产者——消费者进程】

首先&#xff0c;我们得有个环境——通常是个缓冲池&#xff0c;这个池子里可以塞很多缓冲区&#xff0c;它们是用来存放数据的。生产者就是那个不停造东西的家伙&#xff0c;而消费者则是等着用这些东西的人。 1. 空闲缓冲区&#xff08;empty&#xff09;&#xff1a; 这玩意…

C语言:文件操作(上)

片头 嗨&#xff01;小伙伴们&#xff0c;今天我们来学习新的知识----文件操作&#xff0c;准备好了吗&#xff1f;我要开始咯! 目录 1. 为什么使用文件&#xff1f; 2. 什么是文件&#xff1f; 3. 二进制文件和文本文件&#xff1f; 4. 文件的打开和关闭 5. 文件顺序读写…

硬盘选购指南

转载请注明出处&#xff01; author karrysmile date 2024年5月3日19:10:52 结论 先给用途分类和价格表 前置知识 没有不好的品牌&#xff0c;只有不好的系列。不用认准哪个品牌就不好&#xff0c;认准口碑好&#xff0c;稳定性好的系列买。&#xff08;杂牌别买&#xff0…

系统架构设计师错题集

在实时操作系统中&#xff0c;两个任务并发执行&#xff0c;一个任务要等待另一个任务发来消息&#xff0c;或建立某个条件后再向前执行&#xff0c;这种制约性合作关系被称为任务的&#xff08;9&#xff09;。 (9)A.同步 B.互斥 C.调度 D.执行 【答案】A 【解析】本题考查…

2024年北京高校后勤餐饮博览会|北京餐饮展览会

高联采高校后勤餐饮博览会 暨第25届北京高校后勤餐饮联合招标采购大会 同期举办&#xff1a;中国北京餐饮供应链博览会 主 题&#xff1a; 因为FOOD校园GOOD / 同创高校大舞台共享精彩高联采 时 间&#xff1a;2024年9月21日-22日 地 点&#xff1a;中国国际展览中心&…

基于深度学习的3D目标检测与跟踪

目标检测和跟踪对于自动驾驶来说是至关重要和基础的任务&#xff0c;旨在从场景中识别和定位出那些预定义类别的对象。在所有形式的自动驾驶数据中&#xff0c;3D点云学习引起了越来越多的关注。目前&#xff0c;有许多用于3D目标检测的深度学习方法。然而&#xff0c;鉴于点云…

Java——数组

一&#xff1a;数组 &#xff08;1&#xff09;数组的定义&#xff08;声明&#xff09;&#xff1a; 数据类型 [ ] 数组名 int [ ] a (比较规范) ; int [ ] a ; int a [ ] &#xff08;我个人常用&#xff09;; &#xff08;2&#xff…

(4)传输层

1.TCP/UDP区别 2.TCP流量控制P60 3.TCP拥塞控制P61 实际曲线尽量接近理想曲线 4.TCP超时重传时间的选择P62 5.TCP可靠传输的实现P63 6.TCP连接管理 建立 释放 7.TCP报文段的首部格式P66

LeetCode题练习与总结:柱状图中最大的矩形--84

一、题目描述 给定 n 个非负整数&#xff0c;用来表示柱状图中各个柱子的高度。每个柱子彼此相邻&#xff0c;且宽度为 1 。 求在该柱状图中&#xff0c;能够勾勒出来的矩形的最大面积。 示例 1: 输入&#xff1a;heights [2,1,5,6,2,3] 输出&#xff1a;10 解释&#xff1a…

【分布式系统】FLP、CAP、BASE、ACID理论简介

分布式系统一致性模型 在说FLP&#xff0c;CAP&#xff0c;BASE&#xff0c;ACID理论前&#xff0c;必须先说说分布式系统的一致性模型&#xff0c;它是其他理论的基础知识。 依次介绍几个相关的概念&#xff1a; 分布式系统是由多个不同的服务节点组成&#xff0c;节点与节…