删除变慢问题

问题: 有一个场景,每天都会删除数据,SQL为delete from xxx where record_date < DATE_SUB(now(), INTERVAL ? DAY) limit 1000 ,一直循环执行,当执行到最后一次满足条件的时候,就会很慢

原理分析

  1. 索引与数据分布

    • 如果 record_date 字段没有索引,数据库在执行 DELETE 语句时需要进行全表扫描(Full Table Scan),以找到满足 record_date < DATE_SUB(now(), INTERVAL ? DAY) 条件的记录。

    • 随着数据逐步删除,剩余的数据量减少,但数据库仍然需要扫描整个表(或索引)来找到符合条件的记录,尤其是在数据分布不均匀的情况下,查询效率会显著下降。

  2. 删除操作的内部机制

    • 删除操作不仅会删除数据,还会更新索引、写入事务日志(如MySQL的undo log和redo log),并可能触发锁机制(如行锁或表锁)。

    • 当删除操作接近尾声时,数据库可能需要处理更多的索引维护和日志写入操作,导致性能下降。

  3. 数据碎片化

    • 频繁的删除操作会导致数据页(Data Page)出现碎片化,数据库在查询时需要扫描更多的数据页来找到符合条件的记录,从而降低查询效率。

  4. 查询优化器的行为

    • 数据库的查询优化器可能会根据统计信息调整执行计划。当数据量减少到一定程度时,优化器可能会选择不同的执行计划(如从索引扫描切换到全表扫描),导致性能下降。


优化建议

  1. 添加索引

    • 确保 record_date 字段上有索引(如单列索引或组合索引),以加速条件过滤。例如:

      sql

      CREATE INDEX idx_record_date ON xxx(record_date);
    • 如果表中有其他常用查询条件,可以考虑创建组合索引。

  2. 分批删除优化

    • 使用主键或唯一键进行分批删除,避免全表扫描。例如:

      sql

      DELETE FROM xxx WHERE id IN (
          SELECT id FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY) LIMIT 1000
      );
    • 这种方法可以利用索引快速定位需要删除的记录,减少扫描范围。

  3. 分区表

    • 如果数据量非常大,可以考虑使用分区表(Partitioning),按时间(如按天、按月)对数据进行分区。删除过期数据时,直接删除整个分区,效率会显著提升。例如:

      sql

      ALTER TABLE xxx DROP PARTITION p20230101;
  4. 优化删除逻辑

    • 在删除操作前,先查询符合条件的记录数量,避免无意义的扫描。例如:

      sql

      SELECT COUNT(*) FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY);
    • 如果剩余数据量较少,可以一次性删除,避免多次循环。

  5. 定期优化表

    • 删除操作会导致数据碎片化,定期执行表优化(如 OPTIMIZE TABLE)可以整理数据页,提升查询性能。例如:

      sql

      OPTIMIZE TABLE xxx;
  6. 调整事务大小

    • 如果删除操作涉及大量数据,可以将删除操作拆分为多个小事务,避免长时间锁定表和占用过多日志空间。例如:

      sql

      START TRANSACTION;
      DELETE FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY) LIMIT 1000;
      COMMIT;
  7. 使用归档表

    • 将需要删除的数据先移动到归档表,再从归档表中删除。这种方法可以减少对主表的操作压力。例如:

      sql

      INSERT INTO xxx_archive SELECT * FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY);
      DELETE FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY);

执行计划分析

您可以通过 EXPLAIN 命令查看 DELETE 语句的执行计划,重点关注以下内容:

  • type:查询类型,如 index(索引扫描)或 ALL(全表扫描)。

  • rows:扫描的行数,如果值过大,说明查询效率较低。

  • key:使用的索引,如果没有使用索引,可能需要优化索引设计。

例如:

sql

EXPLAIN DELETE FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY) LIMIT 1000;

总结

删除操作变慢的原因主要与索引缺失、数据碎片化、查询优化器行为以及删除操作的内部机制有关。通过添加索引、优化删除逻辑、使用分区表等方法,可以显著提升删除操作的效率。如果数据量非常大,建议结合归档表和分区表的设计,进一步优化数据清理任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/980712.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

在 Mac 上使用 Docker 安装宝塔并部署 LNMP 环境

前言 只因为在mac上没有找到合适的PHP开发集成环境&#xff0c;之前有安装了Eserver&#xff0c;但是安装一些常用PHP扩展有时候还是需要手动去编译添加。phpStudy也没有找到适合Mac的版本&#xff0c;在后面安装了Parallels Desktop虚拟机 来运行Ubuntu系统搭建了一套LNMP环境…

Node.js二:第一个Node.js应用

精心整理了最新的面试资料和简历模板&#xff0c;有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 创建的时候我们需要用到VS code编写代码 我们先了解下 Node.js 应用是由哪几部分组成的&#xff1a; 1.引入 required 模块&#xff1a;我们可以使用 requi…

Excel基础(详细篇):总结易忽视的知识点,有用的细节操作

目录 基础篇Excel主要功能必会快捷键LotusExcel的文件类型工作表基本操作表项操作选中与缩放边框线 自动添加边框线格式刷设置斜线表头双/多斜线表头不变形的:双/多斜线表头插入多行、多列单元格/行列的移动冻结窗口 方便查看数据打印的常见问题Excel格式数字格式日期格式文本…

vue3:四嵌套路由的实现

一、前言 1、嵌套路由的含义 嵌套路由的核心思想是&#xff1a;在某个路由的组件内部&#xff0c;可以定义子路由&#xff0c;这些子路由会渲染在父路由组件的特定位置&#xff08;通常是 <router-view> 标签所在的位置&#xff09;。通过嵌套路由&#xff0c;你可以实…

【实战篇】【深度解析DeepSeek:从机器学习到深度学习的全场景落地指南】

一、机器学习模型:DeepSeek的降维打击 1.1 监督学习与无监督学习的"左右互搏" 监督学习就像学霸刷题——给标注数据(参考答案)训练模型。DeepSeek在信贷风控场景中,用逻辑回归模型分析百万级用户数据,通过特征工程挖掘出"凌晨3点频繁申请贷款"这类魔…

【Python 数据结构 2.时间复杂度和空间复杂度】

Life is a journey —— 25.2.28 一、引例&#xff1a;穷举法 1.单层循环 所谓穷举法&#xff0c;就是我们通常所说的枚举&#xff0c;就是把所有情况都遍历了的意思。 例&#xff1a;给定n&#xff08;n ≤ 1000&#xff09;个元素ai&#xff0c;求其中奇数有多少个 判断一…

计算机毕业设计SpringBoot+Vue.js社区智慧养老监护管理平台(源码+文档+PPT+讲解)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…

西北工业大学计算机复试上机真题

西北工业大学计算机复试上机真题 历年西北工业大学计算机复试上机真题 西北工业大学计算机考研复试上机真题 2023西北工业大学计算机复试上机真题 2022西北工业大学计算机复试上机真题 在线评测地址&#xff1a;传送门 数组排序 题目描述 一组整数&#xff0c;由小到大排序…

kafka-web管理工具cmak

一. 背景&#xff1a; 日常运维工作中&#xff0c;采用cli的方式进行kafka集群的管理&#xff0c;还是比较繁琐的(指令复杂&#xff1f;)。为方便管理&#xff0c;可以选择一些开源的webui工具。 推荐使用cmak。 二. 关于cmak&#xff1a; cmak是 Yahoo 贡献的一款强大的 Apac…

数据结构(初阶)(七)----树和二叉树(堆,堆排序)

八&#xff0c;树与二叉树 树 概念与结构 树是⼀种⾮线性的数据结构&#xff0c;它是由 n&#xff08;n>0&#xff09; 个有限结点组成⼀个具有层次关系的集合。把它叫做树是因为它看起来像⼀棵倒挂的树&#xff0c;也就是说它是根朝上&#xff0c;⽽叶朝下的。 • 有⼀…

数据集笔记:新加坡 地铁(MRT)和轻轨(LRT)票价

数据连接 data.gov.sg 2024 年 12 月 28 日起生效的新加坡地铁票价 该数据集包含 MRT 和 LRT 票价的信息&#xff0c;包括&#xff1a; 票价类型&#xff08;Fare Type&#xff09;&#xff1a;成人票、学生票、老年人票、残障人士票等。适用时间&#xff08;Applicable Tim…

常用的AI文本大语言模型汇总

AI文本【大语言模型】 1、文心一言https://yiyan.baidu.com/ 2、海螺问问https://hailuoai.com/ 3、通义千问https://tongyi.aliyun.com/qianwen/ 4、KimiChat https://kimi.moonshot.cn/ 5、ChatGPThttps://chatgpt.com/ 6、魔塔GPT https://www.modelscope.cn/studios/iic…

GPIO概念

GPIO通用输入输出口 在芯片内部存在多个GPIO&#xff0c;每个GPIO用于管理多个芯片进行输入&#xff0c;输出工作 引脚电平 0v ~3.3v&#xff0c;部分引脚可容任5v 输出模式下可控制端口输出高低电平&#xff0c;可以驱动LED&#xff0c;控制蜂鸣器&#xff0c;模拟通信协议&a…

论文笔记-NeurIPS2017-DropoutNet

论文笔记-NeurIPS2017-DropoutNet: Addressing Cold Start in Recommender Systems DropoutNet&#xff1a;解决推荐系统中的冷启动问题摘要1.引言2.前言3.方法3.1模型架构3.2冷启动训练3.3推荐 4.实验4.1实验设置4.2在CiteULike上的实验结果4.2.1 Dropout率的影响4.2.2 实验结…

在 Mac mini M2 上本地部署 DeepSeek-R1:14B:使用 Ollama 和 Chatbox 的完整指南

随着人工智能技术的飞速发展&#xff0c;本地部署大型语言模型&#xff08;LLM&#xff09;已成为许多技术爱好者的热门选择。本地部署不仅能够保护隐私&#xff0c;还能提供更灵活的使用体验。本文将详细介绍如何在 Mac mini M2&#xff08;24GB 内存&#xff09;上部署 DeepS…

530 Login fail. A secure connection is requiered(such as ssl)-java发送QQ邮箱(简单配置)

由于cs的csdN许多文章关于这方面的都是vip文章&#xff0c;而本文是免费的&#xff0c;希望广大网友觉得有帮助的可以多点赞和关注&#xff01; QQ邮箱授权码到这里去开启 授权码是16位的字母&#xff0c;填入下面的mail.setting里面的pass里面 # 邮件服务器的SMTP地址 host…

经验分享:用一张表解决并发冲突!数据库事务锁的核心实现逻辑

背景 对于一些内部使用的管理系统来说&#xff0c;可能没有引入Redis&#xff0c;又想基于现有的基础设施处理并发问题&#xff0c;而数据库是每个应用都避不开的基础设施之一&#xff0c;因此分享个我曾经维护过的一个系统中&#xff0c;使用数据库表来实现事务锁的方式。 之…

【 实战案例篇三】【某金融信息系统项目管理案例分析】

大家好,今天咱们来聊聊金融行业的信息系统项目管理。这个话题听起来可能有点专业,但别担心,我会尽量用大白话给大家讲清楚。金融行业的信息系统项目管理,说白了就是如何高效地管理那些复杂的IT项目,确保它们按时、按预算、按质量完成。咱们今天不仅会聊到一些理论,还会通…

爬虫系列之发送请求与响应《一》

一、请求组成 1.1 请求方式&#xff1a;GET和POST请求 GET:从服务器获取&#xff0c;请求参数直接附在URL之后&#xff0c;便于查看和分享&#xff0c;常用于获取数据和查询操作 POST&#xff1a;用于向服务器提交数据&#xff0c;其参数不会显示在URL中&#xff0c;而是包含在…

最新最详细的配置Node.js环境教程

配置Node.js环境 一、前言 &#xff08;一&#xff09;为什么要配置Node.js&#xff1f;&#xff08;二&#xff09;NPM生态是什么&#xff08;三&#xff09;Node和NPM的区别 二、如何配置Node.js环境 第一步、安装环境第二步、安装步骤第三步、验证安装第四步、修改全局模块…