MySQL 空间碎片详解

文章目录

    • 前言
    • 1. 空间碎片如何产生
    • 2. 空间碎片如何查看
    • 3. 空间碎片如何回收
    • 后记

前言

MySQL 数据库在运行过程中,随着时间的推移,可能会出现空间碎片的问题。空间碎片是指数据库表中不再使用的空间,但由于各种原因,这些空间并没有被有效地回收和再利用,从而导致数据库文件占用的磁盘空间比实际存储的数据要大。

1. 空间碎片如何产生

MySQL InnoDB 引擎中,删除一条记录分为两种情况,一种称为删除标记(delete mark)仅在记录头部中设置 DELETED_FLAG 标记,记录链中依然保留该记录。另一种是真正删除,将记录从记录链中移除,记录占用的空间可被重用。

如下图,Record 2 被 delete mark 后,还在记录链表中。这行记录占用的空间可以理解为是空间空洞,空间空洞多起来就成为空间碎片。
在这里插入图片描述

上图来源于:YunChe MySQL 运维实战 系列文章。

标记删除导致的空间空洞,会被重新利用,但是依然可能会造成空间浪费。

如果页面内的未使用空间不足,无法容纳新插入的数据,但是碎片空间中有足够的空间,则可以对页面进行碎片回收后,再插入新的数据。碎片回收时,会先在内存中申请一个空闲页面,将存在碎片空间的旧页面中的记录依次插入到新页面,然后释放旧页面。

被动触发空间碎片回收条件,是页面空间碎片中有足够的空间,可以容纳新插入的记录,那如果无法容纳,就需要新申请页面。在大规模连续删除过的数据的表上,写入数据时,表空间可能不会明显增长或者不会增长。

除了 Delete 会产生空间空洞外,Update 语句也会引起空间空洞问题,比如修改 varchar 变长字符串类型字段,改短一些的时候就会出现非常小的空洞,改长的话就有可能因为页面空间不足,导致把 Record 迁移到其他页面中去。

2. 空间碎片如何查看

MySQL 系统表中,可以查看空间碎片情况。下方 SQL 是统计库粒度空间统计信息,其中 FREE_MB 为空间碎片大小。

SELECT TABLE_SCHEMA,
       round(SUM(data_length + index_length + DATA_FREE) / 1024 / 1024, 2) AS TOTAL_MB,
       round(SUM(data_length) / 1024 / 1024, 2)                            AS DATA_MB,
       round(SUM(index_length) / 1024 / 1024, 2)                           AS INDEX_MB,
       round(SUM(DATA_FREE) / 1024 / 1024, 2)                              AS FREE_MB,
       COUNT(*)                                                            AS TABLES
FROM INFORMATION_SCHEMA.tables
WHERE TABLE_SCHEMA NOT IN ('sys', 'mysql', 'INFORMATION_SCHEMA', 'performance_schema')
GROUP BY TABLE_SCHEMA
ORDER BY 2 DESC;

下方为查看指定库和指定表,空间使用情况的 SQL 语句。其中 FREE_MB 表示碎片大小 FREE_PCT 表示碎片率。

SELECT TABLE_SCHEMA,
       TABLE_NAME,
       round((data_length + index_length + DATA_FREE) / 1024 / 1024, 2) AS TOTAL_MB,
       round(data_length / 1024 / 1024, 2)                              AS DATA_MB,
       round(index_length / 1024 / 1024, 2)                             AS INDEX_MB,
       round(DATA_FREE / 1024 / 1024, 2)                                AS FREE_MB,
       CONCAT(ROUND(DATA_FREE / data_length, 2), ' %')                  AS FREE_PCT
FROM INFORMATION_SCHEMA.tables
WHERE TABLE_SCHEMA = '数据库名'
  and TABLE_NAME = '表名'
ORDER BY TOTAL_MB DESC;

3. 空间碎片如何回收

MySQL 中可以使用下方命令回收空间碎片,支持 online DDL。

ALTER TABLE tbl_name ENGINE=INNODB;

表中碎片多大需要回收呢?这里提供一个参考标准:单表大于 6G 且碎片率大于 30% 需要清理空间碎片。

Tips: 空间碎片回收,是一个代价比较高的操作,虽然支持 Online DDL,但是依然会带来额外的负载,建议业务低峰执行。如果是一套 MySQL 集群,需要注意主从延迟问题。

对于一些需要周期删除的日志表,可以使用 MySQL 中的分区表来管理,需要清理一批数据的时候,可以用 partition truncate 的方式进行清理,磁盘空间也能直接释放掉。

后记

总结一下,InnoDB 引擎中 Delete 和 Update 都会产生空间空洞,积累起来就会出现空间碎片问题,MySQL 有对应的回收算法让空间空洞会重新利用起来,但是很难保证充分利用。空间碎片可以使用重建表的方式进行回收。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/433982.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux 下安装 Git

Linux 下安装 Git 1 参考2 安装2.1 通过 yum方式安装(不推荐)2.2 通过源码编译安装(推荐) 3 配置SSH 1 参考 Linux 下安装 Git 2 安装 2.1 通过 yum方式安装(不推荐) 在Linux上安装git仅需一行命令即可…

[R] How to communicate with your data? - ggplot2

We have gone through the basic part of how to clean and process before analyzing your data. How to communicate with your data? R语言具有生成各种图形的多种可能性。 并非所有图形功能对初学者来说都是必要的。 复杂的图形需要长代码。 我们将从简单的图形元素开…

基于SSM的医院挂号系统

1 引言 1.1 课题背景及意义 社会发展迅速,以往的管理方式已经满足不了人们对获得信息的方式、方便快捷的需求。医院门诊挂号系统慢慢的被人们关注。网上获取信息十分的实时、便捷,只要系统在线状态,无论在哪里都能第一时间查找到理想的信息…

深度解析速卖通商品详情API:Python实战与高级技术探讨

速卖通商品详情API接口实战:Python代码示例 一、准备工作 在开始之前,请确保你已经完成了以下步骤: 在速卖通开放平台注册账号并创建应用,获取API密钥。阅读速卖通商品详情API接口的文档,了解接口的使用方法和参数要…

静态住宅代理IP如何选?这5点最重要

静态住宅代理IP,是一种在网络通信过程中提供固定IP地址的代理服务。与动态代理IP相比,静态代理IP提供的是持久且不变的IP地址。这种稳定性使得静态代理IP在需要长期稳定网络身份的场景中,如跨境电商/社媒养号、网络监控、品牌保护、长期数据爬…

人力资源管理软件大比拼:这篇文章帮你做出明智选择!

本期为您盘点的助力现代企业强力提效的人力资源管理软件有:Zoho People,Workday,BambooHR和Namely。 Zoho People人力资源管理软件 Zoho People是一款全面的云端人力资源管理(HRM)软件,由Zoho Corporation…

Android开发工程师面试题,2024年Android开发陷入饱和

前言 马上快到金三银四都春招阶段了,在这本就是跳槽、找工作的年后黄金时间,大多数求职者都早早做好年后求职的准备,其中不乏有年前早早辞了工作准备年后跳槽的有经验的职场老人们,也有一批即将毕业的应届毕业生的职场新人们。 …

软件测试需求分析如何编写?为什么要进行测试需求分析?

在软件开发的过程中,软件测试需求分析是至关重要的一个环节。测试需求分析是指对待测软件的需求进行全面细致的分析,明确软件测试的目标和范围,为测试活动的进行提供指导。通过对软件需求的详细分析,可以确保测试人员清楚了解软件…

diffusion model (扩散模型)原理

扩散模型分为正向过程和反向过程。 正向过程为一点点在图片上添加噪声的过程,反向过程为去噪声的过程。 图片的生成就是反向过程,给一张高斯噪声图片,逐步去噪生成图片。 扩散模型和VAE的区别, VAE是一步到位的(通过…

7大必备应用推荐,为你的 Nextcloud 实例增添更多效率功能

适用于 Linux 的开源云存储软件有很多,ownCloud、Seafile 和 Pydio 只是其中的几个。 不过,如果您非常重视安全问题,并希望完全掌管您的数据,可以选择​Nextcloud并将其安装到您的服务器上。​ Nextcloud 是一个基于 PHP 的开源安…

NetOps-Python实现网络设备SFTP配置

一、网络设备文件管理 1、基本概念 ①配置文件 网络设备配置文件是命令的集合。 ②作用 用户将当前配置保存到配置文件中,以便设备重启后,这些配置能够继续生效。通过配置文件,用户可以非常方便地查阅配置信息将配置文件下载到本地设备&…

【DevSecOps】你的应用真的安全吗?

【DevSecOps】你的应用真的安全吗? 由于当今一切都运行在云计算上,并依靠互连系统来提供尖端的业务服务,以满足客户永无止境的需求,因此企业需要采用最先进的技术来保持活力也就不足为奇了,以此来领先于他们的竞争对手。 这种需求不仅需要创新服务,还需要快速开发和更快…

腾讯云服务器CVM_云主机_云计算服务器_弹性云服务器

腾讯云服务器CVM提供安全可靠的弹性计算服务,腾讯云明星级云服务器,弹性计算实时扩展或缩减计算资源,支持包年包月、按量计费和竞价实例计费模式,CVM提供多种CPU、内存、硬盘和带宽可以灵活调整的实例规格,提供9个9的数…

OPENWRT本地局域网模拟域名多IP

本地配置MINIO服务时,会遇到域名多IP的需求。当某一个节点失效时,可以通过域名访问平滑过渡到其它的节点继续服务。 【MINIO搭建过程略】 搭建完毕后,有4个节点,对应的docker搭建命令: docker run --nethost --rest…

通过vue ui创建项目

确认前端环境都安装好之后 打开黑窗口 输入 vue ui 会打开一个vue的网页 在此创建项目 可以选择在那个路径创建 这是我的项目配置 这里是选择vue版本 我要用的是vue2 选好点击创建项目就好了 创建好后的重点的目录结构以及结构的作用 启动前端工程 将创建好的项目导入编译器 我…

141.乐理基础-男声女声音域、模唱、记谱与实际音高等若干问题说明

上一个内容:140.乐理基础-音程的转位-CSDN博客 上一个内容练习的答案:红色箭头指向的是转为,比如第一个只要写成c低g高都是正确的,不一定非要和图中一样 首先在 12.音域、1C到底是那一组的C 里面写了人声的音域,大致默…

Sui推出项目提案申请RFP计划资助开发者

近日,Sui推出了对其资助分配流程的重大改进:引入了项目提案申请(Request for Proposals,RFP)计划。这个新计划扩展了支持增长Sui生态创新项目的途径,是Sui资助计划的重大发展。 为什么要采用RFP流程&#…

uniapp封装统一请求(get和post)

uniapp封装请求 request.js文件 import Vue from vue // 全局配置 import settings from ./settings.js function computedBaseUrl(url) {// console.log(url);return (url.indexOf(http) -1 ? settings.baseUrl : ) url }// 发送请求 export default (options) > {const…

SpringBoot中集成LiteFlow(轻量、快速、稳定可编排的组件式规则引擎)实现复杂业务解耦、动态编排、高可扩展

场景 在业务开发中,经常遇到一些串行或者并行的业务流程问题,而业务之间不必存在相关性。 使用策略和模板模式的结合可以解决这个问题,但是使用编码的方式会使得文件太多, 在业务的部分环节可以这样操作,在项目角度就无法一眼洞…

【教程】无法验证app需要互联网连接以验证是否信任开发者

摘要 本文将探讨在使用苹果App时遇到无法验证开发者的情况,以及用户可以采取的解决方案。通过检查网络连接、重新操作、验证描述文件等方式来解决无法验证开发者的问题。同时,还介绍了开发者信任设置的步骤,以及使用appuploader工具进行安装…