【MySQL变更】gh-ost原理解读

gh-ost简介

gh-ost是处理MySQL在线表结构变更的工具,与pt-osc 不同,gh-ost不会使用触发器。

gh-ost 可以进行测试,暂停,动态控制和重新配置,审计还有其他许多操作perks。

命名

最初它被命名为gh-osc:GitHub Online Schema Change,

后来将c变为tgh-ost(发音:Ghost),代表 GitHub 的 Online Schema Transmogrifier/Translator/Transformer/Transfigurator

原理简介

所有现有的在线表结构变更工具都以相似的的原理:它们创建一个与原始表结构相同的幽灵表,在该表为空时进行表结构变更,缓慢并增量地将数据从原始表复制到幽灵表,同时将正在进行的更改(任何INSERT, DELETE,UPDATE应用于源表)应用到幽灵表。最后,在适当的时候,他们用幽灵表替换原表。

gh-ost使用相同的模式。然而,它与所有现有工具的不同之处在于不使用触发器。因为触发器是许多限制和风险的来源。

gh-ost 使用二进制日志流来捕获表数据变化,并将它们异步应用到ghost表上。gh-ost承担其他工具留给数据库执行的一些任务。因此,gh-ost可以更好地控制迁移过程;可以真正暂停它;可以真正将 migration 的写入负载与 master 的工作负载解耦。

此外,它还提供许多操作优势,使其更安全、更值得信赖且使用起来更有趣。

亮点

  • 可以在从库上进行测试 ,从而建立你对gh-ost的信任。gh-ost在从库上表结构变更的过程和主库相同,并不会真正的替换原表。这样在从库上就会保留原始表与幽灵表,你可以对比统计两张表的数据从而验证工具操作的正确性。这也是我们如何在生产环境测试gh-ost的方法
  • 真正的暂停 。当gh-ost throttles时,它真正停止在 master 上写入:没有行的拷贝,也没有正在进行事件的处理。通过节流,您可以将 master 恢复到其原始工作负载
  • 动态控制。您可以交互式重新配置gh-ost,即使迁移仍在运行。您可以强行启动节流。
  • 审计。您可以查询gh-ost状态。gh-ost监听 unix 套接字或 TCP。
  • 控制切换时刻。gh-ost可以使用指示推迟可能是最有风险的步骤:交换原始表与幽灵表的表名称。直到您可以舒适地使用。也无需担心预计的切换时间不在办公时间。
  • gh-ost可以使用外部钩子脚本。

用法

  • noop迁移(仅测试迁移是否有效且可以进行)
  • 一个真正的迁移,利用一个副本(迁移在主服务器上运行;gh-ost找出所涉及的服务器的身份。如果您的主服务器使用基于语句的复制,则需要模式)
  • 在 master 上运行真正的迁移,(但gh-ost更喜欢前者)
  • 在从库上进行真正的迁移(master未受影响)
  • 在从库上进行测试迁移,这是您与的操作建立信任的方式。

更多提示

  • --exact-rowcount 准确的进度指示
  • --postpone-cut-over-flag-file 控制切换时间
  • 更多交互式 参考 :交互式命令

基于触发器变更的弊端

  • 负载 对于原始表的每个INSERT, DELETE,UPDATE需要在幽灵表/影子表上回放,另外还有触发器的本身的代价。
  • 锁 锁竞争问题
  • 没有真正的暂停 比如 pt-osc 只能暂停全量的同步,不能暂停触发器的复制
  • 没有生产的测试
  • 对于多个变更(不同表)的支持
  • bound to server

更详细的解读 参考 :https://github.com/github/gh-ost/blob/master/doc/why-triggerless.md

无触发器的设计

pt-online-schema-change 在原始表创建三个触发器 (AFTER INSERT, AFTER UPDATE, AFTER DELETE) ,触发器的操作与原表的操作在同一事务中

基于无触发器的异步迁移

gh-ost的无触发设计采用异步方法。但是它不需要触发器,因为它不需要像 Facebook ost 工具那样有一个变更日志表。它不需要变更日志表的原因是它在另一个地方找到变更日志:二进制日志。

特别是,它读取基于行的复制 (RBR) 条目(您仍然可以将它与基于语句的复制一起使用!)并搜索适用于原始表的条目。

RBR 条目对于这项工作非常方便:它们将复杂的语句(可能是多表)分解为不同的、每表、每行的条目,这些条目易于阅读和应用。

gh-ost伪装为一个 MySQL 从副本:它连接到 MySQL 服务器并开始请求 binlog 事件,就好像它是一个真正的从副本一样。因此,它获得二进制日志的连续流,并过滤掉适用于原始表的那些事件。

gh-ost可以直接连接到主服务器,但更建议连接到主服务器的从副本之一。副本需要设置参数:log-slave-updates和binlog-format=ROW(gh-ost可以此设置)。

从二进制日志中读取,特别是在副本上读取二进制日志的情况,进一步强调了算法的异步性质。虽然事务可能(基于配置)与 binlog 条目写入同步,但它需要时间gh-ost- 假装是副本 - 会收到通知,将事件复制到下游并应用它。

异步设计意味着许多值得注意的结果,稍后将讨论。

工作流程

流程图

该工作流程包括从服务器读取表数据、从二进制日志读取事件数据、检查复制延迟或其他节流参数、将增量的表更应用到服务器(通常是主服务器)、通过二进制日志流发送提示等等。

初始化阶段

  1. 连接到主库或者从库
  2. 预验证 alter语句
  3. 验证权限,表存在
  4. 创建changelog 与 ghost 表(变更日志表与幽灵表)
  5. 对比原始表与幽灵表的结构差异,找到两张表都有的列,都有的唯一索引,验证外键。选择一个都有的唯一索引后续根据该字段对该表进行分块等处理。
  6. 设置binlog监听 开始监听changelog envents
  7. 将good to go 插入到changlog 表
  8. 开始监听原始表DML的二进制日志事件
  9. 读取原始表被选取我的唯一索引最大/最小的值

拷贝阶段

  1. 设置心跳机制:频繁写入 change log 表(我们认为这是低的,出于节流目的可忽略的写入负载)
  2. 持续更新状态
  3. 定期(经常)检查潜在的节流场景或提示
  4. 逐块(chunk)处理原始表的全量数据,将复制任务排队到 ghost 表上
  5. 从binlog中读取 DML 事件,将应用任务排队到 ghost 表
  6. 处理复制任务队列和应用任务队列并依次应用到ghost表 按节流状态暂停
  7. 一旦全表复制完成,注入/拦截“"copy all done”
  8. 存在postpone-cut-over-flag-file文件标识时 ,停止/推迟cut-over(我们继续应用正在进行的 DML)

切换完成阶段

  • 原始表 write lock ,禁止写入
  • 交换原始表与幽灵表名称
  • 清理阶段 删除表

使用要求

gh-ost目前需要 MySQL 5.7 及更高版本。

服务器需要设置参数binlog 格式为 binlog_format=ROW 基于row的复制 与 binlog_row_image=FULL。将来 binlog_row_image=MINIMAL 可能会被支持 

如果是复制的架构,需要变更的表的表结构 在主从上需要完全相同。

账号权限 

  • 对需要变更的表具有一下权限 ALTER, CREATE, DELETE, DROP, INDEX, INSERT, LOCK TABLES, SELECT, TRIGGER, UPDATE 
  • 下面任选其一:
    • SUPER, REPLICATION SLAVE ON *.*,或:
    • REPLICATION CLIENT, REPLICATION SLAVE ON *.*

MySQL需要设置参数 binlog_format=ROW,如果不是row格式,在使用gh-ost时需要指定参数  --switch-to-rbr

无论服务器上设置什么隔离级别, gh-ost连接MySQL服务器时 ,使用 REPEATABLE_READ  事务隔离级别 

使用参数 --test-on-replica 时,在cut-over 阶段之前,gh-ost会停止主从复制,以便于你能比较两个表确认迁移是否正确

限制

外键约束不被支持 

触发器不被支持 

支持MySQL 5.7 JSON 列,但不作为PRIMARY KEY 其一部分

变更前后的 两张表 必须有相同的主键或者唯一索引,当拷贝数据时,这个key 被gh-ost用来迭代循环迭代

迁移用的字段必须不能包含 NULL 的值,意味着:

  • 这个列是 NOT  NULL 或者 这个列 可以为 NULL 但不包含任何 NULL值 
  • 默认情况下 ,如果唯一索引的列包含NULL 值,gh-ost 是 不会运行的。

不能迁移存在另外一张表名相同但是大小不同的表。例如,MyTable 和 MYtable。

Amazon RDS 可以使用给工具,但是有他自己的一些限制

可以兼容谷歌的 RDS ,需要使用参数 --gcp

可以兼容Aliyun 的RDS,但是需要使用参数 --aliyun-rds。

Azure  MySQL数据库 可以使用该工具,但是需要参数 --azure

多源复制 (Multisource) 不被支持,他只能工作只有一个主的时候 (--allow-on-master)

双主模式 (Master-master ) 只有在模式(active-passive)下工作 ,.双写模式 (Active-active ) 不被支持。

如果有一个enum字段作为迁移键的一部分(通常是PRIMARY KEY),则迁移性能将会降低并且可能会很糟糕。

不支持迁移FEDERATED表,并且与gh-ost问题解决无关。

不支持加密二进制日志

ALTER TABLE ... RENAME TO some_other_name 不被支持

常见问题 

cut-over 阶段是如何工作的? 是你真的原子性的吗?

cut-over 阶段 即 原表与 幽灵表交换的阶段  是一个原子的,阻塞的 ,受控的阶段。

Atomic(原子性):老表 与 幽灵表交互表名是一起的。不会存在老表的表名不存在的情况。

Blocking(阻塞的):应用的查询要不对老表进行操作,要不被阻塞,要不继续对新表进行操作。

Controlled(受控的):cut-over的超时时间可以预先定义阈值,超过该时间可以自动终止然后重试, cut-over只有在从库不延迟的情况下进行,

是否可以添加唯一索引?

在确保表中该字段不存在重复数据是可以添加的。

是否可以并发迁移?

可以 ,但是要需要注意添加参数 --replica-server-id

为什么更推荐 Connect to Replica

避免对主库超声额外的负载影响 。gh-ost作为复制客户端连接。每个额外的副本都会给主服务器增加一些负载。

方便监控复制延迟,--max-lag-millis 参数可以监控从副本的延迟

下载 

Release GA release v1.1.6 · github/gh-ost · GitHub

参数解读

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/272292.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

电子电气架构——车载ECU刷写工具vFlash简介

电子电气架构——车载ECU刷写工具vFlash简介 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 没有人关注你。也无需有人关注你。你必须承认自己的价值&a…

12.26 字符指针

一.基本应用 声明一个字符指针,char *ptr 初始化//在定义指针时,可以将它的初位置定义为空,即char *s NULL char *ptr "Hello"; // 指向字符串字面量的指针 char arr[] "World"; // 字符数组 char *ptr2 arr; // 指向字符数组的指针 访问指针指…

ALS-运动系统解构

角色握持 角色蓝图:将物体绑在手上 动作蓝图: 将握持动画截取一帧(explicit time时间写好) 角色替换 在原人物模型下面加一个骨骼体(先不用添加模型),重命名为bodymesh AI使用流程 新建一…

【OAuth2】:赋予用户控制权的安全通行证--代码模拟篇

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于OAuth2的相关操作吧 上篇已经讲了oauth2的相关知识,详解了oauth2的四种授权模式中的授权码模式,那么这一篇我们就来讲一下授权码模式的…

基于5G智能网关的智慧塔吊监测方案

塔吊是建筑施工中必不可少的设施,由于塔吊工作重心高、起重载荷大、人工视距/视角受限等因素,也使得塔吊在工作过程中着较多的危险因素。对此,可以部署基于工业5G智能网关搭建智慧塔吊安全监测系统,实现对塔吊运行的全局精细监测感…

NLP论文阅读记录 - 以大语言模型为参考学习总结

文章目录 前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献 二.相关工作2.1文本生成模型的训练方法2.2 基于LLM的自动评估2.3 LLM 蒸馏和基于 LLM 的数据增强 三.本文方法3.1 Summarize as Large Language Models3.1.1 前提3.1.2 大型语言模型作为参考具有…

随记-语义分割

Semantic Segmentation 什么是语义分割全卷积网络FCN摘要 什么是语义分割 语义分割 Semantic Segmentation 旨在对图像的每个像素进行分类,将其分配给预定义的语义类别。 (检测图像中的物体并按属性分类) 实例分割 Instance Segmentation 实…

一台服务器​最大并发 tcp 连接数多少?65535?

首先,问题中描述的65535个连接指的是客户端连接数的限制。 在tcp应用中,server事先在某个固定端口监听,client主动发起连接,经过三次握手后建立tcp连接。那么对单机,其最大并发tcp连接数是多少呢? 如何标…

HttpClient基础

简介&#xff1a; HttpClient是Apache的一个子项目&#xff0c;可以提供高效的、功能丰富的支持HTTP协议的客户端编程工具包&#xff0c;并且它支持HTTP协议最新的版本和建议。 作用&#xff1a; 发送HTTP请求接收响应数据 使用 导入maven坐标&#xff1a; <dependency&g…

VSLAM:对极几何

文章目录 概要对极约束推导参考概要 透视几何的缺陷是图像深度信息的丢失,如图1所示,根据相似变换关系,视线上的若干平面都映射为成像面上的一个平面。 图1 对极几何是两个透视几何模型间的几何约束关系,主要用于实现基于三角测量的双目立体视觉、深度估计等,对极几何约…

【代码学习】多标签分类 multilabel classfication | loss如何计算? | 衡量指标如何计算?

文章目录 loss计算 | BCELoss(), 最后sigmoid映射为0-1区间值衡量指标计算 sklearn.metrics代码 MultiLabelClassifier /CelebA_Classification_PyTorch_Github.ipynb loss计算 | BCELoss(), 最后sigmoid映射为0-1区间值 gpt解释 import torch import torch.nn as nn# 创建模…

全卷积网络

全卷积网络 全卷积网络就是图像到图像的变换&#xff0c;一般用于语义分割&#xff0c;图像恢复啥的 我们使用Resnet18来进行&#xff0c;最后平均池化和全连接层我们不需要 import torch import torchvision from torch import nn from torch.nn import functional as F fr…

sheng的学习笔记-【中】【吴恩达课后测验】Course 4 -卷积神经网络 - 第四周测验

课程4_第4周_测验题 目录 第一题 1.面部验证只需要将新图片与1个人的面部进行比较&#xff0c;而面部识别则需要将新图片与K个人的面部进行比较。 A. 【  】正确 B. 【  】错误 答案&#xff1a; A.【 √ 】正确 第二题 2.在人脸验证中函数d(img1,img2)起什么作用&a…

12.26_黑马数据结构与算法笔记Java

目录 243 图 Floyd Warshall 算法实现2 244 图 Floyd Warshall 算法实现3 245 图 Floyd Warshall 算法实现4 246 图 最小生成树 Prim 247 图 最小生成树 Kruskal 248 图 并查集 1 249 图 并查集 2 250 图 并查集 路径压缩 251 图 并查集 UnionBySize 252 贪心算法 介绍…

Python干饭神器告诉你,今天吃什么,再也不用为吃什么发愁!

亲爱的小伙伴们&#xff0c;由于微信公众号改版&#xff0c;打乱了发布时间&#xff0c;为了保证大家可以及时收到文章的推送&#xff0c;可以点击上方蓝字关注测试工程师成长之路&#xff0c;并设为星标就可以第一时间收到推送哦 一.前言 hello&#xff0c;大家好&#xff0c…

计算器——可支持小数的任意四则运算(中缀表达式转为后缀表达式算法)

中缀表达式转为后缀表达式的原理过程主要包括以下步骤&#xff1a; 1. 初始化两个栈&#xff0c;一个用于存储操作数&#xff0c;一个用于存储运算符。2. 从左到右扫描中缀表达式的每个字符。3. 如果遇到数字&#xff0c;则直接将其压入操作数栈。4. 如果遇到运算符&#xff0c…

[vue]Echart使用手册

[vue]Echart使用手册 使用环境Echart的使用Echart所有组件和图表类型Echart 使用方法 使用环境 之前是在JQuery阶段使用Echart&#xff0c;直接引入Echart的js文件即可&#xff0c;现在是在vue中使用,不仅仅时echarts包&#xff0c;还需要安装vue-echarts&#xff1a; "…

性能暴增的Rope Crystal版本:红宝石(12.25)

文章目录 &#xff08;零&#xff09;版本介绍&#xff08;一&#xff09;主界面调整&#xff08;二&#xff09;模型与性能&#xff08;三&#xff09;创作纪念日 &#xff08;零&#xff09;版本介绍 &#x1f517; Github仓库。 这次圣诞节更新主要是提升性能&#xff01;&…

JavaScript:DOM节点

JavaScript&#xff1a;DOM节点 DOM节点查找节点父节点查找子节点查找兄弟节点查找 插入节点追加节点克隆节点 删除节点浏览器渲染模式回流重绘 DOM节点 DOM树中的每一个内容都称之为节点&#xff0c;主要包括元素节点&#xff0c;属性节点&#xff0c;文本节点等&#xff0c;本…

EasyCVR无人机推流+人数统计AI算法,助力公共场所人群密度管控

一、背景与需求 在公共场所和大型活动的管理中&#xff0c;人数统计和人群密度控制是非常重要的安全问题。传统的方法可能存在效率低下或准确度不足的情况&#xff0c;无法满足现代社会的需求。TSINGSEE青犀可以利用无人机推流AI人流量统计算法&#xff0c;基于计算机视觉技术…