分布式算法(五):初识ZAB协议

文章目录

  • 一、什么是Zookeeper
  • 二、ZAB与Zookeeper的关系
    • 为什么Zookeeper不直接使用Paxos
  • 三、ZAB简介
    • 1.名词解释
      • 提案(Proposal)
      • 事务(Transaction)
      • 原子广播(Atomic Broadcast)
    • 2.集群角色
      • 领导者(Leader)
      • 跟随者(Follower)
      • 观察者(Observer)
    • 3.成员状态
    • 4.运行阶段
      • (1)Leader Election(领导者选举阶段)
      • (2)Discovery(发现阶段)
      • (3)Synchronization(同步阶段)
      • (4)Broadcast(广播阶段)
      • Commit(提交阶段)
      • Observer Handling(观察者处理)
    • 5.事务标识符
      • 作用
      • 示例

一、什么是Zookeeper

Zookeeper 是一种分布式协调服务,它帮助分布式系统中的进程或服务之间进行协作。通过提供一套简单的原语和 API,Zookeeper 使得开发者可以更容易地实现复杂的协调任务,如:

  • 配置管理:应用程序可以在 Zookeeper 中存储配置信息,并且可以在配置发生变化时得到通知。
  • 命名服务:为分布式系统中的组件提供一个统一的名字空间,类似 DNS 之于互联网。
  • 分布式同步:提供机制以确保多个节点之间的操作能够按照一定的顺序执行。
  • 组成员管理:跟踪集群中成员的状态,检测成员的加入和离开。
  • 领导选举:在一组服务器中选出一个领导者来协调某些活动。

Zookeeper 的核心概念包括:

  • Znodes(节点):类似于文件系统中的文件和目录,数据被组织成树状结构。
  • Ephemeral nodes(临时节点):这类节点在创建它们的客户端断开连接后会被自动删除。
  • Watchers(监视器):允许客户端等待特定事件的发生,例如节点数据的变化或子节点的增删。
  • ACLs(访问控制列表):用于控制哪些客户端可以对 znodes 执行什么类型的访问。

关于Zookeeper的简单介绍可以看我的另一篇blog:https://blog.csdn.net/Tracycoder/article/details/142792750

二、ZAB与Zookeeper的关系

ZAB(Zookeeper Atomic Broadcast)协议是 Zookeeper 的核心技术,它通过实现领导者选举、原子广播和事务日志同步,确保了分布式系统中数据的一致性和可靠性,并且能够在节点故障时维持服务的连续性和高可用性。ZAB 保证所有服务器按照全局一致的顺序处理更新操作,提供顺序一致性,同时支持一定的容错能力,使得 Zookeeper 能够有效地协调分布式应用程序中的各个组件。

虽然ZAB是在特定的应用场景下设计的(ZooKeeper),但它确实借鉴并实现了Paxos的核心思想——特别是关于如何通过多数派投票机制达成一致。因此,可以说ZAB是基于Paxos多数派思想的共识算法。

为什么Zookeeper不直接使用Paxos

Zookeeper 选择不直接使用 Paxos 协议,而是开发了自己的 ZAB协议,主要是因为 Paxos 虽然在理论上提供了强大的一致性保证,但在实际应用中实现和理解都非常复杂,尤其是在构建高效的分布式系统时。以下是 Zookeeper 不直接采用 Paxos 的一些主要原因:

  • Paxos 的复杂性:Paxos 协议虽然解决了分布式共识问题,但其算法本身非常抽象且难以理解和实现。对于大多数开发者来说,正确地实现 Paxos 是一个挑战,这可能导致实现上的错误,影响系统的稳定性和可靠性。

  • 性能考虑:Paxos 在处理某些类型的故障或网络分区时可能会导致性能下降。例如,在领导者选举过程中,Paxos 可能需要多次通信轮次才能达成一致,这在高负载或网络延迟较高的情况下会显著降低性能。

  • 特定需求:Zookeeper 需要一种能够支持顺序一致性、快速恢复以及高效领导者选举的协议。虽然 Paxos 提供了一致性,但它并不直接支持这些特性。因此,Zookeeper 团队设计了 ZAB,它更专注于满足 Zookeeper 的具体需求,如高效的领导者选举和事务日志同步。

  • 简化操作:ZAB 协议简化了许多操作,比如通过引入一个持久的领导者来减少决策过程中的复杂性,并确保所有更新都按全局一致的顺序执行。此外,ZAB 还实现了原子广播功能,这对于 Zookeeper 所需的分布式协调服务非常重要。

  • 容错机制:ZAB 设计了更为直观的容错机制,可以在部分节点失效的情况下继续运作,同时允许失效节点重新加入集群后快速同步状态,这比直接应用 Paxos 更加高效和实用。

三、ZAB简介

1.名词解释

在 ZAB(Zookeeper Atomic Broadcast)协议中,提案(Proposal)、事务(Transaction)和原子广播(Atomic Broadcast)是三个核心概念。

提案(Proposal)

提案是指由 Zookeeper 集群中的领导者发起的一个变更提议。每个提案包含了客户端请求的具体操作(如创建节点、删除节点等),以及一个唯一的序列号,用来确保所有提案按照全局一致的顺序被处理。

事务(Transaction)

在 ZAB 的上下文中,事务指的是对 Zookeeper 状态的一次或多次更改的集合。一次事务可以包含多个操作(例如创建多个 znode 或修改现有 znode 的数据),但这些操作被视为一个不可分割的整体。
事务具有原子性,即事务中的所有操作要么全部成功执行,要么完全不执行。这保证了即使在网络故障或其他异常情况下,系统的状态仍然保持一致。

原子广播(Atomic Broadcast)

原子广播是 ZAB 协议的核心功能之一,它确保了所有集群成员以相同的顺序接收并应用相同的消息(即提案)。这意味着一旦一个消息被广播给所有成员,那么这个消息最终会被所有正常工作的成员接收到,并且不会有任何成员接收到部分消息或不同版本的消息。

原子性 指Follower要么全部批准,要么全部拒绝。

2.集群角色

在 ZAB(Zookeeper Atomic Broadcast)协议中,集群中的每个节点(也称为服务器或成员)都可以扮演不同的角色。这些角色对于确保集群的正常运作、数据一致性和高可用性至关重要。以下是 ZAB 协议中常见的集群角色:

领导者(Leader)

  • 职责
    • 负责接收来自客户端的所有写请求,并将这些请求转化为提案(Proposal),然后广播给所有跟随者。
    • 管理提案的提交过程,确保所有跟随者按照全局一致的顺序处理提案。

跟随者(Follower)

  • 职责
    • 接收来自领导者的提案,并对提案进行投票确认。
    • 如果大多数跟随者同意了某个提案,则该提案会被提交并应用到本地状态机上。
    • 跟随者也会转发读请求给领导者处理,但可以直接响应只读请求(在某些配置下)。

观察者(Observer)

  • 职责
    • 类似于跟随者,观察者也会接收来自领导者的提案,并同步其状态。
    • 然而,观察者不会参与投票过程,因此它们的存在不影响法定人数(Quorum)的计算。
    • 主要用于扩展 Zookeeper 集群的读取能力,减轻领导者和跟随者的负载。

3.成员状态

ZAB(ZooKeeper Atomic Broadcast)协议是ZooKeeper用来实现分布式一致性的一个关键组件。它确保所有服务器能够就一系列更新达成一致,即使在某些服务器故障的情况下也是如此。ZAB协议定义了几个成员状态:

ELECTION

  • 当集群中的领导者(Leader)宕机或与大多数Follower失去联系时,ZooKeeper进入ELECTION状态。
  • 在这个状态下,每个服务器都认为自己可能是新的领导者,并尝试选举一个新的领导者。
  • 一旦选出了新的领导者,所有参与者将从ELECTION状态转移到FOLLOWING或LEADING状态。

LEADING

  • 只有一个服务器可以处于LEADING状态,即当前的领导者。
  • 领导者负责协调所有的写操作,确保它们被正确地广播到所有的Follower。
  • 领导者还负责发起和协调新的选举过程,如果它检测到自己不再是多数派的一员。

FOLLOWING

  • 大部分服务器会处于FOLLOWING状态,作为跟随者(Follower)。
  • 跟随者接收来自客户端的读请求并直接处理它们(因为ZooKeeper的数据模型是可复制的),而对于写请求,则转发给领导者。
  • 它们也接收来自领导者的提议(Proposal)并且应用这些提议以保持数据的一致性。

OBSERVING

  • 这个状态是在加入新成员或重新连接断开成员时使用的一种特殊状态。
  • 观察者(Observer)不参与选举,但它们会像跟随者一样接收和处理来自客户端的请求以及来自领导者的提议。
  • 观察者帮助分担读取负载而不影响写入路径的一致性决策。

4.运行阶段

ZAB(Zookeeper Atomic Broadcast)协议的运行过程可以分为几个关键阶段,这些阶段确保了集群中数据的一致性和高可用性。以下是 ZAB 协议的主要运行阶段:

在这里插入图片描述

(1)Leader Election(领导者选举阶段)

  • 触发条件:当 Zookeeper 集群启动时或当前领导者失效时。
  • 过程
    • 所有服务器尝试成为领导者,通过一个协商过程来决定哪个服务器将成为新的领导者。
    • 每个服务器会广播自己的提议,并收集其他服务器的投票。
    • 如果一个服务器获得了超过半数的票数(即法定人数),它就成为新的领导者。
    • 新的领导者将同步其状态与最完整的事务日志副本保持一致。

(2)Discovery(发现阶段)

  • 描述:新选出来的领导者进入此阶段,以确保所有跟随者都知道谁是新的领导者,并且所有跟随者都同意领导者的最新状态。
  • 过程
    • 领导者向所有跟随者发送心跳消息,确认它们的状态。
    • 跟随者回复它们最后处理的事务 ID,以便领导者了解每个跟随者的状态。
    • 领导者根据跟随者的反馈确定需要发送给每个跟随者的最小事务集,以使它们的状态与自己同步。

(3)Synchronization(同步阶段)

  • 描述:在这个阶段,领导者确保所有跟随者的状态与其自身一致。
  • 过程
    • 领导者发送必要的缺失事务给跟随者,以更新它们的状态。
    • 跟随者应用这些事务并确认完成。
    • 当大多数跟随者(法定人数)确认后,领导者认为集群已经同步完成。

(4)Broadcast(广播阶段)

  • 描述:一旦集群同步完成,领导者开始正常接收和处理客户端请求。
  • 过程
    • 领导者接收来自客户端的写请求,将其转化为提案(Proposal),并广播给所有跟随者。
    • 跟随者对收到的提案进行投票确认。
    • 如果大多数跟随者同意,则该提案被提交,所有成员按照相同的顺序应用这个提案。
    • 对于读请求,跟随者可以直接响应,而不需要经过领导者(在某些配置下)。

ZAB协议中的消息广播类似于两阶段提交(2PC)的过程, 因为它同样依赖于一个领导者来协调所有跟随者的行动,并通过两个主要阶段确保数据的一致性:首先,领导者将提议的消息广播给所有跟随者并等待它们的确认(类似于2PC的准备阶段);一旦收到大多数跟随者的确认,领导者就会通知所有节点应用该消息,从而完成广播(类似于2PC的提交阶段)。这种机制保证了即使在部分节点故障的情况下,系统仍能维持一致性和可用性。
但是,ZAB采用了一种更简单的两阶段过程: 提议阶段和提交阶段。领导者一旦收到大多数跟随者的确认,就可以立即通知所有节点应用提议。而2PC需要额外的准备阶段来询问每个参与者是否可以执行操作,这增加了延迟。消息广播还移除了第二阶段的中断逻辑,所有的Follower要么批准每一个Proposal,要么抛弃Leader服务器。

Commit(提交阶段)

  • 描述:当一个提案获得法定人数的认可后,它就会被提交。
  • 过程
    • 领导者通知所有跟随者提交该提案。
    • 每个跟随者将提案应用于本地状态机,并更新其状态。
    • 提交完成后,提案所代表的操作正式生效。

Observer Handling(观察者处理)

  • 描述:观察者不参与投票,但仍然需要保持最新的状态。
  • 过程
    • 观察者从领导者那里接收提案并应用到本地状态机上。
    • 它们可以响应只读请求,但不会影响法定人数的计算。

5.事务标识符

ZAB(ZooKeeper Atomic Broadcast)协议中的事务标识符 zxid 是一个非常重要的概念,它用于唯一标识每个事务,并确保事务的顺序性。zxid 是一个64位的数字,由两部分组成:

  1. EPOCH (32位):表示领导者的周期或者任期。每当选举出一个新的领导者时,EPOCH会增加。这有助于区分不同领导者的提议,即使它们在不同的任期内提出了相同的本地序列号。

  2. COUNT (32位):是领导者提出的事务在其任期内的递增计数器。每次领导者提出新的提议时,COUNT都会增加。这意味着在同一任期内,COUNT可以用来对提议进行排序。

作用

  • 唯一性:由于zxid结合了EPOCH和COUNT,因此它可以保证每个事务在整个集群中都是唯一的。
  • 全局有序:通过zxid,可以确保所有服务器上的事务按照相同的顺序被应用,这对于维护数据的一致性和正确性至关重要。
  • 故障恢复:当一个新的领导者被选出来之后,它可以通过比较zxid来确定哪些事务已经被确认,哪些还没有,从而能够安全地继续处理未完成的事务。

示例

假设我们有一个初始的zxid为0x0000000100000001,这里前32位是EPOCH(0x00000001),后32位是COUNT(0x00000001)。如果这个领导者发起了两个事务,那么第二个事务的zxid将会是0x0000000100000002。如果此时发生了领导者变更,新的领导者的EPOCH将变为0x00000002,而它的第一个事务的zxid可能是0x0000000200000001。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/947371.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

word中插入zotero引用

1、参考文献末尾没有文献? 在文献条目要显示的地方点击“refresh” 2、参考文献条目没有悬挂缩进? 把“书目”添加到样式库中,修改样式为悬挂缩进1.5字符 3、交叉引用? 宏 新建一个宏 粘贴下面代码 Public Sub ZoteroLinkCita…

利用3DGS中convert.py处理自采数据

前言 3DGS源码中convert.py提供对自采数据集的处理,需要预先安装Colmap和ImageMagick. ubuntu22.04安装colmap 点击进入NVIDIA官网,查看GPU的CMAKE_CUDA_ARCHITECTURES 1、克隆colmap源码,并进入colmap文件夹 git clone https://github.c…

【Vue】vue-router使用addRoute动态加载路由后刷新页面404

场景:动态加载路由,点击菜单路由跳转正常,但刷新页面报404 原因:使用404做异常路由捕获 刷新页面会导致路由丢失,重建路由时先加载了静态路由(包含异常路由捕获404),此时动态路由还未…

USB射频微波功率计的功能与优势-盛铂科技

USB射频功率计是一种用于测量射频信号(RF)功率的仪器,它通过USB接口与计算机或其他设备连接,以便于进行数据采集、处理和显示。 主要功能 功率测量:能够测量射频信号的功率,通常以毫瓦(mW&…

【Vim Masterclass 笔记01】Section 1:Course Overview + Section 2:Vim Quickstart

文章目录 Section 1:Course Introduction 课程概述S01L01 Course Overview 课程简介课程概要 S01L02 Course Download 课程资源下载S01L03 What Vim Is and Why You Should Learn It 何为 Vim?学来干啥?1 何为 Vim2 为何学 Vim Section 2&…

Elasticsearch JavaRestClient版

文章目录 初始化RestHighLeveClient(必要条件)索引库操作1.创建索引库(4步)2.删除索引库(3步)3.判断索引库是否存在(3步)4.总结:四步走 文档操作1.创建文档(4…

基于Pytorch和yolov8n手搓安全帽目标检测的全过程

一.背景 还是之前的主题,使用开源软件为公司搭建安全管理平台,从视觉模型识别安全帽开始。主要参考学习了开源项目 https://github.com/jomarkow/Safety-Helmet-Detection,我是从运行、训练、标注倒过来学习的。由于工作原因,抽空…

driftingblues6靶机

打开靶场 查看页面源代码,最下面有一个注释,提供了一个网址 vmlist.github.io,我们去访问一下 这里是一个github页面,提供攻防虚拟机的下载,对我们解题并没有什么有用的信息,我们再去扫描端口 发现只有80端…

python学习笔记—12—布尔类型、if语句

1. 布尔类型 (1) 定义 (2) 比较运算符 (3) 代码演示 1. 手动定义 bool_1 True bool_2 False print(f"bool_1的内容是:{bool_1}, 类型是:{type(bool_1)}") print(f"bool_2的内容是:{bool_2}, 类型是:{type(bool…

EasyExcel自定义动态下拉框(附加业务对象转换功能)

全文直接复制粘贴即可,测试无误 一、注解类 1、ExcelSelected.java 设置下拉框 Documented Target({ElementType.FIELD})//用此注解用在属性上。 Retention(RetentionPolicy.RUNTIME)//注解不仅被保存到class文件中,jvm加载class文件之后&#xff0c…

Fetch处理大模型流式数据请求与解析

为什么有的大模型可以一次返回多个 data? Server-Sent Events (SSE):允许服务器连续发送多个 data: 行,每个代表一个独立的数据块。 流式响应:大模型服务通常以流式响应方式返回数据,提高响应速度。 批量处理&#x…

开源低代码平台-Microi吾码-一键安装使用(CentOS一键安装MySql+Redis+MinIO+MongoDB+Watchtower脚本)

开源低代码平台-Microi吾码-一键安装使用 前言CentOS7一键安装脚本注意事项:安装成功预览图安装过程图安装结果docker脚本代码【有点东西:)】踩过的坑开源低代码平台Microi吾码-系列文档 前言 有小伙伴提出他并不想在本地编译代码、打包镜像、…

Ubuntu 24.04 LTS 解决网络连接问题

1. 问题描述 现象:ens33 网络接口无法获取 IPv4 地址,导致网络不可用。初步排查: 运行 ip a,发现 ens33 接口没有分配 IPv4 地址。运行 ping www.baidu.com,提示“网络不可达”。查看 NetworkManager 日志&#xff0c…

Docker--Docker Container(容器) 之 操作实例

容器的基本操作 容器的操作步骤其实很简单,根据拉取的镜像,进行启动,后可以查看容器,不用时停止容器,删除容器。 下面简单演示操作步骤 1.创建并运行容器 例如,创建一个名为"my-nginx"的交互…

大模型WebUI:Gradio全解系列8——Additional Features:补充特性(上)

大模型WebUI:Gradio全解系列8——Additional Features:补充特性(上) 前言本篇摘要8. Additional Features:补充特性8.1 队列8.1.1 使用方法8.1.2 配置队列演示 8.2 输入输出流8.2.1 输出流1. 生成器yield2. 流媒体 8.2…

leetcode 2658. 网格图中鱼的最大数目

题目如下 数据范围 使用并查集来做这道题。 其实按照题目的意思就是让我们求每一个联通的水域可以捞到的最大权值。 我们可以从前往后遍历这个二维数组只需要判断前一个水域和上一个水域是否和当前的(i, j)联通如果有则合并水域,同时用一个weight数组保存每一个联…

【go每日一题】golang异常、错误 {源码、实践、总结}

错误与异常在golang中区分 Go 的错误处理设计与其他语言的异常不同。Go 中的 error 就是一个普通的值对象,而其他语言如 Java 中的 Exception 将会造成程序控制流的终止和其他行为,Exception 与普通的值不同。虽然 Go 也有类似的异常机制 —— panic&am…

大模型 Fine-Tuning 技术解析

引言 在大型语言模型(LLMs, Large Language Models)的发展历程中,预训练模型和微调(Fine-tuning)技术起到了至关重要的作用。这些技术使得模型不仅能够学习到丰富的语言特征,还能根据具体任务进行优化调整…

LabVIEW开发中常见硬件通讯接口快速识别

在 LabVIEW 开发中,与硬件进行通讯是实现数据采集与控制的重要环节。准确判断通讯接口类型和协议,可以提高开发效率,减少调试时间。本文结合 LabVIEW 的实际应用,详细介绍如何识别和判断常见硬件通讯接口的定义,并提供…

抖音短视频矩阵系统源码开发全流程解析

在项目开发过程中,调整配置文件至关重要,这些文件包括数据库连接、API密钥及全局参数等。通过正确配置这些信息,可确保应用程序的稳定性和安全性。灵活调整配置以适应具体需求有助于短视频矩阵系统项目的顺利推进。 在开发环境中&#xff0c…