【分布式缓存】一致性Hash原理剖析,一致性Hash与Hash的区别(详解)

在这里插入图片描述

文章目录

    • Hash算法
    • Hash算法的缺陷
    • 一致性Hash算法
    • 一致性Hash存储规则
    • 一致性Hash解决Hash的缺陷问题
    • 一致性Hash的偏斜问题
    • 一致性哈希在实际中的应用
    • 总结

更多相关内容可查看

假设有一个场景:有三万张图片,有三台服务器S0,S1,S2

要求:将这三万张图片均匀的分摊到三台服务器上,这样可以减轻服务器压力

Hash算法

比如我用图片的名称作为缓存的key,我用服务器的数量(3)进行取模,假设算出对应的余数就是对应的服务器的编号,这样我就知道这个图片具体存在哪台服务器上了

计算公式:hash(图片名称)% 机器数(3) = 余数(服务器编号)

在这里插入图片描述

Hash算法的缺陷

如果图片过多,我将原来三台服务器升级到四台服务器,那我的计算公式就会发生改变,我的服务器数量变为4,最后的余数就会发生改变,上述说某个余数就是跟某台服务器映射过了,所以就会导致找不到对应的key,就会造成缓存雪崩,大面积的缓存失效,从而导致系统被压垮

计算公式:hash(图片名称)% 机器数(4) = 余数(服务器编号)

在这里插入图片描述

一致性Hash算法

一致性Hash算法是用了Hash环的思想,是一个2 ^ 32的大小的一个环,可以理解成,这个Hash环上有 2 ^ 32次方个点

比如有三台服务器A、B、C

计算公式:hash(A的服务器编号)% 2 ^ 32 = 余数(Hash环上的一个点 >> 0 ~ 2 ^ 32-1)

通过这个计算公式可以把三台服务器分别映射到Hash环上,如图

在这里插入图片描述

用相同的计算公式将三万张图片也可以映射到Hash环上

计算公式:hash(a.jpg)% 2 ^ 32 = 余数(Hash环上的一个点 >> 0 ~ 2 ^ 32-1)

在这里插入图片描述

一致性Hash存储规则

那这个图片a.jpg存在哪台服务器上呢?

思想:是从这个a.jpa映射的点顺时针找到第一台服务器就是他所存储的服务器,就是服务器B

在这里插入图片描述

上述图示就是a.jpg被缓存到服务器B,b.jpg被缓存到服务器C,c.jpg被缓存到服务器A

计算公式:hash(a.jpg)% 2 ^ 32 = 余数(Hash环上的一个点 >> 0 ~ 2 ^ 32-1)

因为hash(key)值不会变 所以在存储跟查询的时候 都使用同一种方式进行计算,就能找到对应的图片缓存的位置

一致性Hash解决Hash的缺陷问题

上文所说Hash的缺陷是服务器数量改变,导致最后的值发生了改变,从而导致缓存雪崩
在这里插入图片描述

按上述问题,我增加一个一台服务器D,我的计算公式会将服务器D映射到Hash环上的一个位置,那么我缓存失效的部分是服务器C到服务器D的那一小部分失效(如图),剩余这个环的其他部分不会失效,这样就会避免大面积的缓存雪崩问题

计算公式:hash(a.jpg)% 2 ^ 32 = 余数(Hash环上的一个点 >> 0 ~ 2 ^ 32-1)

在这里插入图片描述

一致性Hash的偏斜问题

偏斜:就是我A、B、C三台服务器通过计算公式,映射到Hash环上的节点离的很近

计算公式:hash(a.jpg)% 2 ^ 32 = 余数(Hash环上的一个点 >> 0 ~ 2 ^ 32-1)

导致的问题:

  • 三万张图片分布不均匀
  • 在增加一台服务器D,可能会导致大面积的缓存失效

解决:

  • 增加多个服务器,可以增加分布均匀的概率
  • 增加虚拟节点:虚拟节点就是A服务器拆分为多个映射到Hash环上,相当于一个假服务器,找到虚拟节点再去找真实节点,再去进行读写操作,这样就能解决偏斜的问题

在这里插入图片描述

一致性哈希在实际中的应用

一致性哈希在许多分布式系统中得到了广泛应用,如分布式缓存系统(如 Memcached、Redis Cluster)、分布式文件系统(如 Ceph)等。

在分布式缓存系统中,一致性哈希确保了数据在各个缓存节点之间的均匀分布,提高了缓存的命中率和系统的性能。当缓存节点数量发生变化时,一致性哈希能够有效地减少数据的迁移量,保证系统的稳定性。

在分布式文件系统中,一致性哈希用于管理数据块的存储位置,实现数据的分布式存储和负载均衡。通过虚拟节点的机制,即使文件系统中的节点数量不断变化,也能保证数据的均匀分布和高效访问。

总结

一致性哈希算法通过将数据和服务器节点映射到一个固定的哈希空间,引入虚拟节点来解决数据分布不均匀的问题,并在服务器动态增减时能够有效地减少数据迁移的开销,实现了高效的负载均衡和系统的稳定性。它是分布式系统架构设计中一种非常重要的技术,为大规模数据的存储和处理提供了可靠的解决方案。随着分布式系统的不断发展和应用场景的不断拓展,一致性哈希算法将继续发挥其重要作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/949920.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Clisoft SOS与CAD系统集成

Clisoft SOS与CAD系统集成 以下内容大部分来自官方文档,目前只用到与Cadence Virtuoso集成,其他还未用到,如有问题或相关建议,可以留言。 与Keysight ADS集成 更新SOS客户端配置文件sos.cfg,以包含支持ADS的模板&am…

Java-数据结构-链表-高频面试题(1)

在上一篇文章中,我们学习了链表中的"单向链表",但学可不代表就是学会了,能够运用链表的地方比比皆是,解题方法也是层出不穷,今天就让我们巩固一下"单向链表"的知识吧~ 第一题:相交链表…

JVM实战—OOM的定位和解决

1.如何对系统的OOM异常进行监控和报警 (1)最佳的解决方案 最佳的OOM监控方案就是:建立一套监控平台,比如搭建Zabbix、Open-Falcon之类的监控平台。如果有监控平台,就可以接入系统异常的监控和报警,可以设置当系统出现OOM异常&…

照片做成图书小程序开发制作介绍

照片做成图书小程序系统,主要是让用户直接通过小程序选择需要做成书的类型和照片排版布局模板,以及上传照片的数量。照片上传完成后,生成模板图片样式进行预览或编辑修改。修改完成全部保存。保存后生成完整的照片书进行预览没问题&#xff0…

云商城--业务+架构学习和环境准备

云商城业务架构学习和环境准备 B2B:Business to Business,交易双方的身份都是商家,也就是商家将商品卖给商家,类似采购、批发类购物,国内代表性网站阿里巴巴批发网 C2C:Customer to Customer,…

Elasticsearch:Lucene 2024 年回顾

作者:来自 Elastic Chris Hegarty 2024 年对于 Apache Lucene 来说又是重要的一年。在本篇博文中,我们将探讨主要亮点。 Apache Lucene 在 2024 年表现出色,发布了许多版本,包括三年来的首次重大更新,其中包含令人兴奋…

基于LabVIEW的BeamGage自动化接口应用

设置 National Instruments LabVIEW可执行程序需要被配置为使用.NET 4框架。.NET允许自定义可执行程序的运行方式。可通过以下方式实现: 在LabVIEW安装目录中创建一个名为LabVIEW.exe.config的文本文件(例如:C:\Program Files\National Ins…

卸载干净 IDEA(图文讲解)

目录 1、卸载 IDEA 程序 2、注册表清理 3、残留清理 1、卸载 IDEA 程序 点击屏幕左下角 Windows 图标 -> 设置-控制面板->intellij idea 勾选第一栏 Delete IntelliJ IDEA 2022.2 caches and local history,表示同时删除 IDEA 本地缓存以及历史。 Delete I…

李宏毅机器学习课程笔记02 | 机器学习任务攻略General Guide

第一步:分析loss on training data 先检查在训练数据上模型是否很好的学习 情况1:如果在训练集上,loss很大,说明在训练资料上没有训练好 可能性1:设置的模型太简单了,模型存在model bias模型偏差&#x…

【C++】19.多态

文章目录 1. 多态的概念2. 多态的定义及实现2.1 多态的构成条件2.1.1 实现多态还有两个必须重要条件:2.1.2 虚函数 (Virtual Function)定义:特性:示例代码:代码分析1. 类定义部分2. 主函数部分运行结果 重点讲解1. 虚函数的作用2.…

光伏仿真与设计系统应用架构深度剖析

在光伏产业蓬勃发展的时代背景下,绿虫光伏仿真与设计系统成为推动其高效发展的核心力量。其应用架构涵盖多个关键步骤,每个环节都紧密相扣,共同构建起精准且高效的设计体系。 气象分析作为开篇之笔,起着基石般的重要作用。系统全…

进程间通讯

简介: 进程间通讯方式有: 1.内存映射(mmap): 使用mmap函数将磁盘空间映射到内存 2.管道 3.信号 4.套接字(socket) 5.信号机制 通过进程中kill函数,去给另一个函数发送信号&a…

空压机接入配置实例:利用 MODBUS - TCP 转 Ethernet IP 网关实现连接

在工业自动化生产环境中,空压机作为重要的气源设备,其稳定运行和有效监控对于整个生产流程至关重要。然而,不同厂家生产的空压机可能采用不同的通信协议,这给集中监控和管理带来了挑战。在本次案例中,我们遇到的空压机…

基于 Boost.Asio 和 Boost.Beast 的异步 HTTP 服务器(学习记录)

已完成功能: 支持 GET 和 POST 请求的路由与回调处理。 解析URL请求。 单例模式 管理核心业务逻辑。 异步 I/O 技术和 定时器 控制超时。 通过回调函数注册机制,可以灵活地为不同的 URL 路由注册处理函数。 1. 项目背景 1.1 项目简介 本项目是一个基于…

Harmony开发【笔记1】报错解决(字段名写错了。。)

在利用axios从网络接收请求时,发现返回obj的code为“-1”,非常不解,利用console.log测试,更加不解,可知抛出错误是 “ E 其他错误: userName required”。但是我在测试时,它并没有体现为空,…

Spring源码分析之事件机制——观察者模式(二)

目录 获取监听器的入口方法 实际检索监听器的核心方法 监听器类型检查方法 监听器的注册过程 监听器的存储结构 过程总结 Spring源码分析之事件机制——观察者模式(一)-CSDN博客 Spring源码分析之事件机制——观察者模式(二&#xff…

关于Mac中的shell

1 MacOS中的shell 介绍: 在 macOS 系统中,Shell 是命令行与系统交互的工具,用于执行命令、运行脚本和管理系统。macOS 提供了多种 Shell,主要包括 bash 和 zsh。在 macOS Catalina(10.15)之前&#xff0c…

【C++】20.二叉搜索树

文章目录 1. 二叉搜索树的概念2. 二叉搜索树的性能分析3. 二叉搜索树的插入4. 二叉搜索树的查找5. 二叉搜索树的删除6. 二叉搜索树的实现代码7. 二叉搜索树key和key/value使用场景7.1 key搜索场景:7.2 key/value搜索场景:7.3 主要区别:7.4 ke…

【大模型+本地自建知识图谱/GraphRAG/neo4j/ollama+Qwen千问(或llama3)】 python实战(中)

一、建立基本的知识图谱并导入neo4j 这里我举例用的属性表、关系表,大概格式如下 id名字颜色a1苹果红色 startrelenda1属于b1 启动neo4j(关于neo4j的安装此处不再赘述) import pandas as pd from py2neo import Graph, Node, Relationship…

【pyqt】(四)Designer布局

布局 之前我们利用鼠标拖动的控件的时候,发现一些部件很难完成对齐这些工作,pyqt为我们提供的多种布局功能不仅可以让排版更加美观,还能够让界面自适应窗口大小的变化,使得布局美观合理。最常使用的三种布局就是垂直河子布局、水…