常用中间件redis,kafka及其测试方法

常用消息中间件及其测试方法

      • 一、中间件的使用场景
        • 引入中间件的目的一般有两个:
          • 1、提升性能
          • 常用的中间件:
            • 1) 高速缓存:redis
            • 2) 全文检索:ES
            • 3) 存日志:ELK架构
            • 4) 流量削峰:kafka
          • 2、提升可用性
          • 产品架构中高可用设计:
            • 1) 分布式锁:redis
            • 2) 数据分布式存储:redis,es,kafka
      • 二、Redis
        • 1、redis 的数据同步策略以及数据一致性保证?
        • 2、哨兵模式的设计架构,如何理解读写分离,选举和脑裂
          • 1、什么是哨兵?
          • 2、哨兵的配置文件
          • 3、网络分区故障
          • 网络故障:
            • 1)master节点和哨兵节点出现网络故障:
            • 2)master节点和slave节点出现网络分区故障:
          • 4、脑裂是什么,怎么解决?
        • 3、缓存失效下的熔断和降级以及测试方法
          • 1、造成缓存失效的几种情况?
          • 2、采取的应对策略?
          • 3、 如何模拟redis缓存失效?
        • 4、缓存击穿下的处理方法和测试方法
          • 1、什么是缓存击穿?
          • 2、缓存击穿解决方案?
        • 5、缓存穿透下的测试方法
          • 1、什么是缓存穿透?
          • 2、缓存穿透的解决方案?
          • 3、如何测试?
        • 6、淘汰缓存还是更新缓存
          • 1、缓存操作方式
            • 1)读操作流程?
            • 2)写操作流程:淘汰缓存 or更新缓存?
            • 3)写操作:先淘汰缓存再更新数据库 or 先更新数据库再淘汰缓存?
        • 7、缓存雪崩的测试方法
          • 1、如何处理雪崩?
          • 2、如何模拟雪崩?
      • 三、Kafka
        • 1、kafka的两个常用场景?
        • 2、为什么要用消息队列?
        • 3、和其他消息队列相比,kafka的优势在哪里?
        • 4、队列模型了解吗?Kafka 的消息模型知道吗?
        • 5、什么是Producer、Consumer、Broker、Topic、Partition?
        • 6、Kafka 的多副本机制了解吗?带来了什么好处?
        • 7、Zookeeper 在 Kafka 中的作用知道吗?
        • 8、Kafka 如何保证消息的消费顺序?
        • 9、Kafka 如何保证消息不重复消费?
        • 10、如何测试kafka?

一、中间件的使用场景

引入中间件的目的一般有两个:
  • 1、提升性能
    • 产品架构中的性能设计:
    • 常用的中间件:
      • 1) 高速缓存:redis
        • 基于内存,所以比mysql块(存在磁盘io)
        • 为什么查询速度快?
          • 单进程+IO多路复用去提高性能
          • 基于内存
        • 做缓存,极大缓解了数据库压力
        • 非常适合读多写少的场景
      • 2) 全文检索:ES
        • 适用于大量搜索的场景
        • 用的倒排索引,应对读多写少的场景
        • mysql用的正序索引,应对写多读少的场景
      • 3) 存日志:ELK架构
        • logstash收集日志(目前已经被filebeat替代),然后存入es,再通过kibana展示
          在这里插入图片描述
      • 4) 流量削峰:kafka
        • 目前最流行的消息中间件
  • 2、提升可用性

二、Redis

1、redis 的数据同步策略以及数据一致性保证?
  • 现在软件架构非常复杂,面对数以万计的qps的情况下,如果单台机器到达性能瓶颈,需要一种横向扩展策略,希望把用户请求用负载均衡方式分布在其他机器分担压力。当把所有数据分布到不同机器时候,如何保证每一台机器的数据是完全一致的呢?
    在这里插入图片描述
  • 为了提升性能,必须使用集群部署,比如我们现在要一主两从架构进行部署,我们可以把写请求发送到主节点,把读请求发送到从节点,以降低主节点的压力(读写分离的意义)。如果保证主从节点的数据是一致的呢,我们就需要数据同步策略(异步同步)
    在这里插入图片描述
    在这里插入图片描述
2、哨兵模式的设计架构,如何理解读写分离,选举和脑裂
1、什么是哨兵?
  • 哨兵是redis官方推荐的集群高可用解决方案
  • 它能够自动识别redis集群的健康状态并在master节点异常时将从节点提升为master节点
2、哨兵的配置文件

在这里插入图片描述

3、网络分区故障
4、脑裂是什么,怎么解决?
  • 脑裂就是出现网络分区故障后,同时存在多个master节点。
  • 解决方案:
    • 1、master节点连接不上哨兵节点:只有多个哨兵标记它为主观下线状态,它才会真正的下线
    • 2、master节点连接不上slave节点:就会禁止写操作
3、缓存失效下的熔断和降级以及测试方法
  • 1、造成缓存失效的几种情况?
    • 缓存过期
    • 缓存更新:更新缓存一般采用淘汰更新,这个时候缓存取不到,就会去数据库里面取,再更新缓存。这就造成有极短的一段时间内,缓存是失效的
    • redis异常
    • 网络异常
  • 2、采取的应对策略?
    • 禁用某些接口,只开放核心接口:非核心接口用户一请求,就直接返回异常。保证缓存失效时候核心接口可以继续工作
    • 禁用某些服务
      在这里插入图片描述
  • 3、 如何模拟redis缓存失效?
    • 1)你需要输入出系统的核心服务列表和服务中的核心接口列表。
    • 2)注入故障,然后验证(非核心接口去访问时候应该是拒绝的)
      • 直接把redis下线
      • 注入一个网络故障
        • 比如可以用iptables模拟断网故障,tc模拟延迟故障,也可以去下载阿里开源工具chaos-blade,下载后一条命令就可以模拟故障
4、缓存击穿下的处理方法和测试方法
5、缓存穿透下的测试方法
6、淘汰缓存还是更新缓存
  • 1、缓存操作方式
    redis是高速缓存组件,需要跟数据库进行频繁交流才能让缓存生效。缓存操作方式就需要一定的步骤和规则,如果出错,就会导致出现bug
    • 1)读操作流程?
      • 先查询redis,如果redis有数据,就直接返回redis数据
      • 如果redis没有数据,就从数据库中读取数据
        • 读取数据库是有延迟的,是比较慢的操作,所以在高并发下,可能不仅有一次的读请求会从数据库中读取数据。因为假如说我们第一个请求过来之后,它还没有完成把数据库的数据更新到redis缓存的时候,其他并发也过来了,就会导致在一个比较瞬时的状态的时候,会有相当多的读数据库的请求出现
      • 从数据库读取数据后,更新redis缓存
    • 2)写操作流程:淘汰缓存 or更新缓存?
      • 淘汰缓存
        • 优点是操作简单
        • 缺点是淘汰后下一次请求就会读取数据库
      • 更新缓存
        • 数据库更新完了之后,就会更新缓存的内容。
        • 优点是不会出现下一次cache miss
        • 缺点是代价比较大(比如更新操作涉及到好几张表,会导致性能差,延缓更新缓存时间。如果在更新的时候其他的读请求进来了,会造成数据不一致的情况,可能会读到旧的数据)
      • 结论:淘汰缓存作为通用方案
    • 3)写操作:先淘汰缓存再更新数据库 or 先更新数据库再淘汰缓存?
      • 先更新数据库:如果更新数据库后还没来得及淘汰缓存服务就挂掉了,那么就会出现脏数据
      • 先淘汰缓存:如果淘汰缓存后更新数据库之前的这段时间有其他的读请求发送过来,就会把老数据读取到redis缓存中
        • 但是他在复杂场景下还是可能遇到数据不一致问题,比如写操作出现问题,比如所在磁盘io特别高,导致写缓存和更新数据库操作比较慢,可能会出现如下问题,当把淘汰缓存执行完还没有更新数据库的时候,另一个请求过来读取缓存,取的仍然是旧的值
          在这里插入图片描述
      • 结论:先淘汰缓存,可以使用延迟双删策略弥补缺陷
        • 延迟双删是什么?
          • 1)先删除缓存
          • 2)再写数据库
          • 3)休眠500毫秒(根据具体业务时间来定)
          • 4)再次删除缓存
            在这里插入图片描述
    7、缓存雪崩的测试方法
    当redis中大量缓存在一个较短的时间内全部过期,导致于在一个瞬间时间内大量的请求直接访问数据库,造成数据库崩溃
    • 1、如何处理雪崩?
      • 一般会采用熔断或降级策略。
        • 禁用某些接口,只开放核心接口:非核心接口用户一请求,就直接返回异常。保证缓存失效时候核心接口可以继续工作
        • 禁用某些服务
    • 2、如何模拟雪崩?
      • 弄挂redis服务,比如在redis和服务之间注入网络分区故障,让服务连接不上redis,看看服务是否熔断或降级
      • 写一个接口,把redis常用的缓存删了

    三、Kafka

    1、kafka的两个常用场景?
    • 1) 流量削峰
      • 先将短时间高并发产生的事务消息存储在消息队列中,然后后端服务再慢慢根据自己的能力去消费这些消息,这样就避免直接把后端服务打垮掉
    • 2) 流计算
      • 大数据处理的一种
        在这里插入图片描述
    2、为什么要用消息队列?
    • 1、通过异步处理提高系统性能(减少响应所需时间)
    • 2、降低系统耦合性:生产者(客户端)发送消息到消息队列中去,接收者(服务端)处理消息,需要消费的系统直接去消息队列取消息进行消费即可而不需要和其他系统有耦合,也提高了系统的扩展性。
    • 3、流量削锋:先将短时间高并发产生的事务消息存储在消息队列中,然后后端服务再慢慢根据自己的能力去消费这些消息,这样就避免直接把后端服务打垮掉。
    3、和其他消息队列相比,kafka的优势在哪里?
    • 1、极致的性能:最快可以每秒处理千万级别的数据
    • 2、和其他生态系统的兼容性好:Kafka 与周边生态系统的兼容性是最好的没有之一,特别是在大数据和流计算领域
    • Kafka 主要有两大应用场景:
      • 消息队列 :建立实时流数据管道,以可靠地在系统或应用程序之间获取数据。
      • 数据处理: 构建实时的流数据处理程序来转换或处理数据流。
    4、队列模型了解吗?Kafka 的消息模型知道吗?
    早期的队列模型就是生产者把消息发到消息队列,然后消费者从消息队列去取消息,但是这样做有个弊端,就是如果这个消息需要发送给多个消费者,每个消费者都要收到完整的内容,这种情况队列模型就不好解决了。kafka用的是发布订阅的消息模型,用topic作为消息载体,相当于是广播模型。只要生产者把消息发到topic里,该条消息通过主题传递的方式通知所有的消费者
    5、什么是Producer、Consumer、Broker、Topic、Partition?
    • producer:生产者,生产消息的人
    • consumer:消费者,消费消息的人
    • broker:代理,相当于kafka的实例,多个broker可以构成一个cluster[ˈklʌstə®](集群),broker里面包含topic和partition
    • topic:主题,消费者可以通过订阅topic来消费消息
    • partition:分区,一个topic里面可以有多个分区
      在这里插入图片描述
    6、Kafka 的多副本机制了解吗?带来了什么好处?
    每个分区里都有多个副本,副本里面又有一个leader副本和多个follower副本,follower副本是从leader副本里面拉取消息进行同步,相当于leader副本的拷贝。当leader副本出现问题的时候,会从follower副本里面选取新的leader。生产者和消费者只和leader副本做交互。
    好处:
    • 1、一个topic里有多个partition,然后一个partition可以在多个broker里,这样可以提升并发能力(负载均衡)
    • 2、因为partition可以指定副本数量,这样可以提升消息存储的安全性,但是同时也相应的增加了存储空间
7、Zookeeper 在 Kafka 中的作用知道吗?
  • 1、broker注册:每个broker启动时候,会到zookeeper进行注册
  • 2、topic注册:同一个topic会分成多个分区,并将其分布到多个broker,这些分区和broker对应关系由zookeeper记录
  • 3、负载均衡:对于同一个topic里有多个partition,当生产者产生消息后,kafka会尽力的将一个partition投递到多个broker里,当消费者消费的时候,zookeeper会根据当前消费者数量和broker数量来实现动态负载均衡
8、Kafka 如何保证消息的消费顺序?

因为kafka里消息是存放在partition里,而且每次添加消息到partition里都是采用尾追法,kafka只能保证partition里的消息有序。消息被添加到partition的时候都会分配一个特定的偏移量来保证顺序。
这个时候我们就有2种方式来保证消费顺序

  • 1、一个topic里只对应一个partition(不推荐)
  • 2、发送消息的时候指定key/partition(推荐):发送消息的时候我们可以发送topic,partition,key,data四个参数。如果指定partition的话,kafka可以把消息发送到指定的partition。并且,同一个key的消息可以保证只发送到一个partition
9、Kafka 如何保证消息不重复消费?

根本原因:消息已经消费了,但是没有提交offset
处理方案:
消费方做幂等校验,比如redis分布式锁,mysql的主键等
enable.auto.commit设置成false,改成手动提交offset

10、如何测试kafka?
  • 因为功能上出问题的概率不大,我们测试需要做的就是模拟producer到broker,broker到consumer之间的各种故障,再验证数据是否完整,有没有数据丢失或者重复
    • 比如网络抖动一下后,producer推送到broker的数据丢失怎么办?一般来说会做retry操作,比如重试3次,如果3次都失败了,那么可能broker本身有问题,或者网络问题,抛异常是可以的。但是retry有副作用,假设当producer推送数据给broker,broker已经保存到本地之后,把响应返回给producer的时候失败了,这时候再retry就会导致broker重复保存数据到本地存储,造成数据重复
      在这里插入图片描述
    • 如何解决这个问题呢?
      • kafka有专门的包把producer变成幂等的producer(判断是否消息之前推送过,如果是的话就不会进行第二次存储。)这个是如何实现的呢,就是根据消息生成id,producer会把消息+id一起推送到broker,broker根据消息的id和本地存储数据进行对比就可以知道消息是否重复。但是这个也有缺陷,就是只对单broker有用,多broker/partition是不行的
      • kafka有分布式事务的producer,保证broker不会重复保存数据。producer开了分布式事务以后,consumer也要做改动,要把消息读取变成committed read(只会去读取已经提交的事务)只是提供了框架,里面的逻辑是自己写的,包括consumer怎么维护offset状态,producer里事务怎么提交

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/485012.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Web前端—浏览器渲染原理

浏览器渲染原理 浏览器渲染原理渲染时间点渲染流水线1. 解析HTML—Parse HTML2. 样式计算—Recalculate Style3. 布局—Layout4. 分层—Layer5. 绘制—Paint6. 分块—Tiling7. 光栅化—Raster8. 画—Draw完整过程 面试题1. 浏览器是如何渲染页面的?2. 什么是 reflow…

linux apt 速度慢 换源

Ubuntu 20.04.1 LTS已推出,一样的为期5年的服务,感觉不错,安装了一个,但是苦于使用默认源在国内下载太慢,就想着把apt源改为国内源,目前国内比较好的源,有阿里源,清华源,豆瓣源等,下面我以阿里源为例,说下如何修改。 也可以在中科大https://mirrors.ustc.edu.cn/查…

使用amd架构的计算机部署其他架构的虚拟机(如:arm)

1 下载quem模拟器 https://qemu.weilnetz.de/w64/2 QEMU UEFI固件文件下载(引导文件) 推荐使用:https://releases.linaro.org/components/kernel/uefi-linaro/latest/release/qemu64/QEMU_EFI.fd3 QEMU 安装 安装完成之后,需要将安装目录添加到环境变…

福昕阅读器 PDF 文档基本操作

福昕阅读器 PDF 文档基本操作 References 转至 PDF 顶部 快捷键:Home. 转至 PDF 顶部 快捷键:End. 打开超链接 文本选择工具 -> 手形工具 (Hand Tool) -> 点击超链接 福昕阅读器 同时在多个窗口中打开多个文件 文件 -> 偏好设置 -> 文…

数据库导入文件或者运行文件的时候报错误 #1046 - No database selected

如果我们在使用数据库导入文件的时候报错误 #1046 - No database selected该怎么解决 那么小编带我们可以从三个角度去观察 1、这种情况一般是因为你在数据库中没有这个数据库,你新建一个你要导入的数据库名字的数据库,然后选中该数据库,再进…

设计模式-初步认识

目录 🛻1.什么是设计模式 🚚2.设计模式的优点 🚍3.设计模式6大原则 🛴4.设计模式类型 1.什么是设计模式 设计模式代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开…

如何使用PHP和RabbitMQ实现消息队列?

前言 今天我们来做个小试验,用PHP和RabbitMQ实现消息队列功能。 前期准备,需要安装好docker、docker-compose的运行环境。 如何使用docker部署php服务_php如何使用docker发布-CSDN博客 一、安装RabbitMQ 1、创建相关目录,执行如下命令。…

数据分析与挖掘

数据起源: 规模庞大,结构复杂,难以通过现有商业工具和技术在可容忍的时间内获取、管理和处理的数据集。具有5V特性:数量(Volume):数据量大、多样性(Variety)&#xff1a…

neo4j所有关系只显示RELATION,而不显示具体的关系

当看r时,真正的关系在properties中的type里,而type为“RELATION” 造成这个的原因是: 在创建关系时,需要指定关系的类型,这是固定的,不能像属性那样从CSV文件的一个字段动态赋值。标准的Cypher查询语言不支…

Verilog刷题笔记42

题目:Create 16 D flip-flops. It’s sometimes useful to only modify parts of a group of flip-flops. The byte-enable inputs control whether each byte of the 16 registers should be written to on that cycle. byteena[1] controls the upper byte d[15:8…

轻量级 C++ UI 库:快速、可移植、自包含 | 开源日报 No.168

ocornut/imgui Stars: 53.4k License: MIT imgui 是 C 的无臃肿图形用户界面,具有最小的依赖关系。 该项目的主要功能、关键特性、核心优势包括: 为 C 提供了一个轻量级的图形用户界面库输出优化的顶点缓冲区,可在 3D 渲染应用程序中随时呈…

Django下载使用、文件介绍

【一】下载并使用 【1】下载框架 (1)注意事项 计算机名称不要出现中文python解释器版本不同可能会出现启动报错项目中所有的文件名称不要出现中文多个项目文件尽量不要嵌套,做到一项一夹 (2)下载 Django属于第三方模块&#…

网络套接字-TCP服务器

一 前言 前面已经写过udp服务器的实现了&#xff0c;那里说了很多编写服务器的所需知识&#xff0c;在tcp服务器实现中就不再赘述了。 二 服务端编写 大致接口如下。 ./server port端口号 启动时指明端口号 void usage(const std::string proc) {std::cout<<"Usa…

jetcache 2级缓存模式实现批量清除

需求 希望能够实现清理指定对象缓存的方法&#xff0c;例如缓存了User表&#xff0c;当User表巨大时&#xff0c;通过id全量去清理不现实&#xff0c;耗费资源也巨大。因此需要能够支持清理指定本地和远程缓存的批量方法。 分析 查看jetcache生成的cache接口&#xff0c;并没…

银行监管报送系统介绍(五):金融统计数据大集中自动化报送系统——PBOC Report

人民银行金融统计数据大集中自动化报送系统&#xff08;简称PBOC Report&#xff09;&#xff0c;是基于现代计算机网络技术应用基础上&#xff0c;由人行总行设置金融统计数据服务器&#xff0c;建立的一个全国统一的金融统计数据库。 人行针对各银行存贷款、中间业务、网点人…

上位机图像处理和嵌入式模块部署(qmacvisual之ROI设定)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 ROI&#xff0c;全称是region of interest&#xff0c;也就是感兴趣区域。这里面一般分成两种情况&#xff0c;一种是所有的算法都依赖于这个ROI&a…

基于SpringBoot+Vue+Mybatis的408刷题小程序管理端

简介 原始数据&#xff1a;书目信息、章节信息、题目信息、系统菜单、系统角色、系统用户。 主要任务&#xff1a;系统主要采用spring boot作为后端框架&#xff0c;前端使用vueelementUI&#xff0c;为408刷题小程序提供一个方面的管理和维护的任务&#xff0c;主要功能包括…

【ArcGIS】统计土地利用数据每类面积及占比

1.栅格转面 转换工具/从栅格/栅格转面&#xff0c;得到面.shp 不要勾选简化面&#xff0c;否则会影响面积 2.添加面积字段&#xff0c;计算面积 面.shp添加双精度字段area 查看面.shp属性表中有没有gridcode为0的&#xff0c;如有的话编辑矢量&#xff0c;删除该要素。 计…

大型网站集群管理负载均衡

课程介绍 结合企业大规模应用&#xff0c;解决应用高并发问题&#xff0c;解决单节点故障问题&#xff0c;缓存数据库的应用。学完掌握知识点&#xff1a;企业应用实现四七层负载均衡&#xff0c;以及Nginx等应用的高可用性&#xff0c;Redis缓存数据库的部署应用以及高可用方…

nvm更换node.js的版本

自行下载nvm 打开cmd 1. nvm ls 列出目前已经下载的node版本&#xff0c;和正在使用的node版本 2. nvm install v版本号 下载某个版本 3. nvm uninstall v版本号 卸载某个版本 4. nvm use 版本号 切换到某个版本