2024.2.2 模拟实现 RabbitMQ —— 需求分析

目录

引言

生产者消费者模型作用

消息队列核心概念

Broker Server 内部关键概念

Broker Server 核心 API

交换机(Exchange)类型

关于持久化

关于网络通信

总结


引言

问题:

  • 什么是消息队列(Message Queue / MQ)?

回答:

  • 阻塞队列(Blocking Queue)-> 生产者消费者模型(是在一个进程内部进行的)
  • 消息队列就是将阻塞队列这样的数据结构,单独提取成了一个程序进行独立部署 -> 生产者消费者模型(进程和进程之间 / 服务和服务之间)

注意:

  • 分布式系统 整个服务器程序不是一个单一的程序,而是由一组服务器构成的 集群

生产者消费者模型作用

1、实现了发送方和接收方之间的 解耦

  • 如上图所示,服务器A 调用服务器B
  • A 将请求转发给 B 处理,B 处理完将结果反回给 A,即 A 和 B 之间的耦合是比较大的
  • 如果 A 要调用 B ,则 A 务必要知道 B 的存在
  • 如果 B 挂了,则很容易引起 A 的 bug

  • 如果要是再加一个服务器C,此时也需要对服务器A 进行修改
  • 因此就需要针对 A 重新修改代码、重新测试、重新发布、重新部署 等,十分麻烦! 

  • 引入消息队列后,A 将请求发给消息队列,B 再从消息队列中获取到请求
  • 此时 A 和 B 之间的耦合就降低了很多
  • A 并不知道 B,A 只知道队列,即 A 中的代码没有任何一行与 B 相关
  • B 也不知道 A,B 只知道队列,即 B 中的代码没有任何一行与 A 相关
  • 如果 B 挂了,对 A 没有任何影响,因为只要队列在,A 仍可以继续给队列插入元素,如果队列满了,直接阻塞就行了
  • 如果 A 挂了,对 B 没有任何影响,因为只要队列在,B 仍可以从队列中取元素,如果队列空了,直接阻塞就行了
  • 同时当我们像要新增一个服务器C 来作为消费者时,对于 A 来说是无感知的

2、可以做到 削峰填谷,保证系统的稳定性

  • 我们进行服务器开发,也和上述这个模型是非常相似的
  • 上游就是用户发送的请求,下游就是一些执行具体业务的服务器
  • 用户发多少请求是不可控的

具体理解:

  • 比如 A 为入口服务器,A 调用 B 完成一些具体的任务
  • 如果 A 与 B 直接通信,且 A 突然收到一组用户请求的峰值,此时 B 将随之感受到峰值
  • 引入消息队列后,A 将请求发给队列,B 从队列中获取请求
  • 虽然 A 收到的请求很多,队列收到的请求也不少,但是 B 仍可按照原有节奏来取请求,不至于说一下就收到太多的并发量

  • 市面上一些比较知名的 mq:RabbitMQ、Kafka、RocketMQ、ActiveMQ

注意:

  • 这些 mq 大同小异

消息队列核心概念

一个生产者 + 一个消费者


多个生产者 + 多个消费者

  • 生产者(Producer):发布消息的客户端应用程序
  • 消费者(Consumer):订阅消息的客户端应用程序,用于处理生产者的消息
  • 中间人(Broker):消费者拿生产者的消息时,需经过中间人
  • 发布(Publish):生产者向中间人投递消息的过程
  • 订阅(Subscribe):消费者从中间人获取消息的前提为 先订阅消息
  • 消费(Consume):消费者从中间人这里取数据的操作

注意:

  • 图上画均为服务器!

Broker Server 内部关键概念


虚拟主机(Virtual Host)

  • 类似于 MySQL 中的 database,算是一个 "逻辑" 上的数据集合
  • 实际开发中,一个 Broker Server 上可组织多种不同类别的数据,即可能同时管理多组 业务线上的数据
  • 此时便可以使用 Virtual Host 做出逻辑上的区分

交换机(Exchange)

  • 实际上,当生产者将消息投递给 Broker Server 时,是先将消息交给了 Broker Server 上的某个交换机,再由交换机把消息转发给对应的队列

队列(Queue)

  • 真正用来存储处理消息的实体,后续消费者也是从对应的队列中取数据
  • 一个大的消息队列中,可以有很多具体的小的队列

绑定(Binding)

  • 将交换机和队列之间建立起关联关系
  • 可以把交换机和队列视为是 类似于 数据库 中的 多对多 这样的关系
  • 一个交换机,可以对应到多个队列
  • 一个队列,也可以对应多个交换机
  • 在数据库中,标识多对多关系,会使用一个中间表 / 关联表
  • 而在 mq 中,也是有一个这样的中间表的,所谓的 绑定 其实就是中间表中的一项

消息(Message)

  • 具体来说,可以认为 服务器A 给 B 发送的请求(通过 mq 转发),就是一个消息
  • 服务器B 给 A 返回的响应(通过 mq 转发),也是一个消息
  • 一个消息可视为是一个 字符串(二进制数据)
  • 消息中具体包含啥样的数据,都是程序员自定义的

  • RabbitMQ 就是按照上述概念来组织的(基于 AMQP 协议)

Broker Server 核心 API

  1. 创建队列(queueDeclare)
  2. 销毁队列(queueDelete)
  3. 创建交换机(exchangeDeclare)
  4. 销毁交换机(exchangeDelete)
  5. 创建绑定(queueBind)
  6. 解除绑定(queueUnbind)
  7. 发布消息(basicPublish)
  8. 订阅消息(basicConsume)
  9. 确认消息(basicAck)

问题一:

  • 创建 为啥不使用 Create 这样的术语,而是使用 Declare ?

回答:

  • Create 仅表示单纯的创建
  • Declare 起到的效果为 不存在则创建,存在就啥都不做了

问题二:

  • 我们为啥不要搞一个 api,叫做 "消费消息" 呢?
  • 让消费者通过该 api 从服务器上取走消息

回答:

  • 在当前项目中,并不打算搞一个 "消费消息" 的 api
  • mq 与 消费者之间有两种工作模式:
  • Push(推):Broker 将收到的数据主动发送给订阅的消费者
  • Pull(拉):消费者主动调用 Broker 的 api 获取数据
  • 而 RabbitMQ 仅支持 Push 的方式(Kafka 就能支持 Pull)

注意点一:

  • 确认消息(basicAck) 所起到的效果,是可以让消费者显式的告诉 Broker Server,这个消息我已经处理完毕了
  • 用于提高整个系统的可靠性,以保证消息处理没有遗漏


注意点二:

  • 消息应答模式有两种
  1. 自动应答:消费者将该消息取走了,便算作应答(相当于没应答)
  2. 手动应答:basicAck 方法属于手动应答(消费者需要主动调用这个 api 来进行应答)

注意点三:

  • 对于 RabbitMQ 来说,除了提供肯定的确认,还提供了否定的确认
  • 但此处我们主要实现肯定确认,就不实现否定确认了

注意点三:

  • 此处的项目是以 RabbitMQ 作为蓝本的
  • 即上述 API 名称以及用法均参考的 RabbitMQ

交换机(Exchange)类型

  • 交换机在转发消息时,是有着一套转发规则的!
  • 此处提供了几种不同的 交换机类型(Exchange Type)来描述这里的不同的转发规则
  • RabbitMQ 主要实现了 四种交换机类型(也是 AMQP 协议定义的)

直接交换机(Direct )

  • 生产者发送消息时,会先指定一个 目标队列 的名字
  • 交换机收到之后,就看看绑定的队列里,有没有能够匹配的队列
  • 如果有,则将消息塞进对应的队列中转发过去
  • 如果没有,则直接丢弃掉该消息

扇出交换机(Fanout )


主题交换机(Topic )

  • 有两个关键概念
  1. bindingKey:把队列和交换机绑定的时候,指定一个单词(像是个暗号一样)
  2. routingKey:生产者发送消息的时候,也指定一个单词
  • 如果当前 routingKey 和 bindingKey 能够对上暗号了
  • 此时就可把这个消息转发到对应的队列中了

  • 咱们项目仅实现上述这三种交换机类型

关于持久化

  • 虚拟主机、交换机、队列、绑定、消息等,这些概念对应的数据都需要让 Broker Server 组织管理并存储起来
  • 此时内存和硬盘上都会各自存储一份,以内存为主,硬盘为辅

在内存中存储的原因:

  • 对于 mq 来说,能够高效的转发处理数据,是非常关键的指标
  • 因此使用内存来组织上述数据得到的效率,就比放硬盘中要高很多!

在硬盘中存储的原因:

  • 为了防止内存中的数据随着 进程重启 或 主机重启 而丢失

注意:

  • 硬盘上是能持久存储,但这个持久是相对于 内存 的
  • 对于一个硬盘来说存储消息的寿命,一般为 几年到十几年(一直不通电的情况下)

关于网络通信

  • 其他的服务器(生产者 / 消费者)通过网络与 Broker Server 进行交互
  • 此处设定使用 TCP + 自定义的应用层协议 实现生产者 / 消费者和 Broker Server 之间的交互工作
  • 自定义的应用层协议 要做的主要工作就是让客户端可以通过网络调用 Broker Server 提供的编程接口
  • 因此,在客户端这边也需要提供对应的上述这些方法

  • 如上图所示,服务器版本的方法为真正干实事的,即 将管理数据进行调整
  • 而客户端版本的方法,则只是发送请求 / 接收响应的

具体理解:

  • 此处客户端调用了一个本地方法,结果该方法的背后,又给服务器发来一系列消息,由服务器完成了一系列工作
  • 站在调用者的角度,只是看到了这个功能已经完成了,却不知道这背后的细节
  • 虽然调用的是一个本地方法,但实际上好像调用另一个远端服务器的方法一样
  • 此处可视为是编写客户端服务器程序,通信过程的一种设计思想,即 远程过程调用(RPC)

  • 客户端除了提供下方这 9 个和服务器对应的方法外

  • 客户端还需再提供 4个方法来支撑其他工作
  1. 创建 Connection
  2. 关闭 Connection
  3. 创建 Channel
  4. 关闭 Channel

注意点一:

  • 一个 Connection 对象,就代表一个 TCP 连接

注意点二:

  • Channel ——> 通道/信道
  • 一个 Connection 里面可以包含多个 Channel
  • 每个 Channel 上面传输的数据均 互不相干

问题:

  • 为什么有了 Connection,还要搞一个 Channel ?

回答:

  • TCP 建立 / 断开一个连接的成本,其实还是比较高的
  • 因此,很多时候并不希望频繁的建立 / 断开 TCP 连接
  • 此处的 Channel 仅为一个逻辑上的概念,比起 TCP 连接的建立和断开 要轻量得多
  • Connection 和 Channel 之间的关系就如图网线一样

总结

  • 细化一下具体要做哪些工作?
  1. 需实现 生产者、Broker Server、消费者 这三个部分
  2. 针对生产者和消费者来说,主要编写的是 客户端和服务器 的网络通信部分,给客户端提供一组 api 让客户端的业务代码来调用,从而通过网络通信的方式远程调用 Broker Server 上的方法
  3. 实现 Broker Server 以及 Broker Server 内部的一些基本概念和核心 api【重点】
  4. 上述这些关键数据,如何在硬盘中存储?以啥格式存储?是存储在数据库还是文件中?后续服务器重启了,如何读取上述数据,并将内存中的内容给恢复回来呢?【持久化】

注意:

  • 生产者 的数据从哪来?消费者取到数据之后要干啥?
  • 生产者与消费者具体的业务逻辑都是通用的,无需太多关心

  • 上述工作的最终目标,就是实现一个 分布式系统下 的生产者消费者模型
  • 但是此处我们的 Broker Server 并不支持分布式部署(集群模式)
  • 我们此处实现的仅为一个能够给多个生产者消费者提供服务的单机 Broker Server
  • 但是专业的 mq ,如 RabbitMQ、kafka 这些均支持集群模式,可用性更高、可处理更高的并发、数据能够相互备份

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/367111.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Prometheus 采集Oracle监控数据

前言 oracledb_exporter是一个开源的Prometheus Exporter,用于从Oracle数据库中收集关键指标并将其暴露给Prometheus进行监控和告警。它可以将Oracle数据库的性能指标转换为Prometheus所需的格式,并提供一些默认的查询和指标。 download Oracle Oracle Windows Install …

京东广告算法架构体系建设--大规模稀疏场景高性能训练方案演变

一、前言 京东广告训练框架随着广告算法业务发展的特点也在快速迭代升级,回顾近几年大致经历了两次大版本的方案架构演变。第一阶段,随着2016年Tensorflow训练框架的开源,业界开始基于Tensorflow开源框架训练更复杂的模型。模型对特征规模和…

网络异常案例六_IP冲突

问题现象 同一个局域网下,一个路由器带几十台终端设备,存在终端设备获取到了相同IP的场景。该路由器也是DHCP Server。 有两个设备终端,都显示获取到了192.168.11.177这个ip。 抓包分析 抓包过程中,看到的一些问题。 ps&#x…

PSQL常用操作

目录 前言 准备工作 添加postgres用户 初始化数据库 启动服务 创建数据库 psql连接数据库 常规操作 数据库 schema相关 插件 其他 前言 老折腾,还是记录点啥吧...... 基于本地PG数据库(打包为绿色版本了),实操记录,版本pgsql12…

matlab simulink 步进电机控制

1、内容简介 略 41-可以交流、咨询、答疑 2、内容说明 电动执行器定位控制在生产生活中具有广泛的应用,在使用搭载步进电机的电动执行器进行定位控制的时候,定位系统的定位精度和响应波形,会随着负载质量的变化而变化,这是由电…

在Linux下搭建自己的私有maven库并部署和发布自定义jar依赖和自定义maven插件(三)开发和发布自己开发的maven插件

系列文章目录 在Linux下搭建自己的私有maven库并部署和发布自定义jar依赖和自定义maven插件(二)发布自己开发的jar包 文章目录 系列文章目录在Linux下搭建自己的私有maven库并部署和发布自定义jar依赖和自定义maven插件(二)发布自己开发的jar包 前言一、插件需求二、maven自定…

2024年第四届工业自动化、机器人与控制工程国际会议 | Ei、Scopus双检索

会议简介 Brief Introduction 2024年第四届工业自动化、机器人与控制工程国际会议(IARCE 2024) 会议时间:2024年7月5 -7日 召开地点:中国成都 大会官网:www.iarce.org 2024年第四届工业自动化、机器人与控制工程国际会…

设备的层次结构 - 驱动程序的复杂层次结构

由于设备对象的水平结构和垂直结构,组成了Windows设备的树形结构图。在Windows中出事的时候会有一个根设备,为了理解简单,我们将PCI总线想象成根总线(根总线其实不是PCI总线,只是为了理解方便)。查到PCI总线…

【FX110网】日交所发布1月交易数据:衍生品交易额达历年1月最高!

日本交易所集团(日交所,JPX)发布了其2024年1月的交易数据概览。数据显示,该交易所当月衍生品交易额创新历年来的1月交易数据最高纪录。2024年1月共有19个交易日。 2024年1月交易概览现货股票市场 2024年1月,该交易所主…

ElasticSearch-SpringBoot整合ElasticSearch

六、SpringBoot整合ElasticSearch 1、浏览官方文档 1、查找跟ES客户端相关的文档 使用Java REST Client 选择Java Hight Level REST Client 2、创建项目的准备 1.找到原生的依赖 2.找到对象 3.分析这个类里面的方法 3、正式创建项目 1.创建工程 2.导入依赖 注意依赖版本…

Mac电脑连接linux远程桌面

起因 家庭中的内网下有一台ubuntu虚拟机,只能通过ssh终端操作或者通过实体机进行操作实在有些不方便。所以便想着通过linux远程桌面的方式进行连接,由于家庭内网,延迟还是非常低的。 步骤 首先在ubuntu虚拟机上安装xrdp(可能已…

css3 属性 backface-visibility 的实践应用

backface-visibility 是一个用于控制元素在面对屏幕不同方向时的可见性的CSS3特性。它有两个可能的值: visible:当元素不面向屏幕(即背面朝向用户)时,元素的内容是可以被看到的。hidden:当元素不面向屏幕…

【异常检测复现】【DeSTSeg】在虚拟环境中完成配置

文章目录 1.在虚拟环境中安装git2.更改虚拟环境中包的安装位置3.安装anomalib4.安装虚拟环境5.根据requirements.txt安装包6.选择所建立的虚拟环境,并设置解释器7.查看文件夹的内容8.下载数据集9.引用 记录复现过程中安装各种包的命令 下载数据集到本地 1.在虚拟环境…

颐和园龙纹珍宝展亮相,文物预防保护科技护航

在皇家园林颐和园的深处,一场独特的文化盛宴正静静上演。2月1日,“祥龙贺岁—颐和园藏龙纹题材文物特展”在德和园华丽揭幕。此次特展汇聚了66件珍贵文物,包括玉器、瓷器、书画、珐琅、家具等,每一件都是颐和园园藏的瑰宝。这些文…

【动态规划】【记忆化搜索】【回文】1312让字符串成为回文串的最少插入次数

作者推荐 【动态规划】【字符串】【表达式】2019. 解出数学表达式的学生分数 本文涉及知识点 动态规划汇总 记忆化搜索 回文 字符串 LeetCode1312. 让字符串成为回文串的最少插入次数 给你一个字符串 s ,每一次操作你都可以在字符串的任意位置插入任意字符。 请…

STM32--USART串口(1)串口协议

一、通信接口 全双工:通信双方能够同时进行双向通信; 半双工:通信双方能够进行双向通信,但不能同时通信; 单工:只能从一个设备到另一个设备; 同步:接收方可以在时钟信号的指引下进…

解决Docker打包Eureka注册中心,其他服务无法注册问题

​前言 本文主要是介绍利用docker打包Eureka注册中心,并且发布镜像到服务器,遇到的一个比较坑的问题。主要是服务镜像部署完毕之后,docker容器都能启动,并且也能访问,但是其他服务就是无法注册到注册中心。排除问题&a…

Vite与Webpack打包内存溢出问题优雅处理方式

Vite与Webpack打包内存溢出问题处理 文章目录 Vite与Webpack打包内存溢出问题处理1. Vite1. 打包错误提示2. 命令行方式解决3. 配置环境变量方式解决1. 设置变量2. 配置系统的环境变量 2. Webpack1. 打包错误提示2. 命令行方式解决3. 配置环境变量方式解决1. 设置变量2. 配置系…

华为OD机试真题【日志首次上报最多积分】

1、题目描述 【日志首次上报最多积分】 日志采集是运维系统的的核心组件。日志是按行生成,每行记做一条,由采集系统分批上报。 如果上报太频繁,会对服务端造成压力;如果上报太晚,会降低用户的体验; 如果一次上报的…

bash脚本学习笔记

一、扫盲 脚本文件是一种文本文件,其中包含了一系列的命令和指令,可以被操作系统解释器直接解释执行。脚本文件通常被用来完成特定的任务或执行重复性的操作。 脚本文件通常以某种编程语言的语法编写,例如 Bash、Python、Perl、Ruby 等等。…