day08_Kafka

文章目录

  • day08_Kafka课程笔记
    • 一、今日课程内容
    • 一、消息队列(了解)
      • **为什么消息队列就像是“数据的快递员”?**
      • **实际意义**
      • 1、产生背景
      • 2、消息队列介绍
        • 2.1 常见的消息队列产品
        • 2.2 应用场景
        • 2.3 消息队列中两种消息模型
    • 二、Kafka的基本介绍
      • 1、Kafka基本介绍
      • **为什么 Kafka 就像是“数据的高速公路”?**
      • **实际意义**
      • 2、回顾zookeeper知识
        • 回顾启动zookeeper服务
        • 回顾zookeeper工具连接
      • 3、Kafka的架构(掌握)
    • 三、Kafka的集群搭建(操作)
      • 1、软件安装
      • 2、安装易错点
      • 3、配置Kafka的一键化启动
      • 4、启动服务
      • 5、操作kafka的多种方式
    • 四、Kafka的shell命令使用
        • topics操作
        • producer和consumer操作
        • bootstrap-server和zookeeper以及broker-list的区别:
    • 五、kafka tools工具使用(熟悉)
      • 3-1 连接配置
      • 3-2 创建主题
      • 3-3 删除主题
      • 3-4 主题下的数据查看
      • 3-5 数据发送和接收
    • 六、Kafka的Python API的操作(熟悉)
        • 模块安装
        • 模块使用
          • 3.1 完成生产者代码
          • 3.2 完成消费者代码
  • 01_生产者代码入门.py
  • 02_消费者代码入门.py

day08_Kafka课程笔记

一、今日课程内容

  • 1- 消息队列(了解)
  • 2- Kafka的基本介绍(掌握架构,其他了解)
  • 3- Kafka的集群搭建(操作)
  • 4- Kafka的相关使用(掌握kafka常用shell命令)

今日目的:掌握Kafka架构

在这里插入图片描述

一、消息队列(了解)

  1. 简单来说:消息队列就像是“数据的快递员”,在应用程序之间传递消息,确保数据能够可靠、高效地传输和处理。

  2. 具体而言

    • 核心概念
      • 消息:需要传递的数据单元,可以是文本、JSON、二进制等格式。
      • 队列:存储消息的容器,遵循先进先出(FIFO)的原则。
      • 生产者:发送消息的应用程序。
      • 消费者:接收和处理消息的应用程序。
    • 特点
      • 异步通信:生产者和消费者不需要同时在线,消息可以暂存于队列中。
      • 解耦:生产者和消费者之间无需直接交互,降低了系统耦合度。
      • 可靠性:消息队列通常支持持久化,确保消息不会丢失。
      • 扩展性:支持多个生产者和消费者,便于系统扩展。
  3. 实际生产场景

    • 在电商系统中,使用消息队列处理订单,确保订单数据可靠传输。
    • 在日志收集中,使用消息队列缓冲日志数据,避免数据丢失。
    • 在微服务架构中,使用消息队列实现服务间的异步通信。
  4. 总之:消息队列是分布式系统中重要的组件,通过异步通信和解耦,提高了系统的可靠性、扩展性和灵活性。

为什么消息队列就像是“数据的快递员”?

  1. 传递数据:可靠传输

    • 快递员:将包裹从发件人送到收件人,确保包裹安全到达。
    • 消息队列:将消息从生产者传递到消费者,确保数据可靠传输。
  2. 异步通信:无需实时交互

    • 快递员:发件人和收件人不需要同时在场,包裹可以暂存在快递点。
    • 消息队列:生产者和消费者不需要同时在线,消息可以暂存于队列中,实现异步通信。
  3. 解耦系统:降低依赖

    • 快递员:发件人和收件人无需直接联系,通过快递员完成交互。
    • 消息队列:生产者和消费者之间无需直接交互,降低了系统耦合度。
  4. 可靠性:确保数据不丢失

    • 快递员:通过物流系统确保包裹不丢失。
    • 消息队列:通过持久化机制确保消息不丢失,即使系统故障也能恢复。
  5. 扩展性:支持多对多通信

    • 快递员:可以同时为多个发件人和收件人服务。
    • 消息队列:支持多个生产者和消费者,便于系统扩展和负载均衡。

实际意义

消息队列就像“数据的快递员”,通过异步通信、解耦系统、可靠传输和扩展性,确保数据能够在分布式系统中高效、可靠地传递和处理。

1、产生背景

消息队列:指的数据在一个容器中,从容器中一端传递到另一端的过程

消息(message): 指的是数据,只不过这个数据存在一定流动状态
队列(queue): 指的容器,可以存储数据,只不过这个容器具备FIFO(先进先出)特性
思考: 公共容器需要具备什么特点?
1- 公共性: 各个程序都可以与之对接
2- FIFO特性: 先进先出
3- 具备高效的并发能力: 能够承载海量数据
4- 具备一定的容错能力: 比如支持重新读取消息方案

2、消息队列介绍

2.1 常见的消息队列产品

MQ:message queue消息队列

activeMQ: 出现时期比较早的一款消息队列的中间件产品,在早期使用人群是非常多,目前整个社区活跃度严重下降,使用人群很少了
rabbitMQ: 此款是目前使用人群比较多的一款消息队列的中间件的产品,社区活跃度比较高,主要是应用传统业务领域中
rocketMQ: 是阿里推出的一款消息队列的中间件的产品,目前主要是在阿里系环境中使用,目前支持的客户端比较少,主要是Java中应用较多
Kafka: Apache旗下的顶级开源项目,是一款消息队列的中间件产品项目来源于领英,是大数据体系中目前为止最为常用的一款消息队列的产品

在这里插入图片描述

2.2 应用场景
  • 应用解耦合
  • 异步处理
  • 限流削峰
  • 消息驱动系统
2.3 消息队列中两种消息模型
在Java中, 为了能够集成消息队列的产品, 专门提供了一个消息队列的协议: JMS(Java Message Server)  java消息服务

消息队列中两个角色: 生产者(producer) 和 消费者(consumer)
生产者: 生产/发送消息到消息队列中
消费者: 从消息队列中获取消息

在JMS规范中, 专门规定了两种消息消费模型: 
1- 点对点消费模型: 指的一条消息最终只能被一个消费者所消费。微信聊天的私聊
2- 发布订阅消费模型: 指的一条消息最终被多个消费者所消费。微信聊天的群聊

二、Kafka的基本介绍

1、Kafka基本介绍

​ Kafka是一款消息队列的中间件产品, 来源于领英公司, 后期贡献给了Apache, 目前是Aapche旗下的顶级开源项目, 采用语言是Scala

​ 官方地址: http://kafka.apache.org

kafka的特点:

  • 可靠性:Kafka集群是分布式的,并且有多副本的机制。数据可以自动复制
  • 可扩展性:Kafka集群可以灵活的调整,在线扩容
  • 耐用性:Kafka数据保存在磁盘上面,数据并且有多副本的机制。数据持久化,而且可以一定程度上防止数据丢失
  • 高性能:Kafka可以存储海量的数据,虽然是使用磁盘进行数据存储,但是Kafka有各种优化手段(例如:磁盘的顺序读写、零拷贝等)提高数据的读写速度(吞吐量)
  1. 简单来说:Kafka是一个分布式的流数据平台,就像是“数据的高速公路”,能够高效地处理实时数据流,支持数据的发布、订阅、存储和处理。

  2. 具体而言

    • 核心概念
      • Topic:数据流的分类,类似于消息队列的主题。
      • Producer:数据生产者,将数据发布到Topic。
      • Consumer:数据消费者,从Topic订阅数据。
      • Broker:Kafka集群中的服务器节点,负责存储和转发数据。
      • Partition:Topic的分区,支持并行处理和水平扩展。
    • 特点
      • 高吞吐量:支持每秒处理数百万条消息。
      • 持久化:数据持久化到磁盘,支持数据重放。
      • 分布式:支持集群部署,具备高可用性和容错能力。
      • 实时性:支持实时数据流的处理和分析。
  3. 实际生产场景

    • 在日志收集中,使用Kafka收集和传输分布式系统的日志数据。
    • 在实时推荐系统中,使用Kafka处理用户行为数据,实时更新推荐结果。
    • 在金融领域,使用Kafka处理交易数据,进行实时风险监控。
  4. 总之:Kafka是一个强大的分布式流数据平台,广泛应用于实时数据处理、日志收集和消息传递等场景,为大数据生态系统提供了高效、可靠的数据传输和处理能力。

为什么 Kafka 就像是“数据的高速公路”?

  1. 高速传输:高效处理数据流

    • 高速公路:车辆可以快速、高效地通行。
    • Kafka:支持高吞吐量,每秒可以处理数百万条消息,确保数据流的高速传输。
  2. 多车道并行:分区与扩展

    • 高速公路:多车道设计,支持车辆并行通行。
    • Kafka:通过Partition(分区)实现数据的并行处理和水平扩展,提高数据处理能力。
  3. 持久化存储:数据不丢失

    • 高速公路:有完善的基础设施,确保车辆安全通行。
    • Kafka:数据持久化到磁盘,支持数据重放,确保数据不丢失。
  4. 分布式架构:高可用性与容错

    • 高速公路:有多条备用路线,避免交通堵塞或事故中断。
    • Kafka:支持集群部署,具备高可用性和容错能力,即使部分节点故障,数据仍能正常传输。
  5. 实时性:快速响应

    • 高速公路:车辆可以快速到达目的地。
    • Kafka:支持实时数据流的处理和分析,确保数据能够快速传递到消费者。

实际意义

Kafka就像“数据的高速公路”,通过高吞吐量、分区并行、持久化存储和分布式架构,确保数据流能够高效、可靠地传输和处理,为实时数据应用提供了强大的支持。

2、回顾zookeeper知识

Kafka需要使用到zookeeper服务!

回顾启动zookeeper服务
# 三台都需要启动zookeeper服务
[root@node1 ~]# /export/server/zookeeper/bin/zkServer.sh start
[root@node2 ~]# /export/server/zookeeper/bin/zkServer.sh start
[root@node3 ~]# /export/server/zookeeper/bin/zkServer.sh start
回顾zookeeper工具连接

使用hadoop阶段发的ZooInspector软件,双击zookeeper-dev-ZooInspector.jar启动

在这里插入图片描述
在这里插入图片描述

3、Kafka的架构(掌握)

回顾HDFS写入过程:

在这里插入图片描述

Kafka架构:
在这里插入图片描述

1- Kafka中集群节点叫broker,节点和节点之间没有主从之分,地位是完全一样
2- Topic:主题/话题,是业务层面对消息进行分类的。
3- 一个Topic可以设置多个Partition分区。
4- 同一个Partition分区可以设置多个副本,但是副本数不能超过(>)集群broker节点的个数
5- 虽然broker节点间没有主从之分,但是同一个Partition分区的不同副本间有主从之分,分为了Leader主副本和Follower从副本
6- 生产者将数据首先发送给到Leader主副本,接着是Leader主副本主动的往Follower从副本上同步消息
7- Zookeeper用来管理集群,以及管理元数据信息
8- ISR同步列表。该列表中存放的是与Leader主副本消息同步程度最接近的Follower从副本,也就是消息最小的一个列表。该列表作用,当Leader主副本无法对外提供服务的时候,会从该ISR列表中选择一个Follower从副本变成Leader主副本,对外提供服务


相关名词:
Kafka Cluster: Kafka集群
Topic: 主题/话题
Broker: Kafka中的节点
Producer: 生产者,负责生产/发送消息到Kafka中
Consumer: 消费者,负责从Kafka中获取消息
Partition: 分区。一个Topic可以设置多个分区,没有数量限制

三、Kafka的集群搭建(操作)

1、软件安装

环境搭建,参考【Spark课程阶段_部署文档.doc】的9.1章节内容。

2、安装易错点

  • 1- 配置文件中监听地址前面的注释,记得打开。也就是删除最前面的#

  • 2- 分发之后,记得要修改每个server.sql的 id 和 监听地址

  • 3- 分发之后,记得source /etc/profile让环境变量生效

  • 4- 没有启动zookeeper,或者仅仅启动了其中一台

  • 5- 启动的时候server.sql中路径,不要写错了

3、配置Kafka的一键化启动

注意:使用一键化脚本,也得需要先启动zookeeper

环境搭建,参考【Spark课程阶段_部署文档.doc】的9.4章节内容。

4、启动服务

方式1: 正常启动

# 1.先在三台机器都输入以下命令,启动ZooKeeper
/export/server/zookeeper/bin/zkServer.sh start

# 2.再在三台集群上都输入以下命令,启动Kafka
# 注意:下面是一条命令!!!
nohup /export/server/kafka/bin/kafka-server-start.sh /export/server/kafka/config/server.sql 2>&1 &

方式2: 使用kafka的onekey脚本

# 1.先在三台机器都输入以下命令,启动ZooKeeper
/export/server/zookeeper/bin/zkServer.sh start

# 2.只在node1上一键启动所有kafka服务
/export/onekey/start-kafka.sh

5、操作kafka的多种方式

在这里插入图片描述

四、Kafka的shell命令使用

​ Kafka本质上就是一个消息队列的中间件的产品,主要负责消息数据的传递。也就说学习Kafka 也就是学习如何使用Kafka生产数据,以及如何使用Kafka来消费数据

topics操作

注意:

创建topic不指定分区数和副本数,默认都是1个

分区数可以后期通过alter增大,但是不能减小

副本数一旦确定,不能修改!

参数如下:

cd /export/server/kafka/bin

./kafka-topics.sh 参数说明:
	--bootstrap-server: Kafka集群中broker服务器
	--topic: 指定Topic名称
	--partitions: 设置Topic的分区数,可以省略不写
	--replication-factor: 设置Topic分区的副本数,可以省略不写
	
	--create: 指定操作类型。这里是新建Topic
	--delete: 指定操作类型。这里是删除Topic
	--alter: 指定操作类型。这里是修改Topic
	--list: 指定操作类型。这里是查看所有Topic列表
	--describe: 指定操作类型。这里是查看详细且具体的Topic信息
	
  • 1- 创建Topic
# 创建topic,默认1个分区,1个副本
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --create --topic itcast 

# 可以使用以下参数提前查看是否是默认1个
--list: 指定操作类型。这里是查看所有Topic列表
--describe: 指定操作类型。这里是查看详细且具体的Topic信息
# 注意: 如果副本数超过了集群broker节点个数,就会报错
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --create --topic itheima --partitions 4 --replication-factor 4

在这里插入图片描述

# 把replication-factor改成3以内就能创建成功了
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --create --topic itheima --partitions 4 --replication-factor 3
  • 2- 查看Topic
# --list查看所有topic  只有名称信息
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --list
# --describe 可以查看详细Topic信息
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --describe 

# --describe 可以查看具体Topic信息
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --describe --topic itheima

在这里插入图片描述

当然也可使用zookeeper客户端查看
在这里插入图片描述

  • 3- 修改Topic

    本质就是扩容分区!!!

    因为分区不能减小,副本不能修改

# 增大topic分区
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --alter --topic itcast --partitions 4
# 注意: partitions分区,只能增大,不能减小。而且没有数量限制
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --alter --topic itcast --partitions 1

在这里插入图片描述

# 注意: 副本既不能增大,也不能减小
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --alter --topic itcast --partitions 4 --replication-factor 2

在这里插入图片描述

  • 4- 删除Topic
# 再创建一个spark主题
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --create --topic spark

/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --list

# 删除spark主题

/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --delete --topic spark

/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --list

producer和consumer操作

消费者要和生产者指定是同一个topic主题,才能接收到消息

参数如下:

cd /export/server/kafka/bin

./kafka-console-producer.sh 参数说明
	--broker-list: Kafka集群中broker服务器
	--topic: 指定Topic
	
./kafka-console-consumer.sh 参数说明
	--bootstrap-server: Kafka集群中broker连接信息
	--topic: 指定Topic
	latest: 消费者(默认)从最新的地方开始消费
	--from-beginning: 指定该参数以后,会从最旧的地方开始消费
	--max-messages: 最多消费的条数。
  • 1- 模拟生产者Producer
# 为了方便演示再创建一个topic,名称为spark
/export/server/kafka/bin/kafka-topics.sh --bootstrap-server node1:9092 --create --topic spark

# 模拟生产者给spark发送消息
/export/server/kafka/bin/kafka-console-producer.sh --broker-list node1:9092 --topic spark

-- 注意: 上述命令执行完后,出现 >,可以输入对应的消息了
  • 2- 模拟消费者Consumer

    注意: 可以右键CRT客户端连接->克隆会话来模拟多个消费者

# 模拟消费者从spark获取消息,默认每次拿最新的
/export/server/kafka/bin/kafka-console-consumer.sh --bootstrap-server node1:9092 --topic spark 

-- 注意: 输入完上述命令后,自动接收最新的消息(因为默认latest),还可以持续接收...


# --from-beginning 会从最旧的地方开始消费
/export/server/kafka/bin/kafka-console-consumer.sh --bootstrap-server node1:9092 --topic spark --from-beginning

-- 注意: 输入完上述命令后,自动接收了生产者发送的所有消息,还可以持续接收...


# --max-messages x 可以设置从最旧的地方最大消费次数x
/export/server/kafka/bin/kafka-console-consumer.sh --bootstrap-server node1:9092 --topic spark --from-beginning --max-messages 2

-- 注意: 输入完上述命令后,只接收了前2个消息就结束了,不会持续接收

注意:

我们有时候发现消费者打印出来的消息和生产者生产的顺序不一致,是乱序的。原因如下:

topic有多个分区,底层是多线程来读取数据并进行打印输出。因此会存在乱序现象

bootstrap-server和zookeeper以及broker-list的区别:
旧版(<v2.2): kafka-topics.sh --zookeeper node1:2181,node2:2181,node3:2181/kafka --create --topic ..
注意: 旧版用--zookeeper参数,主机名(或IP)和端口用ZooKeeper的2181,也就是server.sql文件中zookeeper.connect属性的配置值.

新版(>v2.2): kafka-topics.sh --bootstrap-server node1:9092 --create --topic ..
注意: 新版用--bootstrap-server参数,主机名(或IP)和端口用某个节点的即可,即主机名(或主机IP):9092。9092是Kafka的监听端口



broker-list:broker指的是kafka的服务端,可以是一个服务器也可以是一个集群。producer和consumer都相当于这个服务端的客户端。一般我们在使用console producer的时候,broker-list参数是必备参数,另外一个必备的参数是topic

bootstrap-servers: 指的是kafka集群的服务器地址,这个和broker-list功能是一样的,只不过我们在console producer要求用broker-list,其他地方都采用bootstrap-servers。
  1. 简单来说bootstrap-serverzookeeperbroker-list是Kafka中用于连接和协调的核心概念,分别像是“导航员”、“协调员”和“服务列表”,各自承担不同的角色和功能。

  2. 具体而言

    • bootstrap-server

      • 功能:用于客户端(Producer和Consumer)连接Kafka集群的入口点。客户端通过bootstrap-server获取集群的元数据(如Topic分区信息),并自动发现其他Broker。
      • 特点:支持自动发现集群中的其他Broker,简化了配置和管理。
      • 使用场景:适用于Kafka 0.9及以上版本,推荐在新版本中使用。
      • 示例
        kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test
        
    • zookeeper

      • 功能:在早期版本(Kafka 0.8及以前)中,Zookeeper用于管理Kafka集群的元数据(如Broker状态、Topic分区信息)和消费者偏移量(offset)。
      • 特点:依赖Zookeeper会增加系统复杂性和性能开销,因此在Kafka 0.9及以后版本中,逐渐被bootstrap-server取代。
      • 使用场景:适用于旧版本Kafka,或需要与Zookeeper集成的场景。
      • 示例
        kafka-console-consumer.sh --zookeeper localhost:2181 --topic test
        
    • broker-list

      • 功能:指定Kafka集群中的一个或多个Broker地址,主要用于Producer连接集群并发送消息。
      • 特点:需要手动配置Broker地址列表,不支持自动发现其他Broker。
      • 使用场景:适用于Producer的配置,尤其是在旧版本或特定场景下。
      • 示例
        kafka-console-producer.sh --broker-list localhost:9092 --topic test
        
  3. 实际生产场景

    • 在新版Kafka中,推荐使用bootstrap-server,因为它简化了配置并支持自动发现集群中的其他Broker。
    • 在旧版Kafka中,可能需要使用zookeeper来管理消费者偏移量和集群元数据。
    • 对于Producer,broker-list仍然是一个常用的配置参数,尤其是在需要手动指定Broker地址时。
  4. 总之bootstrap-serverzookeeperbroker-list在Kafka中各有其作用,bootstrap-server是新版本的推荐选择,zookeeper适用于旧版本,而broker-list主要用于Producer的配置。根据Kafka版本和具体需求选择合适的配置方式,可以提高系统的性能和可维护性。

如果需要更详细的信息,可以参考相关文档或搜索来源。

五、kafka tools工具使用(熟悉)

可以在可视化的工具通过点击来操作kafka完成主题的创建,分区等操作
在这里插入图片描述
注意: 安装完后桌面不会有快捷方式,需要去电脑上搜索,或者去自己选的安装位置找到发送快捷方式到桌面!
在这里插入图片描述
在这里插入图片描述

3-1 连接配置

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 修改工具的数据显示类型字符串类型

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

3-2 创建主题

在这里插入图片描述
在这里插入图片描述

3-3 删除主题

在这里插入图片描述
在这里插入图片描述

3-4 主题下的数据查看

在这里插入图片描述

3-5 数据发送和接收

  • 3-5 发送消息数据到kafka

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

六、Kafka的Python API的操作(熟悉)

模块安装

纯Python的方式操作Kafka。

准备工作:在node1的节点上安装一个python用于操作Kafka的库

安装kafka-python 模模块 ,模块中提供了操作kafka的方法

在线安装

在node1上安装就可以,需要保证服务器能够连接网络

安装命令: python -m pip install kafka-python -i https://pypi.tuna.tsinghua.edu.cn/simple

在这里插入图片描述

离线安装

将kafka_python-2.0.2-py2.py3-none-any.whl安装包上传服务器software目录下进行安装

安装命令: pip install kafka_python-2.0.2-py2.py3-none-any.whl
模块使用

API使用的参考文档: https://kafka-python.readthedocs.io/en/master/usage.html#kafkaproducer

模块中封装了两个类,

一个是生成者类KafkaProducer,提供了向kafka写数据的方法

另一个是消费者类KafkaConsumer,提供了读取kafka数据的方法

3.1 完成生产者代码

生成者类KafkaProducer,提供了向kafka写数据的方法

send(topic,valu)方法: 发送消息
topic参数:指定向哪个主题发送消息
value参数:指定发送的消息数据 ,数据类型要求是bytes类型

示例:

# 导包
from kafka import KafkaProducer

# 编写代码
if __name__ == '__main__':
    # 创建生产者对象并指定对应服务器
    producer = KafkaProducer(bootstrap_servers=['node1:9092'])
    # 发送消息
    for i in range(1,101):
        future = producer.send('kafka', f'hi_kafka_{i}'.encode())
        # 获取元数据
        record_metadata = future.get()
        # 从元数据中获取主题,分区,偏移
        print(record_metadata.topic)
        print(record_metadata.partition)
        print(record_metadata.offset)
3.2 完成消费者代码

消费者类KafkaConsumer,提供了读取kafka数据的方法

KafkaConsumer(topic,bootstrap_servers)
第一个参数:指定消费者连接的主题,
第二个参数:指定消费者连接的kafka服务器

示例:

# 导包
from kafka import KafkaConsumer

# 编写代码
if __name__ == '__main__':

    # 创建消费者对象
    consumer = KafkaConsumer('kafka',bootstrap_servers=['node1:9092'])
    # 遍历对象
    for message in consumer:

        # 格式化打印,设置相关参数
        # 因为value是二进制,需要decode解码
        print ("主题:%s,分区:%d,偏移:%d : key=%s value=%s"
               % (message.topic, message.partition,message.offset, message.key, message.value.decode('utf8')))

可能遇到的错误:

在这里插入图片描述

原因: 服务器环境有问题。是因为服务器上既安装了kafka-python的第三方依赖,同时还安装kafka的第三方依赖。可以通过pip list | grep kafka进行确定
解决办法: 先将这两个第三方依赖全部卸载,然后再重新执行如下命令
python -m pip install kafka-python -i https://pypi.tuna.tsinghua.edu.cn/simple

01_生产者代码入门.py

# 导包
import time

from kafka import KafkaProducer


# 异步发送:生产者发送消息后不会等待 Kafka 的确认,这种方式可以提高吞吐量,但可能会牺牲一定的可靠性,因为生产者无法立即知道消息是否成功发送。通常可以通过回调函数来处理发送结果。
def yibu():
    # 创建生产者对象
    producer = KafkaProducer(bootstrap_servers=['node1:9092'])
    # 发送消息到kafka
    # 发送1到10数字到test_python主题中
    for i in range(1, 11):
        # 如果主题不存在就会自动创建对应主题(默认分区数是1),存在就使用
        producer.send(topic='python_test2', value=f'你好啊~{i}'.encode('utf-8'))
    # 最后一定用close()释放资源一次性把对应消息发送到kafka中或者让程序多等待一会儿
    # producer.close()
    time.sleep(3)


# 同步发送:生产者发送消息后会阻塞等待 Kafka 确认消息已成功写入,这种方式可以确保消息发送的可靠性,但会降低吞吐量。
def tongbu():
    # 创建生产者对象
    producer = KafkaProducer(bootstrap_servers=['node1:9092'])
    # 发送消息到kafka
    # 发送1到10数字到test_python主题中
    for i in range(1, 11):
        # 如果主题不存在就会自动创建对应主题(默认分区数是1),存在就使用
        f = producer.send(topic='python_test2', value=f'测试积压问题5~{i}'.encode('utf-8'))
        # 获取消息的元数据
        meta = f.get(timeout=10)
        print(f"主题:{meta.topic},分区:{meta.partition},消息偏移量:{meta.offset}")


# main程序入口
if __name__ == '__main__':
    # 抽取方法的快捷键: 先选中代码, 然后按住ctrl+alt+M,最后起名字确认就行
    tongbu()

02_消费者代码入门.py

# 导包
from kafka import KafkaConsumer

# main程序入口
if __name__ == '__main__':
    # 创建消费者对象
    consumer = KafkaConsumer('python_test2', group_id='g_1', bootstrap_servers=['node1:9092'],  auto_offset_reset='earliest')
    # 获取消息
    # 注意: 默认是获取最新的消息
    for msg in consumer:
        print(f"主题:{msg.topic},分区:{msg.partition},消息内容:{msg.value.decode('utf-8')}")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/954079.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

459. 重复的子字符串【力扣】——kmp拼接字符串解法

常规kmp解答 class Solution { public:void getNext(int *next,string s){int j0;next[0]0;for(int i1;i<s.size();i){while(j>0 && s[i]!s[j]){jnext[j-1];}if(s[i]s[j]) j;next[i]j;}}bool repeatedSubstringPattern(string s) {if(s.size()0) return false;i…

浅谈云计算06 | 云管理系统架构

云管理系统架构 一、云管理系统架构&#xff08;一&#xff09;远程管理系统&#xff08;二&#xff09;资源管理系统&#xff08;三&#xff09;SLA 管理系统&#xff08;四&#xff09;计费管理系统 二、安全与可靠性保障&#xff08;一&#xff09;数据安全防线&#xff08;…

【STM32】HAL库USB实现软件升级DFU的功能操作及配置

【STM32】HAL库USB实现软件升级DFU的功能操作及配置 文章目录 DFUHAL库的DFU配置修改代码添加条件判断和跳转代码段DFU烧录附录&#xff1a;Cortex-M架构的SysTick系统定时器精准延时和MCU位带操作SysTick系统定时器精准延时延时函数阻塞延时非阻塞延时 位带操作位带代码位带宏…

PHP答题考试系统

&#x1f50d; 这是一款由PHP与Uniapp强强联手打造的小程序答题考试系统&#xff0c;它如同智慧教育领域中的一颗璀璨明珠&#xff0c;凭借其强大的功能和灵活多变的应用&#xff0c;牢牢吸引了无数求知者的目光。系统全面覆盖了多种试题类型&#xff0c;从基础易懂的判断题、单…

瑞芯微 RK 系列 RK3588 使用 ffmpeg-rockchip 实现 MPP 视频硬件编解码-代码版

前言 在上一篇文章中&#xff0c;我们讲解了如何使用 ffmpeg-rockchip 通过命令来实现 MPP 视频硬件编解码和 RGA 硬件图形加速&#xff0c;在这篇文章&#xff0c;我将讲解如何使用 ffmpeg-rockchip 用户空间库&#xff08;代码&#xff09;实现 MPP 硬件编解码。 本文不仅适…

Element Plus 之 el-table相同行合并(通用函数),相同列合并(自行判断需合并的字段以及相应的列下标)

展示 代码 <el-table :data"tableData" border style"width: 100%" :span-method"objectSpanMethod"><el-table-column prop"date" label"Date" width"180" align"center" /><el-table…

深入理解计算机系统阅读笔记-第十二章

第12章 网络编程 12.1 客户端-服务器编程模型 每个网络应用都是基于客户端-服务器模型的。根据这个模型&#xff0c;一个应用时由一个服务器进程和一个或者多个客户端进程组成。服务器管理某种资源&#xff0c;并且通过操作这种资源来为它的客户端提供某种服务。例如&#xf…

ubuntu20.04安装MySQL5.7

deb安装 下载deb文件并配置 wget https://repo.mysql.com//mysql-apt-config_0.8.12-1_all.deb sudo dpkg -i mysql-apt-config_0.8.12-1_all.deb我使用xshell可以正常。 这个弹出框里&#xff0c;选择的是“ubuntu bionic”。(在终端工具上&#xff0c;有可能显示不了选项)【…

CSS | CSS实现两栏布局(左边定宽 右边自适应,左右成比自适应)

目录 一、左边定宽 右边自适应 1.浮动 2.利用浮动margin 3.定位margin 4.flex布局 5.table 布局 二、左右成比自适应 1:1 1flex布局 table布局 1:2 flex布局 三列布局链接&#xff1a;CSS | 实现三列布局&#xff08;两边边定宽 中间自适应&#xff0c;自适应成比&#xff09;-…

Win10微调大语言模型ChatGLM2-6B

在《Win10本地部署大语言模型ChatGLM2-6B-CSDN博客》基础上进行&#xff0c;官方文档在这里&#xff0c;参考了这篇文章 首先确保ChatGLM2-6B下的有ptuning AdvertiseGen下载地址1&#xff0c;地址2&#xff0c;文件中数据留几行 模型文件下载地址 &#xff08;注意&#xff1…

Java中异常的学习

目录 Java 异常概述 异常的抛出机制 异常的解决方法(处理机制) Java异常体系结构 常见的异常 异常处理 try catch finally throws throw 运行期异常和编译期异常 自定义异常 Java 异常概述 在使用计算机语言进行项目开发的过程中&#xff0c;即使程序员把代码写得尽…

python 连接高斯数据库报错

问题1&#xff1a;报错信息&#xff1a; import psycopg2时报错 /lib64/libgssapi_krib5.so.2 symbol krb5_ser_contect_init version krb5_3_MIT not defined in file libkrb5.so.3 错误原因&#xff1a; 解决&#xff1a; 若通过更换krb相关安装包&#xff0c;psycopg2 …

excel 整理表格,分割一列变成多列数据

数据准备 对于很多系统页面的数据是没有办法下载的。 这里用表格数据来举例。随便做数据的准备。想要看excel部分的可以把这里跳过&#xff0c;从数据准备完成开始看。 需要一点前端基础知识&#xff0c;但不多&#xff08;不会也行&#xff09;。 把鼠标放在你想要拿到本地的…

刀客doc:快手的商业化架构为什么又调了?

一、 1月10日&#xff0c;快手商业化及电商事业部进行新一轮的架构调整。作为2025年快手的第一次大调整&#xff0c;变动最大的是负责广告业务的商业化事业部。快手商业化将原来的8个业务中心&#xff0c;现在统合成了5个&#xff0c;行业归拢看上去更加明晰了。 根据自媒体《…

thinkphp 5.0 结合redis 做延迟队列,队列无法被消费

目录 一、Linux 环境下 二、如何验证消息队列被正确监听 一、Linux 环境下 项目部署在Linux 环境下&#xff0c;首先找到项目的部署路径&#xff0c;接着输入命令,这个命令是以守护进程方式进行监听你的队列&#xff0c;只要redis 不关闭 就可以一直监听这个队列 nohup php …

计算机网络 (40)域名系统DNS

前言 计算机网络域名系统DNS&#xff08;Domain Name System&#xff09;是互联网的基础技术之一&#xff0c;它负责将人类可读的域名转换为计算机用来通信的数字IP地址。 一、基本概念 DNS的主要目的是将域名解析或翻译为IP地址&#xff0c;使得用户可以通过简单易记的域名来访…

做一个 简单的Django 《股票自选助手》显示 用akshare 库(A股数据获取)

图&#xff1a; 股票自选助手 这是一个基于 Django 开发的 A 股自选股票信息查看系统。系统使用 akshare 库获取实时股票数据&#xff0c;支持添加、删除和更新股票信息。 功能特点 支持添加自选股票实时显示股票价格和涨跌幅一键更新所有股票数据支持删除不需要的股票使用中…

C#使用OpenTK绘制3D可拖动旋转图形三棱锥

接上篇,绘制着色矩形 C#使用OpenTK绘制一个着色矩形-CSDN博客 上一篇安装OpenTK.GLControl后,这里可以直接拖动控件GLControl 我们会发现GLControl继承于UserControl //// 摘要:// OpenGL-aware WinForms control. The WinForms designer will always call the default//…

《C++11》nullptr介绍:从NULL说起

在C11之前&#xff0c;我们通常使用NULL来表示空指针。然而&#xff0c;NULL在C中有一些问题和限制&#xff0c;这就是C11引入nullptr的原因。本文将详细介绍nullptr的定义、用法和优点。 1. NULL的问题 在C中&#xff0c;NULL实际上是一个整数0&#xff0c;而不是一个真正的…

Postman 接口测试平替工具,可视化开发省事!

在软件开发的漫长旅程中&#xff0c;接口测试工具一直是开发者的得力助手。Postman 作为全球知名的接口测试工具&#xff0c;长期占据市场主导地位。然而&#xff0c;随着国产工具的崛起&#xff0c;越来越多的开发者开始寻找更适合中国开发者的替代方案。一款 Apifox&#xff…