【Kafka】2.深入理解Kafka事件流平台及其核心概念

1.事件流(Event streaming)

事件流是人体中枢神经系统的数字化的等价物。它是构建“始终在线”世界的技术基础,在这个世界中,企业越来越多地被定义为软件化和自动化,而软件的用户本身也是软件。

从技术上讲,事件流是从数据库、传感器、移动设备、云服务和软件应用程序等事件源实时捕获数据的做法,以事件流的形式;将这些事件流持久化存储以供以后检索;实时以及回顾性地操作、处理和响应事件流;并根据需要将事件流路由到不同的目标技术。因此,事件流确保了数据的持续流动和解释,以便正确的信息在正确的地点,正确的时间可用。

2.事件流作用

事件流适用于各种用例,跨越众多行业和组织。它的许多例子包括:

  • 实时处理支付和金融交易,例如在证券交易所、银行和保险公司。
  • 实时跟踪和监控汽车、卡车、车队和货物,例如在物流和汽车行业。
  • 持续捕获和分析来自IoT设备或其他设备的传感器数据,例如在工厂和风力公园。
  • 收集并立即响应客户互动和订单,例如在零售、酒店和旅游行业以及移动应用程序中。
  • 在医院护理中监测患者并预测病情变化,以确保在紧急情况下及时治疗。
  • 连接、存储并使公司不同部门产生的数据可用。
  • 作为数据平台、事件驱动架构和微服务的基础。

3.Kafka是一个事件流平台意味着什么?

Kafka结合了三个关键能力,因此您可以使用一个经过实战考验的解决方案端到端实现您的事件流用例:

  • 发布(写入)和订阅(读取)事件流,包括从其他系统中持续导入/导出您的数据。
  • 持久可靠地存储事件流,只要您需要。
  • 实时或回顾性地处理事件流。

所有这些功能都以分布式、高度可扩展、弹性、容错和安全的方式提供。Kafka可以在裸机硬件、虚拟机上部署,也可以在容器中部署,在本地以及云中。您可以选择自行管理Kafka环境或使用各种供应商提供的全托管服务。

4.Kafka如何运作?

Kafka是一个由服务器和客户端组成的分布式系统,通过高性能的TCP网络协议进行通信。它可以在本地硬件、虚拟机和容器上部署,在本地以及云环境中。

服务器: Kafka作为一台或多台服务器的集群运行,可以跨越多个数据中心或云区域。其中一些服务器形成存储层,称为代理。其他服务器运行Kafka Connect,以持续地将数据作为事件流导入和导出,将Kafka与您现有的系统集成,例如关系数据库以及其他Kafka集群。为了让您实现关键任务用例,Kafka集群具有高度的可扩展性和容错性:如果任何服务器失败,其他服务器将接管它们的工作,以确保不间断的操作,而不会丢失任何数据。

客户端: 它们允许您编写分布式应用程序和微服务,以并行、大规模和容错的方式读取、写入和处理事件流,即使在网络问题或机器故障的情况下也是如此。Kafka随附了一些这样的客户端,这些客户端由Kafka社区提供的数十个客户端增强:客户端可用于Java和Scala,包括更高级别的Kafka Streams库,适用于Go、Python、C/C++等许多其他编程语言,以及REST API。

5.主要概念和术语

事件记录了“某事发生”的事实,无论是在世界还是您的业务中。它也称为记录或消息(Message)。当您读取或写入Kafka中的数据时,您是通过事件的形式进行的。概念上,一个事件有一个键、值、时间戳和可选的元数据头。这里是一个示例事件:

  • 事件键:“Alice”
  • 事件值:“向Bob支付了200美元”
  • 事件时间戳:“2020年6月25日下午2:06”
    生产者(Producer)是发布(写入)事件到Kafka的客户端应用程序,消费者(Consumer)是订阅(读取和处理)这些事件的应用程序。在Kafka中,生产者和消费者是完全解耦的,并且彼此不知情,这是实现Kafka众所周知的高可扩展性的关键设计元素。例如,生产者永远不需要等待消费者。Kafka提供了各种保证,例如能够精确处理事件的能力。

事件被组织并持久地存储在主题(Topic)中。非常简化地说,主题类似于文件系统中的文件夹,事件是该文件夹中的文件。一个示例主题名称可能是“payments”。Kafka中的主题始终是多生产者和多订阅者:一个主题可以有零、一个或多个生产者将事件写入其中,以及零、一个或多个消费者订阅这些事件。主题中的事件可以根据需要读取尽可能多次 - 与传统的消息系统不同,事件在消费后不会被删除。相反,您通过每个主题的配置设置定义Kafka应该保留您的事件多长时间,之后旧的事件将被丢弃。Kafka的性能对于数据大小实际上是恒定的,因此长时间存储数据完全没有问题。

主题是分区(Partition)的,这意味着主题分布在位于不同Kafka代理上的“桶”上。您的数据的分布式放置对于可扩展性非常重要,因为它允许客户端应用程序同时从/向许多代理读取和写入数据。当发布到主题的新事件时,它实际上被追加到主题的某个分区中。具有相同事件键(例如,客户或车辆ID)的事件被写入到同一个分区中,并且Kafka保证任何给定主题-分区的消费者总是能够按照它们被写入的完全相同的顺序读取那些分区中的事件。
 图示:这个示例主题有四个分区P1-P4。两个不同的生产者客户端正独立于彼此地向主题发布新事件,通过在网络中向主题的分区写入事件。具有相同键(在图中用颜色表示)的事件被写入同一个分区。请注意,如果适当,两个生产者都可以向同一个分区写入。
为了使您的数据具有容错性和高可用性,每个主题都可以复制,甚至可以跨地理区域或数据中心复制,以便在出现问题、您想要对代理进行维护等情况下,始终有多个代理拥有数据的副本。一个常见的生产设置是3的复制因子,即,您的数据将始终有三份副本。这种复制是在主题-分区级别上执行的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/630536.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue3专栏项目 -- 六、上传组件(上)

1、上传组件需求分析 我们还需要新建和展示文章,新建文章自然是发送post请求,同时在post中自带对应的数据,展示文章就是根据id取出已有的数据并且展示出来。 这里有一个难点就是上传组件,上传文件是App应用中最基本的需求&#…

如何在Idea离线情况下安装vue.js插件

亲践有效,步骤如下: 1. 互联网环境登陆vue.js官网(Vue.js - IntelliJ IDEs Plugin | Marketplace)。 2. 然后先确定你的IDEA的版本:在你IDEA的安装文件中找到product-info.json,里面的buildNumber记录着你IDEA的精确版本号,根据…

ROS2系统与px4通信测试

参考文章: No communication with ROS2 using MicroXRCEAgent with px4 board ROS2官方安装及测试程序 概要 新安装的ROS2与PixHawk开发板进行通信。 操作步骤 启动示例程序,在~/ws_sensor_combined/src路径下执行: ros2 l…

【Image captioning】基于检测模型网格特征提取——以Sydeny为例

【Image captioning】基于检测模型网格特征提取——以Sydeny为例 今天,我们将重点探讨如何利用Faster R-CNN检测模型来提取Sydeny数据集的网格特征。具体而言,这一过程涉及通过Faster R-CNN模型对图像进行分析,进而抽取出关键区域的特征信息,这些特征在网格结构中被系统地…

Benedict Evans:Ways to think about AGI思考 AGI 的方法:

​Benedict Evans本文发布于2024 年 5 月 4 日 How do we think about a fundamentally unknown and unknowable risk, when the experts agree only that they have no idea? 当专家们一致认为他们一无所知时,我们如何看待根本上未知和不可知的风险? T…

云服务器和物理机该怎样分别呢

随着网络的不断发展,服务器的类型也在以不同的方式更新。现在云服务器的兴起占据了很大一部分市场,物理机的市场份额受到了很大的冲击。物理机和云服务器有什么区别?如何选择适合自己需求的?虽然物理服务器和云服务器都是服务器&a…

如何部署TDE透明加密实现数据库免改造加密存储

安当TDE(透明数据加密)实现数据库加密的步骤主要包括以下几个部分: 准备安装环境:确保操作系统和数据库环境已经安装并配置好,同时确保具有足够的权限来安装和配置TDE透明加密组件。下载安装包:从官方网站…

银河麒麟V10桌面版分区分析

前言:本文只讨论gpt分区uefi引导形式 ,了解分区方案的目的是方便恢复,还原,扩容等,普通用户使用无需了解这些细节。 先回顾分析windows和ubuntu默认分区用做对比 1、windows11默认分区 win11分区,如上图&am…

如何去除字符串两侧的空白字符?

TRIM函数会去掉字符串左侧和右侧的空格,语法是:TRIM(字符串) excel中,TRIM函数能去掉字符串左侧和右侧的空格,它的ASCII码是32。 以下设定一个字符串组合,它的第一个字符中空格,最后一个字符是换行符 &q…

WSL2-Ubuntu(深度学习环境搭建)

1.在Windows的WSL2上安装Ubuntu 流程可参考:https://www.bilibili.com/video/BV1mX4y177dJ 注意:中间可能需要使用命令wsl --update更新一下wsl。 2.WSL数据迁移 按照下面流程:开始菜单->设置->应用->安装的应用->搜索“ubun…

网络安全法中关于网络信息的保护和监管,有哪些规定?

网络安全法作为我们数字时代的重要法律保障,对于网络信息的保护和监管有着明确且详细的规定。这些规定不仅体现了国家对于网络安全的重视,也为我们每个人在数字世界中提供了坚实的法律屏障。 首先,我们来看一个关于网络运营者主体责任的案例。…

软件工程期末复习(9)数据流图

数据流图 结构化分析方法: 结构化分析方法最初由Douglas Ross提出,由DeMarco推广, 由Ward和Mellor以及后来的Hatley和Pirbhai扩充,形成了今天的结构化分析方法的框架。 结构化分析方法的分析模型: 核心:数…

springboot实现文件防盗链设计

shigen坚持更新文章的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长,分享认知,留住感动。 个人IP:shigen 👋👋👋hello,伙伴们好久不见&…

IO系列(四) - RandomAccessFile 类解读

一、摘要 RandomAccessFile 类,也被称为随机访问文件类。 RandomAccessFile 可以说是 Java 体系中功能最为丰富的文件操作类,相比之前介绍的通过字节流或者字符流接口方式读写文件,RandomAccessFile 类可以跳转到文件的任意位置处进行读写数…

开源连锁收银系统哪个好

针对开源连锁收银系统的选择,商淘云是一个备受关注的候选。商淘云以其功能丰富、易于定制和稳定性等优势,吸引了众多企业和开发者的关注。下面将从四个方面探讨商淘云开源连锁收银系统的优势: 首先,商淘云提供了丰富的功能模块。作…

CNN卷积神经网络初学

1.为什么要学CNN 在传统神经网络中,我们要识别下图红色框中的图像时,我们很可能识别不出来,因为这六张图的位置都不通,计算机无法分辨出他们其实是一种形状或物体。 这是传统的神经网络图,通过权重调整神经元和神经元…

C++学习一(主要对cin的理解)

#include<iostream> int main() {int sum 0, value 0;//读取数据直到遇到文件尾&#xff0c;计算所有读入的值的和while (std::cin >> value){ //等价于sumsumvaluesum value;}std::cout << "Sum is :" << sum << std::endl;sum …

OPC-UA open62541 C++测试代码

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 这是之前写的open62541测试代码…

机器人计算力矩控制

反馈线性化&#xff1a; 反馈线性化是一种控制系统设计方法&#xff0c;其目标是通过状态空间的坐标变换和控制变换&#xff0c;使得非线性系统的输入-状态映射或输入-输出映射反馈等价于线性系统。这样&#xff0c;就可以应用线性系统的控制理论来实现非线性系统的控制。在机…

【Redis】数据类型

Redis数据类型&#xff08;5 3 1&#xff09; 五种基本数据类型 String字符串 特点 二进制安全&#xff0c;可以包含任何数据&#xff0c;如数字&#xff0c;字符串&#xff0c;jpg图片或者序列化的对象 应用场景 缓存&#xff1a; redis作为缓存层&#xff0c;mysql做持…