Flink checkpoint 源码分析- Checkpoint barrier 传递源码分析

背景

在上一篇的博客里，大致介绍了flink checkpoint中的触发的大体流程，现在介绍一下触发之后下游的算子是如何做snapshot。

上一篇的文章: Flink checkpoint 源码分析- Flink Checkpoint 触发流程分析-CSDN博客

代码分析

1. 在SubtaskCheckpointCoordinatorImpl中的checkpointState 主要进行了这个操作， source首先构造barrier，然后广播给下游。我们现在跟踪一下barrier的流动。

org.apache.flink.streaming.runtime.tasks.SubtaskCheckpointCoordinatorImpl#checkpointState

 CheckpointBarrier checkpointBarrier =
                new CheckpointBarrier(metadata.getCheckpointId(), metadata.getTimestamp(), options);
        operatorChain.broadcastEvent(checkpointBarrier, options.isUnalignedCheckpoint());

这个广播实际上是将数据写入到了下游。写的方法实际上就是netty写。

从flush的方法进去可以看到实际上是通知下游数据可用，下游看到数据可用就可以拉数据。因此可以看到这里的数据传递是通过pull的方式。

最后这个方法最后调用的是：org.apache.flink.runtime.io.network.netty.PartitionRequestQueue#notifyReaderNonEmpty方法，通过netty告知下游有数据了。

这些数据是从哪里读取到的呢？其实是在org.apache.flink.runtime.io.network.partition.consumer.RemoteInputChannel#getNextBuffer里面，flink对netty 进行了封装

从这个方法再往上就可以看到是org.apache.flink.runtime.io.network.partition.consumer.SingleInputGate#getNextBufferOrEvent。

这里就是channel读取数据的地方。

这里有一个方法：transformToBufferOrEvent。这里判断里面是数据还是时间。flink中定义的事件如下。

如果这里会走第一个分支，会将数据放到buffer里

这个时候上层org.apache.flink.streaming.runtime.io.AbstractStreamTaskNetworkInput#emitNext

会接受数据, 如果是单流的话会在org.apache.flink.streaming.runtime.tasks.StreamTask#processInput 获取数据

里面有一个org.apache.flink.streaming.runtime.io.StreamOneInputProcessor#processInput

最后数据通过这个方法处理org.apache.flink.streaming.runtime.io.AbstractStreamTaskNetworkInput#emitNext

里面就是对barrier时间的处理

里面有不同的事件，针对不同的事件有不同的处理流程。其中包含了收到barrier如何处理的。从代码中可以看到有一个专门的方法处理barrier。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/585881.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

Flink checkpoint 源码分析- Checkpoint barrier 传递源码分析

背景

代码分析

相关文章

SQLite如何处理CSV 虚拟表(三十七)

WebLlama：通过对话进行网页浏览的智能代理

idea生成双击可执行jar包

mac/windows下安装docker，minikube

OPC UA与IEC61499 在分布式智能电网中的应用

MySQL基础学习（待整理）

WordPress Automatic插件 SQL注入漏洞复现(CVE-2024-27956)

汽车制造业安全事故频发，如何才能安全进行设计图纸文件外发？

LangChain入门2 RAG详解

Leetcode——面试题02.04.分割链表

用于复杂任务的 AI 编码引擎：多文件多步骤拆解实现 | 开源日报 No.239

如何在Spring Boot中配置数据库密码加密

后端方案设计文档结构模板可参考

Grafana 添加一台管理服务器

Vue3(管理系统)-封装axios（utils）

在Ubuntu linux操作系统上操作MySQL数据库常用的命令

【SQL Server】入门教程-基础篇(三)

Spring MVC入门程序

# 从浅入深学习 SpringCloud 微服务架构（七）Hystrix（3）

vue3中使用crypto-js库进行加密/解密