Flink 任务启动脚本-V2(包括ck启动)


#!/bin/bash


#crontab时设置,如果依赖其他环境变量配置,可以在脚本执行一下环境变量脚本
source /etc/profile


# 进入脚本目录
curdir=`dirname "$0"`
curdir=`cd "$curdir"; pwd`
echo "进入启动脚本目录 $curdir"



# 定义应用程序名称
APP_NAME="orderTest"

# 定义checkpoint路径
CHECKPOINT_BASE_PATH="hdfs:///jobs/flink/checkpoints/$APP_NAME/"

MAIN_CLASS="com.test.mainTest"

#绝对路径
JAR_PATH="/$curdir/flink-test-1.0.0.jar"

# 默认从checkpoint启动
USE_CHECKPOINT=true


# 显示使用说明
usage() {
    echo "用法: $0 [-n] [-h]"
    echo "选项:"
    echo "  -n    不从checkpoint启动任务(默认从最新的checkpoint启动)"
    echo "  -h    显示此帮助信息"
    echo
    echo "示例:"
    echo "  $0        # 从最新的checkpoint启动任务"
    echo "  $0 -n     # 不使用checkpoint启动任务"
    exit 1
}

# 解析命令行参数
while getopts ":nh" opt; do
    case $opt in
        n)
            USE_CHECKPOINT=false
            echo "已设置:不从checkpoint启动任务"
            ;;
        h)
            usage
            ;;
        \?)
            echo "错误:无效的选项 -$OPTARG"
            echo "使用 -h 查看帮助信息"
            exit 1
            ;;
    esac
done

# 如果设置了无效参数,显示使用说明
if [ $OPTIND -gt 1 ]; then
    shift $((OPTIND-1))
    if [ "$#" -gt 0 ]; then
        echo "错误:存在额外的参数 $@"
        echo "使用 -h 查看帮助信息"
        exit 1
    fi
fi


# 检查是否存在指定应用程序在运行中
is_running=$(yarn application -list | grep -w "$APP_NAME" | grep -c "RUNNING")

if [ $is_running -gt 0 ]; then
    echo "应用程序 $APP_NAME 在运行中,退出脚本"
    exit 1
else
    echo "应用程序 $APP_NAME 不在运行中,准备拉起任务"
fi

# 函数:获取最新成功的checkpoint地址
get_latest_checkpoint() {
    latest_checkpoint=$(hdfs dfs -ls -t -R $CHECKPOINT_BASE_PATH  | grep '_metadata' | sort -k6,7r | head -n 1 | awk '{print $8}'  )
    if [ -z "$latest_checkpoint" ]; then
        return 1
    fi
    # 去掉文件名,只保留目录路径
    checkpoint_dir=$(dirname "$latest_checkpoint")
    echo $checkpoint_dir
    return 0
}

# 构建基础命令
CMD="flink run \
 -t yarn-per-job \
 -d \
 -p 1 \
 -Dyarn.application.queue=realtime \
 -Dyarn.application.name=$APP_NAME \
 -Dtaskmanager.memory.process.size=4096mb \
 -Dtaskmanager.memory.network.max=64mb \
 -Dtaskmanager.memory.managed.size=1024mb \
 -Dtaskmanager.numberOfTaskSlots=1 \
 -c $MAIN_CLASS"

if [ "$USE_CHECKPOINT" = true ]; then
    # 获取最新的checkpoint地址
    LATEST_CHECKPOINT=$(get_latest_checkpoint)
    if [ $? -ne 0 ]; then
        echo "没有找到适合的ck,退出执行"
        exit 1
    fi
    echo "'$APP_NAME' 任务将从 '$LATEST_CHECKPOINT' 启动"
    CMD="$CMD \
    -s $LATEST_CHECKPOINT"
else
    echo "'$APP_NAME' 任务将不从checkpoint启动"
fi

# 添加最终的jar包和配置文件参数
CMD="$CMD \
   $JAR_PATH "

# 执行命令
echo " 任务启动命令: '$CMD' "

eval $CMD

本次新增一个不从 ck 启动的选择,默认从 最新 ck 启动,用法 sh start.sh -n 。

备注:由于Flink checkpoint 个别情况下,不一定能保证落地的checkpoint文件一定有效,所以需要人工介入支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/925142.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

linux高级系统编程之进程

进程 一个正在进行的程序 并行与并发 并行:执行的程序在不同CPU上同时执行 并发:一个CPU,多个进程交替执行,因为交替速度很快,所以从宏观上来看是同时执行的,但是从围观的角度是交替执行的 单道与多道 单道程序设计:所有进程一个一个排队执行,若A阻塞,B只能等待,,即使CPU处于空…

git 命令之只提交文件的部分更改

git 命令之只提交文件的部分更改 有时,我们在一个文件中进行了多个更改,但只想提交其中的一部分更改。这时可以使用 使用 git add -p 命令 Git add -p命令允许我们选择并添加文件中的特定更改。它将会显示一个交互式界面,显示出文件中的每个更…

Excel中根据某列内容拆分为工作簿

简介:根据A列的内容进行筛选,将筛选出来的数据生成一个新的工作簿(可以放到指定文件夹下),且工作簿名为筛选内容。 举例: 将上面的内容使用VBA会在当前test1下生成5个工作簿,工作簿名分别为TEST1.xls TEST2.xls TEST3…

数据结构 (10)队列

前言 队列是一种特殊的数据结构,它遵循先进先出(FIFO,First In First Out)的原则。 一、定义与基本概念 定义:队列是一种只允许在一端(队尾)进行插入操作,而在另一端(队头…

Tomcat10部署Servlet加载错误问题解决

Servlet加载错误:HelloServlet不是Servlet 环境信息:IDEA中的maven项目,tomcat10.1.33 问题信息:XXX.Servlet不是Servlet 问题原因:tomcat10将JavaEE也换成了Jakarta EE; Jakarta EE较以前的JavaEE有一个重…

2024年第十三届”认证杯“数学中国数学建模国际赛(小美赛)

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

百度智能云发布首个空间智能解决方案,百度AI优势如何分析?

首先,百度智能云此次推出的空间智能解决方案,在技术底座上展现了其强大的AI异构计算能力。百度百舸AI异构计算平台作为该方案的底层支撑,为2D和3D应用中的人物、物件及场景生成提供了强大的算力支持。这一平台的推出,不仅提升了空…

RTSP摄像头、播放器为什么需要支持H.265?

H.264还是H.265? 好多开发者在做选RTSP播放器的时候,经常问我们的问题是,用H.264好还是H.265好?本文我们就H.264 和 H.265的主要区别和适用场景,做个大概的交流。 一、压缩效率 H.265 更高的压缩比 H.265 在相同视频…

BGP协议路由黑洞

一、实验环境 1、分公司与运营商AS自治系统内运行IGP路由协议OSPF、RIP或静态路由,AS自治系统内通过IBGP路由协议建立BGP邻居关系。 2、公司AS自治系统与运营商AS自治系统间运行EBGP路由协议。 3、通过loopback建立IBGP与EBGP邻居关系,发挥loopback建立…

解决数据传送问题:内网http传输

在服务器上启http服务 在服务器上输入命令: python3 -m http.server 1234 回车启动 访问和下载方法: 然后可以在本地的浏览器上访问:服务器IP:1234 例如192.11.1.1:1234,然后就可以下载对应文件夹下的东西了 在本地上启htt…

飞塔防火墙只允许国内IP访问

飞塔防火墙只允许国内IP访问 方法1 新增地址对象,注意里面已经细分为中国内地、中国香港、中国澳门和中国台湾 方法2 手动新增国内IP的对象组,目前好像一共有8632个,每个对象最多支持600个IP段

《Learn Three.js》学习(3)光源

前言: WebGL本身不支持光源,不使用three.js,则需使用着色程序来模拟光源。 学习大纲: Three.js中的光源 特定光源的使用时机 如何调整和配置所有光源的行为 如何创建镜头光晕 光源表 基础光源:THRER.AmbientLight、THERE.Point…

Linux——基础命令(2) 文件内容操作

目录 ​编辑 文件内容操作 1.Vim (1)移动光标 (2)复制 (3)剪切 (4)删除 (5)粘贴 (6)替换,撤销,查找 (7&#xff…

鸿蒙开发App 如何通过抓包查看 http 网络请求?

通过借助第三方工具 Charles https://www.charlesproxy.com/ https://www.zzzmode.com/mytools/charles/https://www.zzzmode.com/mytools/charles/ Charles 激活码计算器 相关博客日志:https://zhuanlan.zhihu.com/p/281126584 MAC上的使用方法: ch…

【Git】Git 完全指南:从入门到精通

Git 完全指南:从入门到精通 Git 是现代软件开发中最重要的版本控制工具之一,它帮助开发者高效地管理项目,支持分布式协作和版本控制。无论是个人项目还是团队开发,Git 都能提供强大的功能来跟踪、管理代码变更,并保障…

分布式锁的实现原理

作者:来自 vivo 互联网服务器团队- Xu Yaoming 介绍分布式锁的实现原理。 一、分布式锁概述 分布式锁,顾名思义,就是在分布式环境下使用的锁。众所周知,在并发编程中,我们经常需要借助并发控制工具,如 mu…

全新AI模型家族登场:完全可复现的开源语言模型OLMo 2

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

探索Python WebSocket新境界:picows库揭秘

文章目录 探索Python WebSocket新境界:picows库揭秘第一部分:背景介绍第二部分:picows库概述第三部分:安装picows库第四部分:简单库函数使用方法第五部分:场景应用第六部分:常见Bug及解决方案第…

Jenkins Nginx Vue项目自动化部署

目录 一、环境准备 1.1 Jenkins搭建 1.2 NVM和Nodejs安装 1.3 Nginx安装 二、Jenkins配置 2.1 相关插件安装 2.2 全局工具安装 2.3 环境变量配置 2.4 邮箱配置(构建后发送邮件) 2.5 任务配置 三、Nginx配置 3.1 配置路由转发 四、部署项目 …

《Python语言程序设计》(2018年版)第15遍刷第1章第1题和第2题

2024.11.28 重新开始刷题 第一章 1.1 print( Welcome to Python Welcome to Computer Science Programming is fun )1.2 text_message "Welcome to Python\n"print(text_message * 5)