该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

这个去集群主机cm界面上看会出现这个错误
排查思路:

  1. 一般比较常见的原因可能是出问题的主机和集群主节点的时间对应不上了。
  2. 还有就是cm agent服务出现问题了

去该主机的后台进行查看

1.1 如果集群配置了ntp时间同步协议

查看问题节点的ntp服务是否正常启动

systemctl status ntpd

[root@cloudcdp02 ~]# systemctl status ntpd
● ntpd.service - Network Time Service
Loaded: loaded (/usr/lib/systemd/system/ntpd.service; enabled; vendor preset: disabled)
Active: active (running) since 一 2024-03-25 00:53:52 CST; 1 weeks 3 days ago
Process: 717 ExecStart=/usr/sbin/ntpd -u ntp:ntp $OPTIONS (code=exited, status=0/SUCCESS)
Main PID: 726 (ntpd)
CGroup: /system.slice/ntpd.service
└─726 /usr/sbin/ntpd -u ntp:ntp -g
3月 25 00:53:52 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c012 02 freq_set kernel 4.576 PPM
3月 25 00:53:52 cloudcdp02.hadoop.com systemd[1]: Started Network Time Service.
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 4 eth0 172.21.32.231 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 5 eth0 fe80::f87f:eaff:fe8b:1600 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: new interface(s) found: waking up resolver
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c61c 0c clock_step +0.293029 s
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c614 04 freq_mode
3月 25 00:58:22 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c618 08 no_sys_peer
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c612 02 freq_set kernel 4.919 PPM
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c615 05 clock_sync

这种是正常已经启动好的
如果没有启动,就重启一下ntp服务

systemctl start ntpd

在查看一下ntp是否与主节点进行时间同步

ntpq -p

在这里插入图片描述
可以看到remote下面的主机前面有一个*,代表着正在与cloudcdp01进行时间同步,如果 *在local前面,就代表着与本地时间同步

如果offset下面的数字时间偏差太大的话,光靠ntp可能回不过来,这时候需要手动和主节点进行时间同步
手动同步命令

ntpdate -s 主节点ip

重启agent服务

 systemctl restart cloudera-scm-agent.service

1.2. 如果集群没有配置了ntp时间同步协议

查看主节点的时间

date

然后在回到问题节点上面,直接修改问题节点的系统时间,让其与之同步
同步时间

sudo date -s "2024-04-02 12:30:00"

重启agent服务

 systemctl restart cloudera-scm-agent.service

2.如果agent服务出现问题

查看agent服务状态

 systemctl status cloudera-scm-agent.service

如果发现agent服务停止就重新启动一下,如果发现agent服务没有了,就需要重新安装agent服务
重新安装agent服务,直接从主节点的/var/www/html里面发一份agent服务安装包,rpm安装一下就好了
服务安装好后,需要修改agent服务的配置文件,不然会出现agent服务无法识别主机的报错

修改agent服务的配置

#进入配置服务目录
cd /etc/cloudera-scm-agent
#打开配置文件
vim config.ini

修改server_host后面的地址,把localhoust改为主节点ip。

在这里插入图片描述

然后重启agent服务

 systemctl restart cloudera-scm-agent.service

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/518077.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

阿里 对象存储OSS 云存储服务

1.简介 对象存储服务(Object Storage Service ,OSS) 是一种 海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种存储类型供选择,全面优化存储成本。 2.如何使用。参考文档 看文档,说的…

水离子雾化壁炉与传统壁炉的区别与比较

水离子雾化壁炉与传统壁炉在工作原理、燃料、安全性和环保性等方面存在明显的区别和比较: 工作原理: 传统壁炉:传统壁炉通常使用木材、煤炭、天然气等燃料,并通过燃烧产生真实的火焰和热量。 水离子雾化壁炉:水离子雾…

备考ICA----Istio实验16---HTTP流量授权

备考ICA----Istio实验16—HTTP流量授权 1. 环境准备 kubectl apply -f istio/samples/bookinfo/platform/kube/bookinfo.yaml kubectl apply -f istio/samples/bookinfo/networking/bookinfo-gateway.yaml访问测试 curl -I http://192.168.126.220/productpage2. 开启mtls m…

MATLAB入门教程(带详细注释的MATLAB代码)

使用方法 将mlx文件在MATLAB上运行,即可得到下列结果: 完整代码 给出mlx文件的全文 MATLAB软件入门分析 Date:2023年3月13日 Author:Evand 入门综述 使用matlab编程时,通常使用.m文件,把所有代码编好后…

JAVA毕业设计133—基于Java+Springboot+Vue的网上宠物店商城管理系统(源代码+数据库+12000字论文)

毕设所有选题: https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringbootVue的网上宠物店商城管理系统(源代码数据库12000字论文)133 一、系统介绍 本项目前后端分离,分为管理员、用户两种角色 1、用户: 注册…

注意,这类人无法在视频号开店!

我是王路飞。 视频号也可以开店铺去卖货了吗? 是的!其实早在22年的时候,视频号就上线【小店】功能了,可以通过短视频、直播达人带货的形式,帮助商家转化商品。 当然了,视频号小店跟我一直在科普的抖音小…

团体程序设计天梯赛-练习集 01

天梯赛题解合集 团体程序设计天梯赛-练习集 (L1-001 - L1-012) 团体程序设计天梯赛-练习集 (L1-013 - L1-024) 团体程序设计天梯赛-练习集 (L1-025 - L1-036) 团体程序设计天梯赛-练习集 (L1-037 - L1-048) L1-001 Hello World 输出题 样例 输入 输出 Hello World!思…

kafka集群介绍+部署Filebeat+Kafka+ELK

一、消息队列 1、为什么需要消息队列(MQ) 主要原因是由于在高并发环境下,同步请求来不及处理,请求往往会发生阻塞。比如大量的请求并发访问数据库,导致行锁表锁,最后请求线程会堆积过多,从而触…

Mac电脑清理垃圾软件 Mac电脑清理垃圾的文件在哪 cleanMyMac X 4.8.0激活号码

Mac用户经常会有这样一些烦恼,比如软件之间的管理,应用生成的缓冲文件怎样删除,还有软件的卸载等等... 如何有效清理Mac中的垃圾文件,删除多余的软件成为Mac用户迫切的需求。本文就为大家介绍几款好用的Mac电脑清理垃圾软件&#…

AJAX —— 学习(一)

目录 一、原生 AJAX (一)AJAX 介绍 1.理解 2.作用 3.最大的优势 4.应用例子 (二)XML 介绍 1.理解 2.作用 (三)AJAX 的特点 1.优点 2.缺点 二、HTTP 协议 (一)HTTP 介…

GPT3, llama2, InternLM2技术报告对比

GPT3(September 22, 2020)是大语言应用的一个milestone级别的作品,Llama2(February 2023)则是目前开源大模型中最有影响力的作品,InternLM2(2023.09.20)则是中文比较有影响力的作品。…

05 - 7 段十进制数码管显示

---- 整理自B站UP主 踌躇月光 的视频 1. 实验设计 根据前一节的内容,这里也通过 ROM 的方法显示十进制。这里我们设计显示 3 位十进制数,需要三个数码管,地址位宽为 8,数据位宽为 12。 A7A6A5A4A3A2A1A0number000000000000000011…

SambaNova 芯片:深入解析其架构和高性能秘诀

SambaNova——一家总部位于帕洛阿尔托的公司已经筹集了超过10亿美元的风险投资,不会直接向公司出售芯片。相反,它出售其定制技术堆栈的访问权限,该堆栈具有专门为运行最大的人工智能模型而设计的专有硬件和软件。 最近,SambaNova…

【科研笔记】知识星球不可选择内容爬虫

知识星球不可选择内容爬虫 1 背景2 实现3 拓展遗留问题1 背景 针对与知识星球中,电脑打开网页不可选择复制粘贴的问题,进行爬虫处理,获取网页的内容,并保存在本地 2 实现 需要下载python,和爬虫的第三方库selenium,可以查看博客中有关selenium的内容进行回顾。当前使用…

在云端遇见雨云:一位服务器寻觅者的指南

引言:寻觅一座云端归宿 当我踏入数字世界的边缘,带着对网络的探索与期待,我迫切需要一座安全可靠的数字栖息地。云计算技术正如一场魔法般的变革,而在这片广袤的云端中,雨云就像是一位友善的向导,引领我穿越…

最优算法100例之28-n个骰子点数和出现的次数

专栏主页:计算机专业基础知识总结(适用于期末复习考研刷题求职面试)系列文章https://blog.csdn.net/seeker1994/category_12585732.html 题目描述 把n个骰子扔在地上,所有骰子朝上一面的点数之和为S。输入n,打印出S的…

OpenTofu路在何方:定量分析Terraform issue数据,洞察用户需求|OpenTofu Day 闪电演讲

数澈软件 Seal 首席架构师李平辉提交的演讲议题“Alias TerraformTofu. Job’s Done, Now What?”入选 KubeCon EU 同场活动 OpenTofu Day,本文为演讲实录。 大家好,我是 Lawrence,是 Seal 的首席架构师。今天将由我为大家带来 Lightening T…

Linux: linux常见操作指令

目录 01.ls 指令 02. pwd命令 03. cd 指令 04. touch指令 05.mkdir指令(重要) 06.rmdir指令 && rm 指令(重要) 07.man指令(重要) 07.cp指令(重要) 08.mv指令&#…

如何创建一个TCP多人聊天室?

一、什么是TCP? TCP(Transmission Control Protocol)是一种可靠的 面向连接的协议 ,可以保证数据在传输过程中不会丢失、重复或乱序。 利用TCP实现简单聊天程序,需要客户端和服务器端之间建立TCP连接,并通…

【数据分析面试】10. 计算平均通勤时间(SQL:timestampdiff() 和datediff()区别)

题目 假设你在Uber工作。rides表包含了关于Uber用户在美国各地的行程信息。 编写一个查询,以获取纽约(NY)每位通勤者的平均通勤时间(以分钟为单位),以及纽约所有通勤者的平均通勤时间(以分钟为…