zyj-ha 安装过程及使用部署

一.安装过程排坑

1. 硬件环境准备

排坑 1

首先,服务器至少需要 2 台,每台服务器至少需要 2 块网卡,并且必须有预留 心跳线网口,不能被其他业务占用,否则容易出现脑裂。

2. 通过配置管理工具导入安装包

软件包如下:

ha-deps-zyj-arm-1.0.0-3.ky10.aarch64.rpm

neokylinha-zyj-2.0.0-16.ky10.aarch64.rpm

ha-api-1.0.0-17.zyj.ky10.noarch.rpm

ha-scripts-2.0.0-1.ky10.noarch.rpm

排坑 2

此问题多次遇到,其他 zyj 工程师在对目前 zyj-ha 情况不清楚时,按照文档安装, 安装后报错。目前 ha-scripts 的 rpm 包有升级,目前 zyj-ha 飞腾版一共有五个包, 最新版本为 ha-scripts-2.0.0-3.ky10.noarch.rpm,正确流程是

先安装前四个安装包,最后装 ha-scripts-2.0.0-1.ky10.noarch.rpm,进行更新,最 终在可信华泰配置管理中只会显示最终版本。注意:卸载后不会显示原版本。

3.安装后端口放行

用安全卡管理融合工具对以下端口进行放行: 8088 2224 5405 5406

排坑 3

军工集团办公大多数 ha 所应用的都是监控中间件,尤其是东方通中间件,经常 会遇到端口占用的情况。在部署前需要告知东方通,不要占用 8090 端口。

也就是目前 zyj 实际业务需要开放的端口,及禁止其他应用占用的端口有: 8088 2224 5404 5405 5406 8090

4.重置口令

在控制面板中,重置 hacluster 用户的口令。口令为专用机普通用户口令。

5.授权用户

使用安全卡管理融合工具授权 hacluster 用户允许登录。

排坑 4

检查没有任何问题,口令已重置,用户授权已放开,就是无法进行注册,提示无 效用户,无法获取注册信息。需注意:授权用户的时间区间,一般三合一厂商工程师犯懒如设定 24 小时,可能导致用 户授权失效,尽量让厂商设定在工作时间 8 小时,且在实施时间段内。

6.设置 hosts 文件

在/etc/hosts 文件中正确设置集群各节点的名称,对应 ip 地址。主网卡 ip 和心跳 网卡 ip 均需要配置对应的节点名称。

排坑 5

配置完成后不要忘记将/etc/hosts 拷贝至/opt/ha/etc/下,虽然可以正常注册及启 动 ha,并可以使用 web 管理功能,但如遇到宕机或应用停止,无法切换至备机

7.启动 ha,进行节点认证用户注册

所有节点上启动 pcsd 服务,并进行节点认证(任一节点上执行)

启动 systemctl start pcsd

节点注册 pcs host auth host1 host2

排坑 6

检查没有任何问题,口令已重置,用户授权已放开,就是无法进行注册,提示无 效用户,无法获取注册信息。需注意:

多次遇到已放行用户,在正确放行时间节点,无法进行注册,原因是用户被系统 锁定,具体原因未知,需要切换到安全用户,进行解锁

解锁命令:pam_tally2 -r -u hacluster

8. 启动 ha-api

启动 ha-api,打开 web 管理权限

使用命令:systemctl start ha-api

排坑 7

发现 web 管理一个节点可用,一个不可用的情况。注意:ha-api 服务非全局生效, 文档未说明,此服务如果需要全部节点都可以进行管理,需要在全部节点均执行 一次,且 HA 服务关闭停止后失效。重启 HA 服务后还需要重新执行启动命令

9.使用 pcs status 查看目前 ha 状态。

排坑 8

使用 pcs status 查看 ha 运行状态时,提示没有此命令,但软件已正常使用多日,

需注意:某些数据库和中间件经常会在安装部署过程中改环境变量,导致 ha 设 置的环境变量被修改。导致 pcs status 不可用。

临时可以用绝对路径。或者手动执行# source /opt/ha/bin/ha_env.sh,将环境变量添加。

二.使用过程排坑

图形界面配置比较简单,参考文档一般不会出错,下面介绍一下几个重要的坑点。

1. web 页面登录

打开浏览器,输入:https://IP:8088,登录集群 web 管理页面。

排坑 9

无法进行登录,提示错误用户名密码,但密码输入正确,需注意: zyj 服务器输错密码 5 次,强制锁定 30 分钟。有可能是集成在联调期间想进行调 试导致。

可到安全管理员解锁用户。

2.配置 vip 和心跳

排坑 10

无法添加 vip 资源。资源添加后,资源颜色飘红,进入资源后,查看 ip 信息,发 现没有保存。需注意: ha 部署节点网卡不可以做双网卡绑定,绑定后 ip 无法进行添加。心跳无法添加

3.回迁资源

这种回迁资源功能,在该资源为处于运行状态的普通资源或者组资源,点击【迁 移】按钮,弹出【迁移资源】对话框,可以将资源迁移到指定节点上运行。还可 以强制迁移,且可设定有效期。

排坑 11

经实际场景测试,此功能有 bug,在 zyj 环境下不可用,如有客户询问,告知目 前功能不完善,还在更新中。强制使用可能会导致业务问题。

4.东方通中间件管理

东方通中间件添加正常,资源启动正常,宕机后,切机状态初步显示正常,但实 际业务没有进行切换,后续 pcs status 状态报错,重新拉应用或使用 pcs resour ce,无法拉起。

排坑 12

由于一般东方通中间件在办公系统应用比较多,属于最常见的中间件厂商软件, 一般可能要求业务的稳定性,多数客户会进行选择东方通作为中间件软件,但一 般使用东方通中间件的客户的 OA 业务非常多,需要拉起各模块的时间比其他客 户业务要长很多。有可能导致主切备时,备设定的默认参数,到不到东方通拉起 的时间要求。重新拉起时,主的默认启动监听时间过小,导致启动也报错。所以 需要通过查看东方通启动和关闭日志,预估一下大概时间,如果有时间较长的情 况,需要我们在元素配置中区别于默认配置。 1. 默认设置 monitor 不变 2. 主动添加 start 配置,将 delay 时间调整至 1000,单位为秒 3. 主动添加 stop 配置,将 delay 时间调整至 1000,单位为秒 4. 另外此类拉起服务需要较长时间的应用,为了保证 ha 的可用性,需告知客户 只敢保证单次切机功能,如服务恢复,建议重新进行 ha 配置主备。

排坑 13

建议按照以下方式的顺序和命令进行重新配置,对比图片节点颜色进行判断查看

1. 使用环境

当服务宕机后触发 HA,HA 将 Vip 漂移到备机上并拉起东方通服务,OA 可正 常使用,主机排查原因修复后,需要把服务重新迁移到主机。

2. 操作步骤

一、 将主机和备机的HA服务 和tongweb服务全部关闭。

host02 确保关闭 tongweb 服务,已无运行的 JAVA 进程

host02 关闭 HA 服务

host01 关闭 HA 服务

注意:不要使用 resource 功能进行主备重置,再切换时可能会有问题。

二、 然后启动 host01 的 HA 服务

执行完成启动后,再执行下 systemctl start ha-api,开启 web 管理界面。

三、 登录 https://ip:8088;输入用户名 hacluster,密码为普通用户默认 密码。

⚫ 检查 host01 启动状态,点位是否显示为绿色。如正常如下图所示,则无需操 作。直接使用 pcs status 命令查看服务状态是否正常,同时监控 tongweb 启 动日志。

⚫ 如点位显示灰色,如下图所示,则需要点击启动按钮

四.等待 tongweb 启动完成后,启动 host02 的 HA 服务,检查各主机的在线状态 及服务状态。

如下图显示,则 HA 已恢复至正常扳机监听状态。登录 OA 进行测试。

使用 VIP 进行查看测试 VIP:8088

看 pcs status 状态没有任何报错信息,即是配置成功

5.共享存储挂载管理

挂载服务起不来,一直飘红,配置没问题。

排坑 14

lsblk 查看实际共享存储的状态,是否能够显示多路径配置,如未正常显示,应该 是客户重启过机器,但没有添加 multipath 服务自启动,将 multipath 启动,并加 入开机自启。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/162112.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CAD长方形纤维插件2D

插件介绍 CAD长方形纤维插件2D版本可用于在AutoCAD软件内生成随机分布的长方形纤维图形,生成的dwg格式模型可用于模拟二维随机分布的纤维复合材料、随机初始裂缝等,同时模型可导入COMSOL、Abaqus、ANSYS、Fluent等有限元软件内进行仿真分析计算。 插件…

基于libcurl+libopenssl开源库编译出curl下载工具及代码集成curl功能

准备素材: 1. openssl的版本: openssl-1.1.1w.tar.gz 2.curl的版本:curl-8.4.0.tar.gz 目标: 1.编译出openssl库; 2.编译出curl可执行文件及库; 步骤一:先解压压缩包 tar -zxvf openssl-1…

风光能互补发电庭院路灯系统技术原理

风光互补发电系统是由风力发电机组配合太阳能电池组件组成,通过专用的控制逆变器,将风力发电机输出的低压交流电整流成直流电,并与光伏电池组件输出的直流电汇集在一起,充入蓄电池组,实现稳压、蓄能和逆变全过程&#…

不动产数据质量提升_电子档案挂接

前言 做了不动产数据质量提升项目,其中包括集体土地所有权档案扫描、挂接。扫描的工作已经完成了,现在需要进行电子档案挂接。正常来说通过不动产系统技术支撑单位的批量挂接功能,但现实是一言难尽。   尝试过进行抓包分析,提交…

MySQL数据库下的Explain命令深度解析

Explain是一个非常有的命令,可以用来获取关于查询执行计划的信息,以及如何解释输出。Explain命令是查看查询优化器如何决定执行查询的主要方法。这个功能有一定的局限性,并不总是会说出真相,但是它的输出是可以获取的最好信息&…

C#单例模式懒汉式与饿汉式

单例模式一般分为懒汉模式和饿汉模式,懒汉式单例在第一次引用时创建实例,不是在类加载时;饿汉式单例模式是一种在类加载时就创建实例的方式,因此也称为静态初始化。 单例模式实现的技巧时构造私有,向外提供静态实例。…

【数据分享】2023年我国省市县三级的独角兽企业数量(Excel/Shp格式)

企业是经济活动的参与主体。一个城市的企业数量决定了这个城市的经济发展水平!比如一个城市的金融企业较多,那这个城市的金融产业肯定比较发达;一个城市的制造业企业较多,那这个城市的制造业肯定比较发达。 之前我们给大家分享了…

【算法萌新闯力扣】:找到所有数组中消失对数字

力扣热题:找到所有数组中消失对数字 开篇 这两天刚交了蓝桥杯的报名费,刷题的积极性高涨。算上打卡题,今天刷了10道算法题了,题目都比较简单,挑选了一道还不错的题目与大家分享。 题目链接:448.找到所有数组中消失对…

UML统一建模语言

UML包含3种构造块:事物、关系、图。 事物:模型中代表性成分的抽象关系:把事物结合在一起图:聚集了相关的事物 事物 结构事务:模型的静态部分,包括类、接口、协作、用例、主动类、构件、制品、结点 行为事…

【LeetCode刷题-双指针】--16.最接近的三数之和

16.最接近的三数之和 方法&#xff1a;排序双指针 class Solution {public int threeSumClosest(int[] nums, int target) {Arrays.sort(nums);int ans nums[0] nums[1] nums[2];for(int i 0;i<nums.length;i){int start i1,end nums.length - 1;while(start < en…

11 月 11 日 ROS 学习笔记——ROS 架构及概念

文章目录 前言一、 ROS 文件系统级1). 工作空间 Ws2). 功能包3). 消息 msg4). 服务 srv 二、计算图级1). 动态加载节点 nodelet2). 主题 topic3). 服务 srv4). 消息 msg5). 试用练习5). 创建工作空间6). 创建 ROS 功能包和元功能包7). 编译ROS功能包8). 使用 ROS 节点9). 使用主…

kubernetes|云原生| 如何优雅的重启和更新pod---pod生命周期管理实务

前言&#xff1a; kubernetes的管理维护的复杂性体现在了方方面面&#xff0c;例如&#xff0c;&#xff50;&#xff4f;&#xff44;的管理&#xff0c;服务的管理&#xff0c;用户的管理&#xff08;&#xff32;&#xff22;&#xff21;&#xff23;&#xff09;&#xf…

linux进程间通信之信号

摘要 本文旨在研究Linux进程间通信的机制之一&#xff1a;信号。信号是由操作系统来处理的&#xff0c;说明信号的处理在内核态。信号不一定会立即被处理&#xff0c;此时会储存在信 号的信号表中。最后&#xff0c;我们会对这种通信方式的优缺点进行全面的分析&#xff0c;并给…

手搓哈希表、列表、队列,只为了用C语言快速求解华容道游戏,我不是大佬,只是一个游戏算法爱好者

背景 多年前曾经写过C语言求解华容道&#xff0c;当时没有用到哈希表&#xff0c;导致整个查重搜索数组过大&#xff0c;每次求解都得花上数分钟的时间&#xff0c;如今时过境迁&#xff0c;对数据结构和算法有了更深的理解&#xff0c;所以得把这一块补上了。(其实就是最近想…

POSIX信号量

POSIX信号量 POSIX信号量用于同步操作&#xff0c;达到无冲突访问临界资源的目的&#xff0c;可以用于线程之间的通信。而信号量的本质其实就是一把计数器&#xff01;&#xff01;而我们对计数器有2个操作&#xff0c;一个是增加计数器的值&#xff0c;一个是减少计数器的值。…

MySQL/Oracle用逗号分割的id怎么实现in (逗号分割的id字符串)。find_in_set(`id`, ‘1,2,3‘) 函数,

1.MySQL 1.1.正确写法 select * from student where find_in_set(s_id, 1,2,3); 1.2.错误示范 select * from student where find_in_set(s_id, 1,2 ,3); -- 注意&#xff0c;中间不能有空格。1、3 select * from student where find_in_set(s_id, 1,2, 3); -- 注意…

Nginx安装配置与SSL证书安装部署

一、Nginx Nginx是一款高性能的开源Web服务器和反向代理服务器&#xff0c;被广泛用于构建现代化的Web应用和提供静态内容。 nginx官网 这里下载nginx-1.24.0-zip Nginx是一款高性能的开源Web服务器和反向代理服务器&#xff0c;被广泛用于构建现代化的Web应用和提供静态内…

腾讯云新用户专享买什么服务器划算?腾讯云新用户服务器购买建议

腾讯云近期推出了一系列的轻量应用服务器活动&#xff0c;其中包括了两款三年时长的优惠配置。这两款配置分别是2核2G4M和2核4G5M&#xff0c;价格分别为540元和756元。相较于按月购买的费用&#xff0c;三年时长的套餐更加划算&#xff0c;并且能够有效省下续费费用。所以&…

【LeetCode刷题-滑动窗口】-- 239.滑动窗口最大值

239.滑动窗口最大值 分析&#xff1a; 方法&#xff1a;优先队列 对于最大值&#xff0c;可以使用优先队列(堆)&#xff0c;其中的大根堆可以帮助实时维护一系列元素中的最大值 在本题中&#xff0c;初始时&#xff0c;将数组nums的前k个元素放入优先队列中&#xff0c;每当我…

【JavaEE初阶】 CSS的引入方式和选择器

文章目录 &#x1f332;CSS是什么&#xff1f;&#x1f340;CSS基础语法规范&#x1f384;引入方式&#x1f6a9;内部样式表&#x1f6a9;行内样式表&#x1f6a9;外部样式 &#x1f334;代码风格&#x1f333;选择器&#x1f6a9;选择器的种类&#x1f6eb;基础选择器&#x1…