Zabbix HA高可用集群搭建
- Zabbix HA高可用集群搭建
- 一、Zabbix 高可用集群(Zabbix HA)
- 二、部署Zabbix高可用集群
- 1、两个服务端配置
- 1.1主节点 Zabbix Server 配置
- 1.2 备节点 Zabbix Server 配置
- 1.3 主备节点添加监控主机
- 1.4 查看高可用集群状态
- 2、两个客户端配置
- 2.1 修改agent01和agent02的配置文件
- 2.2 查看web页面
- 3、故障模拟和效果测试
- 3.1 模拟server节点出现故障,观察Web前端页面
- 3.2 观察能否故障切换
一、Zabbix 高可用集群(Zabbix HA)
Zabbix提供了一个本地的高可用性解决方案,方便设置,不需要任何HA专业知识也可以完成,本地Zabbix HA对于防止Zabbix server的软件/硬件故障或减少维护停机时间是有用的。
官方的高可用仅仅针对 Zabbix Server 部分,数据库部分和前端部分需要自行采用各自领域的高可用解决方案。
Zabbix HA最少需要2个Zabbix Server节点即可实现HA集群高可用及故障转移。
在同一个Zabbix HA集群中,只有一个实例或节点处于active(活动)状态,standby(备用)节点不进行数据收集、处理或其他任务,并且不监听端口,并保持一个最少的数据库连接。
HA节点分为以下几种状态:
- Active(活动)
- Standby(备用)
- Unavailable(不可用)
- Stopped(停止)
二、部署Zabbix高可用集群
server | ip |
---|---|
zabbix-server01 | 192.168.210.101 |
zabbix-server02 | 192.168.210.102 |
zabbix-agent01 | 192.168.210.103 |
zabbix-agent02 | 192.168.210.104 |
1、两个服务端配置
zabbix-server01
和zabbix-server02
都要部署zabbix服务端
默认情况下,HA 是关闭的。
HA 部分的配置在配置文件的最下面:High availability cluster parameters
部分。
(1) 部署 Nginx + PHP 环境并测试
#安装 nginx
cd /etc/yum.repos.d/
mkdir bak
mv *.repo bak
cat > /etc/yum.repos.d/nginx.repo << 'EOF'
[nginx]
name=nginx repo
baseurl=http://nginx.org/packages/centos/$releasever/$basearch/
gpgcheck=1
enabled=1
gpgkey=https://nginx.org/keys/nginx_signing.key
module_hotfixes=true
EOF
yum install -y nginx
#修改 nginx 配置
vim /etc/nginx/conf.d/zbx.conf
server {
listen 80;
server_name zbx.kkk.com;
root /var/www/zbx;
location / {
index index.php;
}
location ~ \.php$ {
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME /var/www/zbx$fastcgi_script_name;
include fastcgi_params;
}
}
#安装 php
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
yum install -y epel-release
rpm -Uvh https://mirror.webtatic.com/yum/el7/webtatic-release.rpm
yum -y install php72w php72w-cli php72w-common php72w-devel php72w-embedded php72w-gd php72w-mbstring php72w-pdo php72w-xml php72w-fpm php72w-mysqlnd php72w-opcache php72w-ldap php72w-bcmath
#修改 php 配置
vim /etc/php-fpm.d/www.conf
user = nginx
group = nginx
vim /etc/php.ini
max_execution_time = 300 # 368行
max_input_time = 600 # 378行
post_max_size = 80M # 656行
date.timezone = Asia/Shanghai # 877行
#创建目录和测试文件
mkdir -p /var/www/zbx
vim /var/www/zbx/index.php
<?php
phpinfo();
?>
#启动服务
systemctl start nginx
systemctl start php-fpm
systemctl enable nginx
systemctl enable php-fpm
#hosts解析
修改 C:\Windows\System32\drivers\etc\hosts
192.168.210.101 zbx.www.com
192.168.210.102 zbx.kkk.com
#测试访问
浏览器访问:http://zbx.www.com/index.php
http://zbx.kkk.com/index.php
(2) 部署数据库
要求 MySQL 5.7 或 Mariadb 10.5 及以上版本
#配置 Mariadb yum源
cat > /etc/yum.repos.d/mariadb.repo << EOF
[mariadb]
name = MariaDB
baseurl = http://mirrors.aliyun.com/mariadb/yum/10.5/centos7-amd64/
gpgkey = http://mirrors.aliyun.com/mariadb/yum/RPM-GPG-KEY-MariaDB
gpgcheck = 1
enabled=1
EOF
yum install -y mariadb-server mariadb
systemctl enable --now mariadb
netstat -lntp | grep 3306
#初始化数据库
mysql_secure_installation
分别输入 回车 -> n -> Y (设置root密码,如abc123) -> 后面一路 Y
mysql -u root -pabc123
#创建数据库并指定字符集
CREATE DATABASE zabbix character set utf8 collate utf8_bin;
#创建 zabbix 数据库用户并授权
GRANT all ON zabbix.* TO 'zabbix'@'localhost' IDENTIFIED BY 'zabbix';
GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
flush privileges;
#向数据库导入 zabbix 数据
#上传源码包 zabbix-6.0.13.tar.gz 到 /opt 目录
cd /opt
tar xf zabbix-6.0.13.tar.gz
#按照顺序导入数据库
cd /opt/zabbix-6.0.13/database/mysql
mysql -uroot -pabc123 zabbix < schema.sql
mysql -uroot -pabc123 zabbix < images.sql
mysql -uroot -pabc123 zabbix < data.sql
mysql -uroot -pabc123 zabbix < double.sql
mysql -uroot -pabc123 zabbix < history_pk_prepare.sql
(3) 编译安装 zabbix server 服务端
#安装依赖包,创建 zabbix 用户
yum install -y mysql-devel pcre-devel openssl-devel zlib-devel libxml2-devel net-snmp-devel net-snmp libssh2-devel OpenIPMI-devel libevent-devel openldap-devel libcurl-devel fping gcc gcc-c++ make
useradd -s /sbin/nologin -M zabbix
#编译安装
cd /opt/zabbix-6.0.13/
./configure \
--sysconfdir=/etc/zabbix/ \
--enable-server \
--with-mysql \
--with-net-snmp \
--with-libxml2 \
--with-ssh2 \
--with-openipmi \
--with-zlib \
--with-libpthread \
--with-libevent \
--with-openssl \
--with-ldap \
--with-libcurl \
--with-libpcre
make install
#检查版本
zabbix_server --version
#修改 zabbix server 配置文件,修改数据库的密码
vim /etc/zabbix/zabbix_server.conf
......
LogFile=/var/log/zabbix_server.log
# 38行,指定 zabbix 日志路径
DBPassword=zabbix
# 123行,指定 zabbix 数据库的密码
#创建zabbix_server.log文件
touch /var/log/zabbix_server.log
#因为用的是zabbix用户,所以要修改属主和属组
chown zabbix:zabbix /var/log/zabbix_server.log
#准备 systemctl 服务管理文件
cat > /usr/lib/systemd/system/zabbix-server.service << EOF
[Unit]
Description=Zabbix Server with MySQL DB
After=syslog.target network.target mysqld.service
[Service]
Type=simple
ExecStart=/usr/local/sbin/zabbix_server -f
User=zabbix
[Install]
WantedBy=multi-user.target
EOF
#启动服务
systemctl daemon-reload
systemctl enable --now zabbix-server
netstat -lntp | grep zabbix
#zabbix_server 默认监听 10051 端口
(4) 部署 Web 前端,进行访问
cp -r /opt/zabbix-6.0.13/ui/* /var/www/zbx
#把ui下面的文件复制到网页根目录当中
ps aux | grep nginx
#nginx和php用的是nginx
chown -R nginx:nginx /var/www/zbx
#修改网页根目录的属组和属组为nginx
浏览器访问:http://zbx.www.com/
http://zbx.kkk.com/
【Default language】选择 Chinese(zh_CN),点击下一步
【密码】输入 zabbix,点击下一步
【Zabbix主机名称】输入 Zabbix-监控;
【默认时区】选择 Asia/Shanghai,点击下一步
安装完成后,默认的登录账号和密码为:Admin/zabbix
1.1主节点 Zabbix Server 配置
#主节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.210.101
DBName=zabbix
DBUser=zabbix
DBPassword=zabbix
......
HANodeName=zbx-server01 #设置为当前节点主机名
NodeAddress=192.168.210.101:10051 #设置为节点IP
systemctl restart zabbix-server
#主节点给数据库授权远程登录权限
mysql -uroot -pabc123
GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
FLUSH PRIVILEGES;
1.2 备节点 Zabbix Server 配置
#备节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.210.102 #87
DBName=zabbix #99
DBUser=zabbix #115
DBPassword=zabbix #123
......
HANodeName=zbx-server02
NodeAddress=192.168.210.102:10051
systemctl restart zabbix-server
1.3 主备节点添加监控主机
以主节点添加zbx-agent01为例,其余添加过程相同
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】输入 zbx-agent01
【可见的名称】输入 zbx-agent01-192.168.210.103
【模板】搜索 Linux ,选择 Linux by Zabbix agent
【群组】选择 Linux servers
【Interfaces】点击添加 客户端
【IP地址】输入 192.168.210.103
1.4 查看高可用集群状态
打开Web页面
选择报表-->系统信息
查看高可用集群项是否已经启用
2、两个客户端配置
(1) 服务端和客户端都配置时间同步
yum install -y ntpdate
ntpdate -u ntp.aliyun.com
(2) 服务端和客户端都设置hosts解析
cat > /etc/hosts << EOF
192.168.210.101 zbx-server01
192.168.210.102 zbx-server02
192.168.210.103 zbx-agent01
192.168.210.104 zbx-agent02
EOF
(3) 安装 zabbix-agent2
#设置 zabbix 的下载源,安装zabbix-agent2
rpm -Uvh https://mirrors.aliyun.com/zabbix/zabbix/6.0/rhel/7/x86_64/zabbix-release-6.0-4.el7.noarch.rpm
sed -i 's#https://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo
yum install zabbix-agent2 zabbix-agent2-plugin-* -y
2.1 修改agent01和agent02的配置文件
需要在agent配置文件中将所有的Server节点地址配置到Server
和ServerActive
中
vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.210.101,192.168.210.102,192.168.210.103,192.168.210.104
ServerActive=192.168.210.101;192.168.210.102;192.168.210.103;192.168.210.104
#注意,ServerActive 的连接符是‘;’ ,而不是‘,’
systemctl restart zabbix-agent2.service
2.2 查看web页面
点击右侧【监测】,然后点击主机
3、故障模拟和效果测试
模拟zabbix-server
出现故障,观察能否自动故障切换
3.1 模拟server节点出现故障,观察Web前端页面
#切换到zabbix-server01
systemctl stop zabbix-server
3.2 观察能否故障切换