WGCLOUD v3.5.7 于 2025 年 2 月 3 日发布1。这是一款开源免费的分布式运维监控平台,server 端基于 springboot 开发,agent 端使用 go 编写1。以下是 v3.5.7 版本的更新内容1:
2. 自定义告警批量添加设置
3. 告警通知渠道设置
4. 告警规则设置
- 新增功能
- Docker 容器监控增强:实现了监控主机的全量 Docker 容器采集与查看功能,还提供了数据开放接口,可获取主机的所有 Docker 容器列表数据。
- 告警设置优化:支持设置监控主机连续几次不上报数据后发送告警通知,通过配置项 hostDownWarnCount 进行设置。自定义告警模块增加了批量添加功能,且添加页面默认显示 server 配置文件中的全局告警阈值,不再为空。
- 主题设置功能:支持设置背景颜色主题,共有经典白、暗夜黑、护眼绿、柔和绿 4 种可选。
- 改造内容
- 接口监控优化:在接口监控的图表页面,增加显示接口响应的 Body 内容、Body 体积、响应状态码、错误信息等数据。
- agent 升级:agent 采用全新版本的 golang 开发和编译,提升了运行的性能和安全,且依然支持 agent 历史版本所支持的主机操作系统。
- 优化方面
- 进程列表优化:主机全量进程列表页面,增加查看进程详情功能。
- 登录页面改进:登录页面验证码得到改进,登录后页面的右上角按钮排列布局也进行了优化。
- 过滤查询添加:在主机、端口、进程、日志、防篡改、Docker、服务接口、数据库、PING 等监控资源的列表页面,右上角添加监控中和已停止的过滤查询按钮。
- 统计图表完善:v1 和 v2 大屏的主机系统类型统计图表中,增加显示系统 Android 和麒麟数量占比,v3 大屏的主机列表 IP 后,增加显示主机备注。
- 指令执行安全优化:server - backup 监控动环数据时,若指令或脚本中包含 'rm,mkfs, /dev/,:(){:|:&};:,mv,wget, install,del,delete,format,ren,rd,rd/s/q,rmdir ' 等非法字符,系统将拒绝执行。
- 菜单配置优化:移除配置文件中配置项 sidebarCollapse,因为点击左侧菜单上面的三个横杠按钮后,系统会自动保留菜单闭合 / 展开状态,直到退出系统。
- 登录限制调整:密码连续 5 次输入错误,禁止登录时间从原来的 10 分钟延长至 20 分钟。
- bug 修复
- 修复了进程监控中,部署在 windows 运行的 agent,若有的监控进程不存在,则不会上报其他监控进程数据的问题。
- 修复了一些已知的其他 bug。
-
在 WGCLOUD v3.5.7 中设置告警通知可以按以下步骤和相关方式进行操作:
1. 连续不上报数据告警设置
支持设置监控主机连续几次不上报数据后发送告警通知,可通过修改配置项
hostDownWarnCount
来实现。 - 找到配置文件:一般在
server
端的配置文件中进行操作。具体路径可能因部署环境有所不同,通常在wgcloud-server/config/application.properties
文件里。 - 修改配置项:打开配置文件,找到
hostDownWarnCount
配置项,将其设置为你期望的主机连续不上报数据的次数,例如设置为3
,表示主机连续 3 次不上报数据时触发告警通知。修改完成后保存配置文件,并重启server
服务使配置生效。 - 进入自定义告警模块:登录 WGCLOUD 运维监控平台的管理界面,找到自定义告警相关的设置入口。
- 批量添加功能使用:在自定义告警添加页面,通常会有批量添加的选项。点击该选项后,页面会默认显示
server
配置文件中的全局告警阈值,你可以根据实际需求对这些阈值进行调整,然后输入需要批量添加的告警规则信息,完成后提交保存即可。 - 邮件告警:
- 配置邮件信息:同样在
server
端的配置文件application.properties
中,找到邮件相关的配置项,如spring.mail.host
(邮件服务器地址)、spring.mail.port
(邮件服务器端口)、spring.mail.username
(发件人邮箱账号)、spring.mail.password
(发件人邮箱授权码)等,按照实际情况进行正确配置。 - 设置接收人:在平台的告警设置界面,指定接收告警邮件的邮箱地址。
- 配置邮件信息:同样在
- 短信告警等其他渠道(若支持):如果平台支持短信告警等其他通知渠道,一般也会在配置文件或管理界面中提供相应的配置选项。你需要根据具体的短信服务商要求,配置短信接口相关信息,如短信 API 地址、账号、密钥等,并设置接收短信告警的手机号码。
- 针对不同监控项设置规则:在平台中针对不同的监控对象,如主机、端口、进程、服务接口等,设置具体的告警规则。例如,对于主机 CPU 使用率,可以设置当 CPU 使用率超过 80% 时触发告警;对于端口监控,可以设置端口不通时触发告警等。
- 规则配置位置:一般在各个监控对象的详细设置页面中,会有告警规则的设置选项,根据实际需求进行灵活配置。