Zabbix监控(十五):心跳检测Zabbix Server的存活状态-linux安全运维_跨零代码

跨零代码为大家提供高品质的运维解决方案,请大家多多来访,跨零不胜感激,在此谢过。

作用:为了防止zabbix server因意外原因不能工作,导致管理员没有收到报警邮件而不知道zabbix server是否运行正常,利用心跳检测来监控zabbix server本身的运行状态。

1、给Zabbix server添加一个Item

该Item主要作用是监控zabbix_server服务的默认端口10051或者zabbix_agentd的端口10050:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

2、添加触发器

跟以往的触发器不一样,这里设置的是当端口状态正常(listen)时触发:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

3、添加动作

(1)把默认的内容删除,设置如下,不用勾上恢复项:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

(2)设置动作的条件,指定触发器状态为OK时执行动作:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

(3)设置动作详细

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

说明:以往的step设置是from 1 to 1表示只在触发器触发的第一次执行动作,而这里from 1 to 0表示间隔一定时间执行动作,一直这样执行下去。

4、查看触发器状态

由于10055端口不存在,因此状态为PROBLEM:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

5、修改Item

将端口修改成10050或者10051,使其触发器跳变到OK,从而触发动作的执行:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

6、触发动作后查看邮件

Zabbix本身默认的邮件报警动作会发送触发器的故障和恢复邮件,本例设置的动作执行成功则会另发一封心跳检测邮件,标题就是前面设置的”Zabbix Server is running”:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

7、观察心跳检测结果

为了更好的检查效果,将动作中的时间间隔设为1分钟,可以看到邮件接收效果:

Zabbix监控(十五):心跳检测Zabbix Server的存活状态

 

结论:如果先设置触发器返回OK状态再设置Action,是不会发送邮件的,只有当触发器从PROBLEM跳变为OK时,才会触发动作;默认的动作是只在状态转换时发送一次邮件通知,心跳检测动作是可以按间隔时间一直发送的,这样就可以通过手机接收邮件,随时关注监控服务器是否运行正常。

从零到一,创造未来!跨零代码综合IT问题解决服务站,欢迎你的到来。运维教程 只为你绽放。

本文固定链接: http://kua0.com/2019/02/05/zabbix监控十五:心跳检测zabbix-server的存活状态-linux安全运维_跨/

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注