zabbix报警升级机制

场景一:在企业中,我们需要把报警设置为升级机制,当有些报警,运维人员没有及时处理的时候,
或者没有时间,或者外出,或者陪产在医院,或者...总之身边没有电脑没有网络,在山沟子里的时候,
必须有人站出来,解决这个问题。
场景二:当zabbix报警服务器出现问题的时候,例如MySQL挂了,运维人员在厕...没有及时处理,那一
分钟后这个警告肯定要升级,从警告变成严重故障之类的。
所以不管在哪种场景下,我们要有不同的报警人员,比如,一级报警,交给运维,没有及时处理就二
级报警,交给运维总监或者运维经理,如果此时报警还没有人处理,那么报警就会升级到CTO或者CEO
那里,那么这个时候,也是灾难降临之时,这也是一个很好的对运维人员必须要及时处理告警的一个

用户创建:

image-20230818142509716

告警升级机制

image-20230818150516529

zabbix自动化监控

zabbix工作模式:

不管是被动,还是主动,都是针对客户端而言zabbix-agent

  • 被动模式
  • 主动模式

zabbix的自动发现(被动模式)

zabbix-server自动发现zabbix-agent
添加一个zabbix的客户端:

1)需要安装一个客户端:  rpm -ivh xxx.rpm
2)修改zabbix-agent配置文件
3)启动zabbix-agent
4)页面添加zabbix-agent安装的主机
5)链接模板
#在企业中前三步可以通过Ansible部署完成,而我们需要的操作则是步骤4和步骤5

Zabbix提供了有效和非常灵活的网络自动发现功能。
当网络发现正确设置后你可以:

  • 1.加快Zabbix部署
  • 2.简化管理
  • 3.无需过多管理就能在快速变化的环境中使用Zabbix

Zabbix网络发现基于以下信息:

  • 1.IP范围
  • 2.可用的外部服务(FTP,SSH,WEB,POP3,IMAP,TCP等)
  • 3.来自 zabbix agent 的信息(仅支持未加密模式)
  • 4.来自 snmp agent 的信息
  • 不支持:
  • 1.发现网络拓扑

创建自动发现

#下载安装
[root@db02 ~]# rpm -ivh https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-agent-5.0.36-1.el7.x86_64.rpm
#修改配置文件
[root@db02 ~]# vim /etc/zabbix/zabbix_agentd.conf
Server=172.16.1.71
#启动服务
[root@db02 ~]# systemctl start zabbix-agent

image-20230818152635408

image-20230818152950876

更新完后切记启用服务状态!!!!

动作关联自动发现

image-20230818152837380

image-20230818153251198

image-20230818153522053

image-20230818153552236

#更新完配置后,在监测中自动发现验证
#自动发现总结:
1.网络发现速度太慢
2.轮询扫描网段
3.如果网段中存在不通的主机,会出现卡顿并且造成新增的服务器无法加入节点
4.会导致server性能变缓慢,影响server性能

zabbix的自动注册(主动模式)

zabbix-agent自动注册到zabbix-server中

1)需要安装一个客户端
rpm -ivh xxx.rpm
2)修改zabbix-agent配置文件
Server=172.16.1.71
ServerActive=172.16.1.71
Hostname=web01
3)启动zabbix-agent
4)页面添加zabbix-agent安装的主机
5)链接模板

创建动作:

image-20230818155527788

image-20230818160055147

image-20230818161430737

image-20230818160257475

image-20230818161759974

image-20230818162321843

#自动注册总结
1、需要主机集群主机名前缀一样
2、只需配置动作即可