文章目录
- 概要
- Zabbix警监控脚本
- 技术细节
- 配置zabbix告警
概要
提示:本教程用于Ubuntu ,zabbix7.0
Zabbix警监控脚本
提示:需要创建一个脚本
#检查是否有 python3 和版本
root@zabbix:~# python3 --version
Python 3.12.3
在/usr/lib/zabbix/alertscripts/目录中创建一个名称为dingding_alert.py的Python脚本;内容如下;
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests
import json
import sys
import os
import datetime
# 钉钉机器人 Webhook 地址
webhook = "这里填写创建的机器人Webhook 地址"
# 日志文件路径
log_file = "/var/log/zabbix/dingding_alert.log"
# 参数检查
if len(sys.argv) < 4:
print("Usage: dingding_alert.py <phone> <subject> <text>")
sys.exit(1)
# 读取命令行参数
user = sys.argv[1]
subject = sys.argv[2]
text = sys.argv[3]
# ✅ 修改内容:加上关键词前缀 **这里要与钉钉安全设置的名称一致**
msg = f"【zabbix告警】\n{subject}\n{text}"
# 构造消息内容
payload = {
"msgtype": "text",
"text": {
"content": msg
},
"at": {
"atMobiles": [user],
"isAtAll": False
}
}
headers = {'Content-Type': 'application/json'}
now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
# 确保日志目录存在
os.makedirs(os.path.dirname(log_file), exist_ok=True)
# 发送钉钉消息
try:
response = requests.post(url=webhook, data=json.dumps(payload), headers=headers, timeout=5)
result = response.json()
with open(log_file, "a+") as f:
f.write("\n" + "=" * 60)
f.write(f"\n[{now}] 用户: {user}")
f.write(f"\n请求状态码: {response.status_code}")
f.write(f"\n返回结果: {result}")
f.write(f"\n告警内容:\n{msg}")
if result.get("errcode") == 0:
f.write("\n发送状态: ✅ 成功\n")
else:
f.write("\n发送状态: ❌ 失败\n")
except Exception as e:
with open(log_file, "a+") as f:
f.write("\n" + "=" * 60)
f.write(f"\n[{now}] 用户: {user}")
f.write(f"\n异常发生: {str(e)}")
f.write(f"\n告警内容:\n{msg}")
f.write("\n发送状态: ❌ 失败\n")
技术细节
提示:必须条件
提示:创建一个存放dingding_alert存放日志的文件;
root@zabbix:~# touch /var/log/zabbix/dingding_alert.log
root@zabbix:~# chown zabbix:zabbix /var/log/zabbix/dingding_alert.log
#为脚本添加可执行权限;
root@zabbix:~# chmod a+x /usr/lib/zabbix/alertscripts/dingding_alert.py
#测试脚本的准确性;
root@zabbix:~# python3 /usr/lib/zabbix/alertscripts/dingding_alert.py 138000000 subject of testing "This is a test information."
配置zabbix告警
提示:创建报警媒介类型:
提示:脚本参数::
{ALERT.SENDTO}
#对应脚本中的,user=sys.argv[1](发给钉钉群中哪个用户)。
{ALERT.SUBJECT}
#发送的信息的标题,在”报表”的”动作日志”中可以看到。
{ALERT.MESSAGE}
#对应脚本中的,text=sys.argv[3](发送的报警内容)。
创建报警动作:
添加触发器动作:
这里以system name has changed为例,意味着如果设备的名称被修改,就会触发告警。
参数解读:
“主题”对应”钉钉告警”媒介中的:{ALERT.SUBJECT}
“消息”对应”钉钉告警”媒介中的:{ALERT.MESSAGE}
主题:
故障名称(触发器名称):{EVENT.NAME}
消息:
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息:{TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}
恢复操作基本相同,添加细节操作
主题:
故障恢复:{EVENT.NAME}
消息:
恢复主机:{HOSTNAME1}
恢复时间:{EVENT.DATE}{EVENT.RECOVERY.TIME}
主机IP:{HOST.IP}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}
给用户添加报警媒介
触发告警
登录到交换机POE-S5735S;修改交换机的设备名称;等待几分钟,查看报警情况。
[POE-S5735S]sysname POE-SWITCH-2025