分享两个监控脚本,用于监控Oracle ADG的状态,如果状态异常则发送邮件告警
脚本一:
利用语句查询日志的应用状态,如果长时间未应用则邮件告警,提醒DBA检查ADG的状态是否异常;
阈值条件:最近一次日志应用时间和当前执行时间差>3600s
缺点:对于负载很小的系统,可能会误报
#!/bin/bash# 设置环境变量(根据实际的 Oracle 环境进行调整)export ORACLE_SID=orclexport ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbexport PATH=$ORACLE_HOME/bin:$PATH# Oracle 用户和密码#如果监控脚本布置在adg本机 可以不设置DB_USER="sys"DB_PASS="password"TNS_ADMIN="orcl" # TNS Entry for standby database# 邮件设置MAIL_TO="xiaoxiangqin@mail.com"SUBJECT=" ADG Status Alert"MAIL_LOG="/tmp/adg_alert_mail.log"# 查询数据库,获取最后应用的日志时间#LAST_APPLIED_TIME=$(sqlplus -s "$DB_USER/$DB_PASS as sysdba" <<EOFSET HEADING OFFSET FEEDBACK OFFSELECT TO_CHAR(next_time, 'YYYY-MM-DD HH24:MI:SS')FROM v\$archived_logWHERE sequence# = (SELECT MAX(sequence#)FROM v\$archived_logWHERE applied = 'YES');EXIT;EOF)# 如果查询失败,退出脚本if [ -z "$LAST_APPLIED_TIME" ]; thenecho "[$(date)] Error: Unable to retrieve last applied log time." >> $MAIL_LOGexit 1fi# 获取当前时间CURRENT_TIME=$(date +"%Y-%m-%d %H:%M:%S")# 将时间转换为时间戳LAST_APPLIED_TIMESTAMP=$(date -d "$LAST_APPLIED_TIME" +%s)CURRENT_TIMESTAMP=$(date -d "$CURRENT_TIME" +%s)# 计算时间差(单位:秒)TIME_DIFF=$((CURRENT_TIMESTAMP - LAST_APPLIED_TIMESTAMP))# 时间差是否超过 1 小时(3600 秒)#这个时间和数据库的负载相关,如果是比较繁忙的系统,可以设置短一些if [[ "$TIME_DIFF" -gt 3600]]; thenecho "[$(date)] Last Applied Log Time: $LAST_APPLIED_TIME" >> $MAIL_LOGecho "[$(date)] Current Time: $CURRENT_TIME" >> $MAIL_LOGecho "[$(date)] Time difference exceeds 3 hours, sending alert." >> $MAIL_LOG# 发送报警邮件mailx -s "$SUBJECT" "$MAIL_TO" <<EOFWarning: The last applied log on the ADG standby database was applied at $LAST_APPLIED_TIME.Current time is $CURRENT_TIME.The time difference exceeds 3 hours. Please check the ADG status.EOFelseecho "[$(date)] ADG is normal. Last applied log time: $LAST_APPLIED_TIME" >> $MAIL_LOGfi
脚本二
利用语句查询日志的应用状态,如果长时间未应用则邮件告警,提醒DBA检查ADG的状态是否异常;
阈值条件: 间隔5秒查询系统当前的SCN号,如果SCN未推进则报警
对比下来,感觉利用SCN变化来监控adg更为精准,而且基本不会误报。
#!/bin/bash# 设置环境变量(根据实际的 Oracle 环境进行调整)export ORACLE_SID=orcldgexport ORACLE_HOME=/u01/app/oracle/product/11.2.0/db_1export PATH=$ORACLE_HOME/bin:$PATH# 邮件设置MAIL_TO="xiaoxiangqin@mail.com"SUBJECT="ADG Status Alert"#MAIL_LOG="/tmp/adg_alert_mail.log"MESSAGE="ADG error:SCN not change,please check。"# 执行第一次查询SCN1=$(sqlplus -s / as sysdba <<EOFset heading off feedback off verify offSELECT TO_CHAR(current_scn) FROM v\$database;exit;EOF)# 等待5秒sleep 5# 执行第二次查询SCN2=$(sqlplus -s / as sysdba <<EOFset heading off feedback off verify offSELECT TO_CHAR(current_scn) FROM v\$database;exit;EOF)# 对比两次查询的SCN值,如果相同则发送告警邮件if [ "$SCN1" = "$SCN2" ]; thenecho "$MESSAGE" | mailx -s "$SUBJECT" "$MAIL_TO"fi
脚本三
ADG自动删除archive log
#!/bin/shtable='v$archived_log'#设置环境变量export ORACLE_SID=orcldgexport ORACLE_BASE=/u01/app/oracleexport ORACLE_HOME=/u01/app/oracle/product/11.2.0/db_1$ORACLE_HOME/bin/sqlplus -silent "/ as sysdba" <<EOF > /home/oracle/scripts/deletedgarch.shset heading off;set pagesize 0;set term off;set feedback off;set linesize 32767;select 'rm -rf '||name from ${table} where DELETED='NO' and APPLIED='YES';exit;EOFsh /home/oracle/scripts/deletedgarch.shrman target /<<ENDcrosscheck archivelog all;delete noprompt expired archivelog all;exit;END
附录如何在linux配置发送邮件
-
安装客户端
#基于 RedHat/CentOS 的系统yum install mailx#Debian/Ubuntu 的系统apt install mailutils
2. 配置参数/etc/mail.rc
set bsdcompat##设置发送邮件的邮件名set from=OracleAlert@mail.com##设置smtp 需要确保ip地址和端口通的set smtp=10.8.8.8:25
3. 测试发送邮件
echo "Test email body" | mailx -s "Test Subject" OracleAlert@mail.com
4.邮件还是一个Linux和windows之间好用的文件传输工具
#将/home/oracle/script/check_dg_status_scn.sh以附件的形势发送给我自己echo "test"|mailx -s "test" -a /home/oracle/script/check_dg_status_scn.sh xiaoxiangqin@mail.com




















