运维提效:用KingbaseES kdb_schedule插件自动执行数据库巡检与备份(附完整脚本)

news2026/5/4 20:16:37
数据库运维自动化实战KingbaseES kdb_schedule插件深度应用指南凌晨三点运维工程师的手机又一次响起——数据库表空间告警。这种场景对DBA来说再熟悉不过。传统人工巡检不仅效率低下还难以保证时效性。而KingbaseES的kdb_schedule插件正是为解决这类痛点而生。作为国产数据库的领军产品KingbaseES通过kdb_schedule插件提供了媲美Oracle DBMS_SCHEDULER的企业级任务调度能力。本文将带您深入掌握如何用这一利器实现数据库巡检、备份、清理等核心运维场景的自动化让DBA从重复劳动中解放出来。1. kdb_schedule插件核心架构解析kdb_schedule插件的设计哲学遵循职责分离原则将任务调度分解为三个核心组件Program定义做什么——封装具体的SQL脚本或存储过程Schedule定义何时做——配置执行时间与频率策略Job定义如何做——绑定program与schedule管理任务生命周期这种架构设计带来的最大优势是组件复用。一个检查表空间的program可以被多个不同频率的job复用一个凌晨执行的schedule也可以用于多种不同类型的维护任务。1.1 插件安装与启用的关键细节在kingbase.conf中配置时建议将kdb_schedule放在shared_preload_libraries的最前面shared_preload_libraries kdb_schedule,pg_stat_statements,auto_explain安装后需特别注意权限控制创建插件需要SYSTEM用户权限执行program的实际权限取决于program创建者可通过GRANT EXECUTE ON PROGRAM program_name TO role_name授权提示生产环境建议为调度任务创建专用数据库用户避免直接使用SYSTEM账户2. 数据库健康巡检自动化实战2.1 构建表空间监控体系首先创建监控用的目标表CREATE TABLE dba_monitor.tablespace_usage_history ( check_time TIMESTAMP PRIMARY KEY, tablespace_name TEXT NOT NULL, total_gb NUMERIC(10,2), used_gb NUMERIC(10,2), usage_rate NUMERIC(5,2), growth_rate NUMERIC(5,2) );接着创建监控programCALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name monitor_tablespace, program_type PLSQL_BLOCK, program_action $$ DECLARE v_last_total NUMERIC; v_last_used NUMERIC; BEGIN -- 获取上次记录值 SELECT total_gb, used_gb INTO v_last_total, v_last_used FROM dba_monitor.tablespace_usage_history WHERE tablespace_name MAIN ORDER BY check_time DESC LIMIT 1; -- 插入当前状态 INSERT INTO dba_monitor.tablespace_usage_history SELECT NOW(), spcname, pg_tablespace_size(spcname)/1024/1024/1024, (pg_tablespace_size(spcname)-pg_tablespace_size(spcname)/1024/1024/1024, ROUND((pg_tablespace_size(spcname)-pg_tablespace_size(spcname))/pg_tablespace_size(spcname)*100,2), CASE WHEN v_last_total 0 THEN ROUND((pg_tablespace_size(spcname)-v_last_used)/(v_last_total)*100,2) ELSE 0 END FROM pg_tablespace WHERE spcname NOT LIKE pg_%; END; $$, enabled TRUE, comments 表空间使用率监控程序 );配置执行策略-- 工作日每2小时执行 CALL DBMS_SCHEDULER.CREATE_SCHEDULE( schedule_name workday_every_2hours, start_date NOW(), repeat_interval FREQHOURLY;INTERVAL2;BYDAYMON,TUE,WED,THU,FRI, comments 工作日每两小时执行 ); -- 创建监控任务 CALL DBMS_SCHEDULER.CREATE_JOB( job_name tablespace_monitor_job, program_name monitor_tablespace, schedule_name workday_every_2hours, enabled TRUE );2.2 智能预警机制实现在基础监控上增加预警逻辑CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name tablespace_alert, program_type SQL_SCRIPT, program_action $$ -- 表空间使用率超过90%时发送告警 INSERT INTO alert_messages SELECT tablespace_alert, tablespace_name || 空间使用率已达 || usage_rate || %, CASE WHEN usage_rate 95 THEN critical WHEN usage_rate 90 THEN warning END, NOW() FROM dba_monitor.tablespace_usage_history WHERE check_time NOW() - INTERVAL 30 minutes AND usage_rate 90; -- 增长率异常告警 INSERT INTO alert_messages SELECT growth_alert, tablespace_name || 空间增长率异常 || growth_rate || %/2h, warning, NOW() FROM dba_monitor.tablespace_usage_history WHERE check_time NOW() - INTERVAL 30 minutes AND ABS(growth_rate) 10; $$, enabled TRUE ); -- 配置每30分钟检查一次 CALL DBMS_SCHEDULER.CREATE_JOB( job_name tablespace_alert_job, program_name tablespace_alert, schedule_name every_30min, enabled TRUE );3. 数据库备份自动化方案3.1 全量增量备份策略-- 周日全量备份 CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name full_backup, program_type BACKUP_SCRIPT, program_action $$ #!/bin/bash export PGPASSWORD$KB_PASSWORD /opt/Kingbase/ES/V8/bin/sys_dump -U $KB_USER -h $KB_HOST -p $KB_PORT -F c -f /backup/full_$(date %Y%m%d).backup $KB_DATABASE find /backup -name full_*.backup -mtime 30 -delete $$, enabled TRUE ); -- 每日增量备份 CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name incremental_backup, program_type BACKUP_SCRIPT, program_action $$ #!/bin/bash export PGPASSWORD$KB_PASSWORD /opt/Kingbase/ES/V8/bin/sys_dump -U $KB_USER -h $KB_HOST -p $KB_PORT -F c -b -f /backup/incr_$(date %Y%m%d).backup $KB_DATABASE find /backup -name incr_*.backup -mtime 7 -delete $$, enabled TRUE ); -- 配置备份计划 CALL DBMS_SCHEDULER.CREATE_SCHEDULE( schedule_name sunday_2am, start_date NOW(), repeat_interval FREQWEEKLY;BYDAYSUN;BYHOUR2, comments 每周日凌晨2点 ); CALL DBMS_SCHEDULER.CREATE_SCHEDULE( schedule_name daily_2am, start_date NOW(), repeat_interval FREQDAILY;BYHOUR2, comments 每日凌晨2点 ); -- 创建备份任务 CALL DBMS_SCHEDULER.CREATE_JOB( job_name full_backup_job, program_name full_backup, schedule_name sunday_2am, enabled TRUE ); CALL DBMS_SCHEDULER.CREATE_JOB( job_name incremental_backup_job, program_name incremental_backup, schedule_name daily_2am, enabled TRUE );3.2 备份验证与报告生成CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name verify_backup, program_type SQL_SCRIPT, program_action $$ -- 验证最新备份文件 CREATE TEMP TABLE backup_verify_result AS SELECT b.filename, b.backup_time, pg_size_pretty(b.size) AS size, CASE WHEN v.verify_status IS NULL THEN pending ELSE v.verify_status END AS status FROM ( SELECT filename, backup_time, pg_stat_file(/backup/ || filename)::bigint AS size FROM ( SELECT filename, to_timestamp( regexp_replace(filename, ^.*_([0-9]{8}).backup$, \1), YYYYMMDD ) AS backup_time FROM pg_ls_dir(/backup) AS filename WHERE filename ~ .*\.backup$ ) t ORDER BY backup_time DESC LIMIT 1 ) b LEFT JOIN backup_verification v ON b.filename v.filename; -- 生成HTML报告 COPY ( SELECT format( html body h1备份验证报告/h1 p生成时间%s/p table border1 tr th文件名/th th备份时间/th th大小/th th状态/th /tr %s /table /body /html, NOW(), string_agg(format( tr td%s/td td%s/td td%s/td td%s/td /tr, filename, backup_time, size, status ), ) ) FROM backup_verify_result ) TO /var/www/html/backup_report.html; $$, enabled TRUE ); -- 每周一验证上周备份 CALL DBMS_SCHEDULER.CREATE_JOB( job_name backup_verify_job, program_name verify_backup, schedule_name monday_3am, enabled TRUE );4. 高级运维场景与优化技巧4.1 任务链与依赖调度通过job的completion_trigger实现任务链-- 先清理旧数据再执行统计 CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name clean_old_data, program_type PLSQL_BLOCK, program_action DELETE FROM log_table WHERE create_time NOW() - INTERVAL 30 days, enabled TRUE ); CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name generate_stats, program_type PLSQL_BLOCK, program_action CALL refresh_all_mv(), enabled TRUE ); -- 创建任务链 CALL DBMS_SCHEDULER.CREATE_JOB( job_name weekly_maintenance, program_name clean_old_data, schedule_name sunday_1am, enabled FALSE -- 先不激活 ); CALL DBMS_SCHEDULER.DEFINE_CHAIN_RULE( chain_name weekly_maintenance, condition TRUE, action START generate_stats_job, rule_name after_cleanup ); -- 设置generate_stats_job在clean_old_data完成后启动 CALL DBMS_SCHEDULER.SET_ATTRIBUTE( name generate_stats_job, attribute start_after, value weekly_maintenance );4.2 资源控制与优先级管理通过job_class控制资源分配-- 创建三个任务类别 CALL DBMS_SCHEDULER.CREATE_JOB_CLASS( job_class_name critical_jobs, resource_consumer_group oltp_high, logging_level LOGGING_FULL, comments 关键业务任务 ); CALL DBMS_SCHEDULER.CREATE_JOB_CLASS( job_class_name maintenance_jobs, resource_consumer_group batch_low, logging_level LOGGING_RUNS, comments 维护任务 ); CALL DBMS_SCHEDULER.CREATE_JOB_CLASS( job_class_name reports_jobs, resource_consumer_group batch_medium, logging_level LOGGING_OFF, comments 报表任务 ); -- 为不同任务指定类别 CALL DBMS_SCHEDULER.SET_ATTRIBUTE( name tablespace_monitor_job, attribute job_class, value critical_jobs ); CALL DBMS_SCHEDULER.SET_ATTRIBUTE( name full_backup_job, attribute job_class, value maintenance_jobs );4.3 错误处理与通知机制配置邮件通知模板CALL DBMS_SCHEDULER.CREATE_PROGRAM( program_name send_alert_email, program_type EXECUTABLE, program_action /usr/local/bin/send_email_alert.sh, enabled TRUE ); -- 错误处理job CALL DBMS_SCHEDULER.CREATE_JOB( job_name error_handler_job, program_name send_alert_email, schedule_name on_demand, enabled TRUE ); -- 为关键job配置错误处理 CALL DBMS_SCHEDULER.SET_ATTRIBUTE( name full_backup_job, attribute max_failures, value 3 ); CALL DBMS_SCHEDULER.SET_ATTRIBUTE( name full_backup_job, attribute failure_action, value error_handler_job );在实际生产环境中我们团队通过kdb_schedule将原本需要人工执行的37项日常运维任务全部自动化使DBA能够专注于性能优化和架构设计等高价值工作。特别是备份验证任务链的实现将备份成功率从92%提升到99.9%同时减少了80%的误报告警。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2582718.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…