数据库日常检查
文章目录环境文档用途详细信息环境系统平台银河麒麟 X86_64,Linux x86-64 Red Hat Enterprise Linux 8,Linux x86-64 Red Hat Enterprise Linux 7版本9.0.4,4.5.10,4.5.8,9.0.3文档用途通过系统化的数据库日常检查主动发现并解决数据库潜在问题确保其高可用性、高性能及数据安全性降低因数据库问题导致的业务中断风险。详细信息1. 磁盘空间查看总体磁盘使用率。df -h 文件系统 容量 已用 可用 已用% 挂载点 devtmpfs 7.7G 0 7.7G 0% /dev tmpfs 7.7G 128K 7.7G 1% /dev/shm tmpfs 7.7G 27M 7.7G 1% /run“已用%”超过85%需预警。提前进行磁盘扩容。检查数据库相关文件占用的磁盘空间大小。包括数据文件、备份、归档文件。du -sm数据目录数据库参数data_directory定义可查看此参数。通常会使用变量 $PGADA定义也可查看此变量。会使用变量 $PGADA定义可查看此变量。备份目录查看备份脚本确认归档目录数据库参数archive_command定义可查看此参数2. 数据库状态pg_ctlstatuspg_ctl: 正在运行服务器进程(PID:2129)/opt/highgo/hgdb-see-4.5.8/bin/postgres如果有一个服务器正在运行其PID和用来调用它的命令行选项将被显示。如果没有正在运行则返回空。3. 集群状态查看集群状态hghactl listCluster: hgdb----------------------------------------------------------------------|Member|Host|Role|State|TL|LaginMB|Pending restart|------------------------------------------------------------------------------------|hgdb01|xxx:5866|Sync Standby|running|15|0|*||hgdb02|xxx:5866|Replica|running|15|0|*||hgdb03|xxx:5866|Leader|running|15||*|------------------------------------------------------------------------------------Member: 集群节点名Host集群节点的IP地址和端口号Role节点在集群中的角色。Leader表示主库。Replica表示从库State节点状态。正常运行状态是running。备库状态可能是streaming注意其他状态需预警检查集群是否存在问题。Lag in MB: 节点数据同步延迟信息。正常状态是0。注意出现延迟需要预警。检查网络是否正常。如果延迟持续增加检查数据是否存在问题。4. ETCD状态(集群存储)etcdctl endpointstatus-wtable------------------------------------------------------------------------------------------------------------------------------------------|ENDPOINT|ID|VERSION|DB SIZE|ISLEADER|ISLEARNER|RAFT TERM|RAFTINDEX|RAFT APPLIEDINDEX|ERRORS|------------------------------------------------------------------------------------------------------------------------------------------|http://xxx:2379 | fdd02f4686cd14c1 | 3.5.9 | 34 MB | false | false | 10 | 314919 | 314919 | ||http://xxx:2379 | c1172683a2531908 | 3.5.9 | 34 MB | true | false | 10 | 314919 | 314919 | ||http://xxx:2379 | dcd245c7752fe1b5 | 3.5.9 | 34 MB | false | false | 10 | 314919 | 314919 | |------------------------------------------------------------------------------------------------------------------------------------------ENDPOINTETCD节点的地址。IDETCD节点标识DB SIZEETCD节点存储大小。注意节点存储大小不要超过8GB。大小接近8GB时需要预警。IS LEADERETCD节点角色。true表示ETCD的领导者。5. 备份检查查看备份计划任务。crontab-l查看备份路径检查计划任务中的备份脚本。脚本开头的变量backup_db_cluster指定了备份路径检查备份状态备份路径下会存在备份和备份日志。备份日志以log为后缀。查看备份日志确认备份状态。tail-f 日志.log#egtail-f hgdbbak_2025xxxx_1.log...3827933/3827933kB(100%),3/3多个表空间 pg_basebackup: 预写日志结束点: E1/C9000220 pg_basebackup: 等待后台进程结束流操作...pg_basebackup: 同步数据到磁盘...pg_basebackup: 基础备份已完成2025-xx-xx11:22:33The nameofthebackupfileis:hgdbbak_20251021_1,the nameofthe archiveis:00000001000000E1000000C9.00000028.backup...基础备份已完成(base backup complete) 备份正常结束标识。注意没有此标识需预警。备份可能不正常。The name of the backup file is显示本次备份文件的名字6. 内存检查检查服务器内存使用情况。free -h total used free shared buff/cache available Mem: 15G 7.1G 720M 252M 7.6G 6.4G Swap: 3.8G 2.2M 3.8Gavailable可用内存大小。注意available大小不要低于2GB。低于2GB或物理内存10%时需要预警。7. 数据库连接数检查当前数据库的连接情况包括总连接数、当前连接数。通过检查判断是否需要增大最大连接数上限避免连接数满影响业务正常运行。selectmax_conn,max_conn-now_connasresi_conn,now_connfrom(selectsetting::int8asmax_conn,(selectcount(*)frompg_stat_activity)asnow_connfrompg_settingswherenamemax_connections)t;max_conn|resi_conn|now_conn-------------------------------1000|990|10max_conn最大连接数resi_conn剩余连接数now_conn当前连接数8. 表空间大小查询表空间大小。对比表空间和磁盘空间表空间占比过大时需提前进行磁盘扩容。SELECTtbs.spcname,pg_tablespace_size(tbs.oid)/1024/1024asused_bytes,CASEWHENtbs.spcname$$pg_default$$THEN(SELECTcurrent_setting($$data_directory$$))WHENtbs.spcname$$pg_global$$THEN(SELECTcurrent_setting($$data_directory$$))ELSEpg_tablespace_location(tbs.oid)ENDASlocationFROMpg_tablespace tbs;spcname|used_bytes|location---------------------------------------------------------pg_default|3692|/opt/highgo/hgdb-see-4.5.8/datapg_global|0|/opt/highgo/hgdb-see-4.5.8/datatbs1|16|/opt/tbs tbs2|0|/opt/tbs2spcname表空间名used_bytes表空间使用大小(单位MB)location表空间路径9. 数据库用户有效期查询用户密码有效期避免密码到期。应用用户登陆。selectusename,valuntilfrompg_user;usename|valuntil------------------------------------testuser|2025-12-3100:00:0008sysdba|infinityusename用户名valuntil密码过期时间。infinity表示永久有效10. 归档日志检查归档日志是否正常。如果归档失败可能造成WAL日志积压。造成磁盘空间异常增长。selectpg_walfile_name(pg_current_wal_lsn())now_wal,*frompg_stat_archiver;-[RECORD1]-----------------------------------------------now_wal|00000001000000E1000000CA archived_count|36last_archived_wal|00000001000000E1000000C9.00000028.backuplast_archived_time|2025-xx-xx11:22:33.08485508failed_count|0last_failed_wal|last_failed_time|stats_reset|2025-xx-xx09:41:52.22208last_archived_time 最近归档时间。last_failed_time 最近归档失败时间。11. 数据库年龄查询数据库年龄剩余年龄百分比。selectdatname,datfrozenxid,age(datfrozenxid),round((2^31-age(datfrozenxid))::numeric/2^31::numeric*100,2)age_remain_percent,current_setting($$autovacuum_freeze_max_age$$)frompg_databaseorderbyage(datfrozenxid)desc;datname数据库名datfrozenxid数据库冻结xidage(datfrozenxid)数据库年龄age_remain_percent数据库剩余年龄百分比注意剩余年龄百分少于50%时需预警。排查是否有长事务阻止年龄回收。autovacuum_freeze_max_age自动Vacuum冻结最大年龄12. 表膨胀检查表膨胀情况。表膨胀会导致查询性能下降和空间浪费建议及时进行表膨胀检查和优化。SELECTcurrent_database()ASdb,schemaname,tablename,reltuples::bigintAStups,relpages::bigintASpages,otta,ROUND(CASEWHENotta0ORsml.relpages0ORsml.relpagesottaTHEN0.0ELSEsml.relpages/otta::numericEND,1)AStbloat,CASEWHENrelpagesottaTHEN0ELSErelpages::bigint-ottaENDASwastedpages,CASEWHENrelpagesottaTHEN0ELSEbs*(sml.relpages-otta)::bigintENDASwastedbytes,CASEWHENrelpagesottaTHEN$$0bytes$$::textELSE(bs*(relpages-otta))::bigint||$$ bytes$$ENDASwastedsize,iname,ituples::bigintASitups,ipages::bigintASipages,iotta,ROUND(CASEWHENiotta0ORipages0ORipagesiottaTHEN0.0ELSEipages/iotta::numericEND,1)ASibloat,CASEWHENipagesiottaTHEN0ELSEipages::bigint-iottaENDASwastedipages,CASEWHENipagesiottaTHEN0ELSEbs*(ipages-iotta)ENDASwastedibytes,CASEWHENipagesiottaTHEN$$0bytes$$ELSE(bs*(ipages-iotta))::bigint||$$ bytes$$ENDASwastedisize,CASEWHENrelpagesottaTHENCASEWHENipagesiottaTHEN0ELSEbs*(ipages-iotta::bigint)ENDELSECASEWHENipagesiottaTHENbs*(relpages-otta::bigint)ELSEbs*(relpages-otta::bigintipages-iotta::bigint)ENDENDAStotalwastedbytesFROM(SELECTnn.nspnameASschemaname,cc.relnameAStablename,COALESCE(cc.reltuples,0)ASreltuples,COALESCE(cc.relpages,0)ASrelpages,COALESCE(bs,0)ASbs,COALESCE(CEIL((cc.reltuples*((datahdrma-(CASEWHENdatahdr%ma0THENmaELSEdatahdr%maEND))nullhdr24))/(bs-20::float)),0)ASotta,COALESCE(c2.relname,$$?$$)ASiname,COALESCE(c2.reltuples,0)ASituples,COALESCE(c2.relpages,0)ASipages,COALESCE(CEIL((c2.reltuples*(datahdr-12))/(bs-20::float)),0)ASiotta-- very rough approximation, assumes all colsFROMpg_class ccJOINpg_namespace nnONcc.relnamespacenn.oidANDnn.nspname$$information_schema$$LEFTJOIN(SELECTma,bs,foo.nspname,foo.relname,(datawidth(hdrma-(casewhenhdr%ma0THENmaELSEhdr%maEND)))::numericASdatahdr,(maxfracsum*(nullhdrma-(casewhennullhdr%ma0THENmaELSEnullhdr%maEND)))ASnullhdr2FROM(SELECTns.nspname,tbl.relname,hdr,ma,bs,SUM((1-coalesce(null_frac,0))*coalesce(avg_width,2048))ASdatawidth,MAX(coalesce(null_frac,0))ASmaxfracsum,hdr(SELECT1count(*)/8FROMpg_stats s2WHEREnull_frac0ANDs2.schemanamens.nspnameANDs2.tablenametbl.relname)ASnullhdrFROMpg_attribute attJOINpg_class tblONatt.attrelidtbl.oidJOINpg_namespace nsONns.oidtbl.relnamespaceLEFTJOINpg_stats sONs.schemanamens.nspnameANDs.tablenametbl.relnameANDs.inheritedfalseANDs.attnameatt.attname,(SELECT(SELECTcurrent_setting($$block_size$$)::numeric)ASbs,CASEWHENSUBSTRING(SPLIT_PART(v,$$ $$,2)FROM$$#[0-9].[0-9]#%$$ for $$#$$)IN($$8.0$$,$$8.1$$,$$8.2$$)THEN27ELSE23ENDAShdr,CASEWHENv~$$mingw32$$ORv~$$64-bit$$THEN8ELSE4ENDASmaFROM(SELECTversion()ASv)ASfoo)ASconstantsWHEREatt.attnum0ANDtbl.relkind$$r$$GROUPBY1,2,3,4,5)ASfoo)ASrsONcc.relnamers.relnameANDnn.nspnamers.nspnameLEFTJOINpg_index iONindrelidcc.oidLEFTJOINpg_class c2ONc2.oidi.indexrelid)ASsmlorderbywastedbytesdesclimit5;-[RECORD1]---------------------------------db|testdb schemaname|tuser tablename|test_dump tups|2199979pages|25000otta|20460tbloat|1.2wastedpages|4540wastedbytes|37191680wastedsize|37191680bytes iname|idx_test_dump_id itups|2199979ipages|6043iotta|15345ibloat|0.4wastedipages|0wastedibytes|0wastedisize|0bytes totalwastedbytes|37191680tbloat表膨胀比例。注意比例超过5说明膨胀严重。建议及时处理。wastedsize表膨胀导致浪费的磁盘空间大小。13. 数据库日志查看数据库相关的操作记录告警(WARNING)错误(ERROR)都会记录到日志中。查看日志确认是否存在异常情况。数据库日志位置参数log_directory定义了日志位置。通常位于$PGDATA/…/hgdb_log。数据库日志名字参数log_filename定义了日志名字。通常以csv为后缀以highgodb为前缀。如/data/highgo/hgdb_log/highgodb_5.csv。日志文件是文本格式可通过文本编辑器查看。关注日志中的告警(WARNING)错误(ERROR)信息。获取更多支持请联系瀚高400技术支持热线400-708-8006转3。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2547016.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!