VCSA 6.7日志盘红了别慌!手把手教你用SSH和autogrow.sh脚本安全扩容(附删快照提醒)
VCSA 6.7日志分区紧急扩容实战指南从告警处理到预防策略凌晨三点刺耳的告警铃声打破了运维值班室的宁静——VCSA管理界面突然弹出/storage/log分区空间不足的红色警告。作为VMware vSphere环境的核心组件vCenter Server ApplianceVCSA的日志分区爆满可能导致关键服务异常甚至影响整个虚拟化平台的稳定性。本文将基于真实故障场景带你完整走通从告警分析到安全扩容的全流程同时分享几个只有老运维才知道的风险规避技巧。1. 紧急诊断与预处理当/storage/log分区使用率达到95%以上时VCSA Web Client会在三个位置同时告警全局健康状态面板顶部导航栏出现红色三角警示图标监控→问题→存储显示具体分区空间不足详情系统配置→存储直观展示各分区使用量饼图此时立即执行以下诊断命令收集关键信息通过SSH连接VCSA后操作# 查看各分区实时使用情况 df -h | grep -i storage # 确认磁盘物理结构 lsblk -o NAME,FSTYPE,SIZE,MOUNTPOINT # 检查SCSI设备映射 lsscsi -v典型输出示例/dev/mapper/log_vg-log xfs 9.8G 9.3G 0.5G 95% /storage/log重要提醒扩容前必须确保虚拟机没有未删除的快照执行vim-cmd vmsvc/get.snapshot [VMID]检查存在快照会导致扩容失败并可能引发数据损坏。2. 虚拟机磁盘配置调整2.1 确认目标磁盘编号VCSA 6.7标准磁盘分配如下表所示磁盘序号挂载点默认大小功能描述1/12GB根分区2/storage/core25GB核心转储文件3/storage/seat5GB席位数据4/storage/db15GBPostgreSQL数据库5/storage/log10GB系统日志存储6/storage/updatemgr30GB更新管理器数据通过lsblk确认待扩容磁盘对应的VMDK编号通常日志盘为sdd对应磁盘52.2 在线扩容操作步骤登录vSphere Web Client右键VCSA虚拟机→编辑设置找到目标硬盘如Hard disk 5将容量从10GB调整为所需值建议至少100GB不勾选立即分配空间选项避免不必要的性能开销确认变更前再次检查快照状态关键细节调整大小时建议采用阶梯式扩容即每次增加不超过原始容量的200%避免SCSI控制器兼容性问题。3. 操作系统层分区扩展3.1 启用VCSA高级管理功能通过SSH连接后执行需具备管理员权限# 启用BASH shell访问 shell.set --enabled true shell3.2 执行自动化扩容脚本VMware官方提供的autogrow.sh脚本位于/usr/lib/applmgmt/support/scripts/autogrow.sh执行前建议先备份分区表sfdisk -d /dev/sdd sdd.backup完整扩容流程# 运行自动化脚本自动检测新增空间并扩展LVM sudo /usr/lib/applmgmt/support/scripts/autogrow.sh # 手动验证文件系统扩展XFS需要额外操作 sudo xfs_growfs /storage/log3.3 验证扩容结果# 检查物理卷变化 pvs | grep log_vg # 确认逻辑卷容量 lvs | grep log # 验证文件系统新尺寸 df -h /storage/log预期成功输出示例/dev/mapper/log_vg-log xfs 99G 9.3G 90G 10% /storage/log4. 长效治理与预防措施4.1 日志轮转策略优化编辑/etc/logrotate.d/vmware配置文件增加以下参数/storage/log/vmware/*.log { daily rotate 7 compress delaycompress missingok notifempty size 100M create 644 root root }应用新配置sudo logrotate -f /etc/logrotate.d/vmware4.2 监控方案配置在vSphere中创建自定义告警导航到监控→告警→定义新建触发器Datastore usage on diskstorage/log设置阈值警告(85%)紧急(95%)添加邮件通知动作4.3 容量规划建议根据环境规模推荐的日志分区基准主机规模建议日志分区保留周期备注50主机50GB30天基础监控需求50-200主机100GB45天中等审计要求200主机200GB60天需配合外部日志服务器5. 故障恢复与应急方案当遇到扩容失败时按以下步骤排查检查SCSI控制器类型lspci | grep -i scsiLSI Logic SAS控制器可能需要升级VM硬件版本验证内核是否识别新空间echo 1 /sys/class/scsi_device/4\:0\:0\:0/device/rescan手动扩展物理卷当autogrow.sh失效时sudo pvresize /dev/sdd sudo lvextend -L 90G /dev/log_vg/log sudo xfs_growfs /storage/log在最近一次为金融客户实施紧急扩容时我们发现当原始分区使用率超过98%时autogrow.sh可能会因临时文件创建失败而异常退出。这时需要先手动清理部分日志文件如/storage/log/vmware/vpxd-*.log确保至少有5%的剩余空间后再执行脚本。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2435118.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!