parted实战扩容GPT大磁盘(避坑指南)
1. 线上服务器磁盘告急我为什么选择了parted那天下午监控告警突然响了提示线上服务器的根目录/使用率超过了95%。我心里咯噔一下赶紧连上去看。用df -h一查好家伙根分区/dev/sda2就剩几个G的空间了日志文件还在疯狂增长。这可不是闹着玩的服务随时可能因为写满磁盘而挂掉。我第一反应是去清理日志和临时文件但折腾了半天腾出来的空间还不够塞牙缝。看来扩容是唯一的选择了。这台服务器的数据盘/dev/sda总共有2.7TB当初分区时只给根目录划了280GB剩下的空间都还空着呢。按理说直接从空闲空间里划一块给根分区不就行了我一开始也是这么想的拿起熟悉的fdisk工具就准备开干。结果命令fdisk /dev/sda刚进去就给我泼了一盆冷水。它先是警告“Partition 1 does not start on physical sector boundary”这倒是个小问题不影响操作。但当我尝试创建新分区时它直接报错“No free sectors available”。我当时就懵了明明lsblk和fdisk -l都清清楚楚显示有将近2.4TB的未分配空间怎么到fdisk眼里就成了“没有空闲扇区”这就是我踩的第一个坑也是很多运维朋友都会遇到的经典问题。fdisk这个工具它有个先天限制它使用的是32位LBA逻辑块寻址来标识扇区。算下来最大只能寻址到2TB2^32 * 512字节扇区大小。我们的磁盘是2.7TB已经超出了它的管理范围。所以fdisk根本“看不见”2TB以后的那些空间自然就报错说没有空闲区域了。那怎么办这时候就该parted出场了。parted是一个更现代的分区工具它支持GPTGUID分区表格式而GPT格式可以管理远超2TB的磁盘理论上可达8ZB。我的磁盘恰好就是GPT格式的从fdisk -l输出里的Disk label type: gpt就能看出来。所以处理这种大容量磁盘的扩容parted是唯一正确的选择。接下来的实战我就带你用parted一步步把坑填平安全地给线上服务器扩容。2. 动手之前这些安全须知比操作本身更重要在服务器上动磁盘分区尤其是线上生产环境这无异于在给一个运行中的病人做心脏手术。数据无价一步错可能就意味着灾难。所以在敲下任何一个命令之前请务必把下面这些安全准则刻在脑子里。首要原则备份备份还是备份这不是老生常谈而是血泪教训。即使你只是扩容不涉及删除现有分区也存在操作失误或意外断电导致分区表损坏的风险。最稳妥的做法是如果条件允许给整块磁盘做一个完整的镜像备份。如果数据量太大至少也要备份分区表。可以用sfdisk或sgdisk来备份# 备份整个磁盘的分区表 sgdisk --backup/root/sda_partition_table.bak /dev/sda这个备份文件很小但关键时刻能救你的命。如果扩容过程中分区表损坏你可以用sgdisk --load-backup/root/sda_partition_table.bak /dev/sda快速恢复。其次务必确认磁盘格式和现有分区结构。盲目的操作是危险的。你需要清晰地知道磁盘标签类型是MBR也叫msdos还是GPT用fdisk -l /dev/sda看Disk label type那一行。现有分区详情每个分区的编号、起点、终点、文件系统类型。lsblk -f和parted /dev/sda print是两个很好的工具。空间布局空闲空间到底在哪里是在磁盘末尾还是在分区之间parted /dev/sda unit GB print free可以清晰地以GB为单位打印空闲空间。特别提醒在线扩容的“在线”是相对的。我们常说“在线扩容”指的是不需要重启服务器就能识别新分区。但是对于要扩容的根分区/dev/sda2本身如果你用的是传统的ext4文件系统并且想直接扩大它那么你仍然需要先卸载umount这个分区。对于根分区这显然意味着需要重启进入单用户模式或救援模式这其实就不是严格意义上的“在线”了。 更常见的“在线”方案也是我这次采用的方案是不直接扩展现有根分区而是在剩余空间里创建一个全新的分区比如/dev/sda4格式化后挂载到一个新目录如/bak。然后把一些非核心的、占用空间大的数据比如历史日志、应用缓存、上传文件迁移到这个新挂载点从而缓解根分区的压力。这种方式才是真正意义上的业务不中断。最后做好回滚预案。想清楚每一步如果失败了怎么办。例如创建新分区后格式化失败怎么办挂载失败怎么办把业务数据迁移到新目录后如果出现问题如何快速切回原路径把这些步骤和对应的回滚命令写在记事本里放在手边。记住在线上环境稳比快重要一万倍。3. 实战开始用parted探查磁盘与规划分区好了安全课讲完我们开始动手。首先我们需要对磁盘现状有一个全局的、精确的了解。登录服务器后我第一个命令是lsblk。这个命令很直观像一棵树一样展示了块设备之间的关系。NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT sda 8:0 0 2.7T 0 disk ├─sda1 8:1 0 1G 0 part /boot ├─sda2 8:2 0 280G 0 part / └─sda3 8:3 0 32G 0 part [SWAP]一目了然sda是2.7T的物理盘下面有三个分区。sda2是280G的根分区已经快满了。关键点是你看不到任何“未分配”的空间显示这是因为lsblk只显示已创建的分区。接下来用parted来查看更底层的信息特别是空闲空间。parted /dev/sda (parted) print free你会看到类似这样的输出Model: VMware Virtual disk (scsi) Disk /dev/sda: 2880GB Sector size (logical/physical): 512B/512B Partition Table: gpt Disk Flags: Number Start End Size File system Name 标志 1 1049kB 1075MB 1074MB xfs boot 2 1075MB 302GB 301GB xfs root 3 302GB 336GB 34.4GB linux-swap swap 336GB 2880GB 2544GB Free Space太棒了这下看清楚了。在sda3交换分区结束之后336GB处一直到磁盘末尾2880GB有整整2544GB的“Free Space”。这就是我们可以利用的宝地。规划分区方案我的目标是快速缓解根目录压力且不影响线上服务。所以方案很简单在这2544GB的空闲空间里划出一部分比如500GB创建一个新的主分区sda4用来存放那些可以迁移的数据。 为什么是500GB而不是全部我习惯留一些余量。一来一次性把所有空间都用掉以后想再调整就麻烦了二来如果未来有新的需求比如单独挂载一个给数据库的盘还有空间可用。当然如果你确定后续不会再有分区需求也可以把全部空闲空间划给新分区。记录关键参数在parted里分区的起点和终点可以用多种单位表示比如GB、MB、s扇区。为了精确我推荐使用扇区s或者百分比%。从上面输出可以看到空闲空间从336GB开始。我们需要记住这个值或者更精确地使用unit s print free查看扇区数。4. 核心操作使用parted创建新分区并格式化规划好了现在开始创建。我们继续在parted交互界面里操作。第一步创建新分区(parted) mkpart Partition name? []? data # 给分区起个名字比如叫data可选 File system type? [ext2]? xfs # 文件系统类型我选xfs根据你的系统来 Start? 336GB # 起始位置就是刚才看到的空闲空间起点 End? 836GB # 结束位置336500836GB敲下回车后parted会提示你确认。仔细核对起始和结束位置确保没有覆盖到现有的sda3分区。确认无误后输入Yes。创建完成后输入print再看一下应该能看到一个新的分区编号是4类型是primary文件系统显示为xfs注意这里parted显示的只是“标签”真正的格式化要在后面做。第二步退出parted并让系统识别新分区输入quit退出parted。这时候Linux内核可能还没有立即识别出这个新的分区表。我们需要通知内核重新读取分区表。对于/dev/sda这个磁盘使用partprobe命令partprobe /dev/sda如果partprobe不可用也可以使用echo命令向sysfs触发重载echo 1 /sys/block/sda/device/rescan或者最“暴力”但绝对有效的一招重启服务器。当然对于线上环境我们尽量不重启前两种软件方式在绝大多数情况下都有效。执行后再用lsblk看看是不是出现了/dev/sda4第三步格式化新分区分区有了现在它还是一块“ raw”的磁盘空间需要装上文件系统才能存数据。我选择xfs因为它是CentOS 7的默认文件系统性能不错特别是处理大文件。mkfs.xfs /dev/sda4这个命令会跑一会儿。完成后可以用blkid /dev/sda4来查看这个新分区的UUID和文件系统类型确认格式化成功。这里有个大坑需要注意对齐Alignment现代磁盘尤其是SSD和高级格式化的HDD有“物理扇区大小”和“逻辑扇区大小”的概念。如果分区起始位置没有对齐到物理扇区的边界会导致读写性能严重下降这就是所谓的“对齐陷阱”。幸运的是parted在创建分区时如果你输入的起点不是最佳位置它会自动帮你调整到最近的对齐边界通常是1MiB处。所以在上面的mkpart命令中即使你输入336GB它实际可能会从336.1GB开始这是为了性能优化是好事不用担心空间浪费了一点。5. 挂载与迁移让新分区真正发挥作用分区格式化好了现在要把它用起来。我们的目标是把它挂载到一个目录然后把根目录下一些占地方的非核心数据挪过去。第一步创建挂载点并临时挂载我选择在根目录下创建一个/bak目录作为挂载点。名字随意/data、/storage都可以。mkdir /bak mount /dev/sda4 /bak挂载成功后用df -h检查一下应该能看到/dev/sda4挂载到了/bak并且有大约500GB的可用空间。第二步配置开机自动挂载至关重要上面的mount命令只是临时生效服务器一重启就没了。我们必须把它写入/etc/fstab文件才能实现开机自动挂载。 首先获取新分区的UUID这比用设备名/dev/sda4更稳定因为设备名可能会变。blkid /dev/sda4输出类似/dev/sda4: UUIDa1b2c3d4-e5f6-7890-g1h2-i3j4k5l6m7n8 TYPExfs然后编辑/etc/fstab文件vim /etc/fstab在文件末尾添加一行UUIDa1b2c3d4-e5f6-7890-g1h2-i3j4k5l6m7n8 /bak xfs defaults 0 0注意添加完后务必、务必、务必执行以下命令测试一下配置是否正确mount -a这条命令会尝试挂载/etc/fstab中所有未挂载的文件系统。如果执行没有报错并且df -h能看到/bak依然挂载着或者重新挂载上了那就说明配置正确。如果mount -a报错千万不要重启服务器否则可能因为挂载失败而无法正常启动。必须把/etc/fstab里的错误修正后才能重启。第三步迁移数据谨慎操作现在你可以开始把数据从根分区挪到/bak了。例如迁移/var/log下的老旧日志# 先打包压缩旧日志 tar -czf /bak/old_logs_$(date %Y%m%d).tar.gz /var/log/*.log # 确认压缩包没问题后清空原日志文件注意有些服务可能需要重启才能继续写日志 find /var/log -name *.log -type f -exec truncate -s 0 {} \;或者迁移某个应用的上传目录# 假设应用上传目录是 /home/app/uploads cp -rp /home/app/uploads/* /bak/uploads/ # 确认复制无误后将原目录重命名备份并创建一个指向新位置的软链接 mv /home/app/uploads /home/app/uploads.bak ln -s /bak/uploads /home/app/uploads数据迁移的黄金法则先复制再删除。永远不要直接mv先用cp -a或cp -rp保留所有属性复制过去。验证数据一致性。复制后用diff或md5sum抽查几个文件确保复制过程无误。做好备份和回退准备。在删除或移动原数据前确保你有办法快速回退。比如上面的软链接方式回退时只需要删除软链接把.bak目录改回来就行。注意服务依赖。迁移正在被进程打开的文件比如数据库文件是极其危险的需要先停止相关服务。对于日志目录有些服务可能不需要重启但有些需要。完成这些步骤后你的根分区/应该就“瘦身”成功了告警可以解除了。整个过程中除了最后迁移数据时可能涉及个别服务重启如日志服务Web应用、数据库等核心服务全程无需中断实现了真正的“在线”扩容减压。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2409112.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!