【Linux系列】目录大小查看

news2025/5/9 12:57:40

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
img

  • 推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老
  • 导航
    • 檀越剑指大厂系列:全面总结 java 核心技术,jvm,并发编程 redis,kafka,Spring,微服务等
    • 常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,typora 等
    • 数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等
    • 新空间代码工作室:提供各种软件服务,承接各种毕业设计,毕业论文等
    • 懒人运维系列:总结好用的命令,解放双手不香吗?能用一个命令完成绝不用两个操作
    • 数据结构与算法系列:总结数据结构和算法,不同类型针对性训练,提升编程思维,剑指大厂

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。💝💝💝 ✨✨ 欢迎订阅本专栏 ✨✨

博客目录

    • 一、`du` 命令基础
      • 基本语法
      • 为什么需要 `-h` 选项?
    • 二、`du -h` 命令详解
      • 输出解读
      • 常用选项组合
    • 三、`du` 与其他命令的对比
      • `du` vs `df`
      • `du` vs `ls -l`
    • 四、实际应用场景
      • 1. 查找大目录
      • 2. 监控用户磁盘使用
      • 3. 排除特定目录
      • 4. 比较目录变化
    • 五、高级技巧与注意事项
      • 1. 处理符号链接
      • 2. 显示修改时间
      • 3. 性能优化
      • 4. 跨文件系统统计
    • 六、常见问题解答

在 Linux 系统管理和日常维护中,了解文件和目录占用磁盘空间的情况是一项基本而重要的任务。du(Disk Usage)命令是完成这一任务的强大工具,而 du -h 则是其中最常用的命令形式之一。

一、du 命令基础

du(Disk Usage)命令是 Linux/Unix 系统中用于估算文件和目录磁盘使用情况的实用程序。它通过递归遍历目录结构,计算每个文件和子目录占用的磁盘空间,并以块为单位(默认情况下)显示结果。

基本语法

du [选项] [文件或目录]

如果不指定文件或目录,du 会默认统计当前目录及其所有子目录的磁盘使用情况。

为什么需要 -h 选项?

原始的 du 命令输出以磁盘块为单位(通常 1 块=512 字节或 1KB),这种表示方式对人类阅读不够友好。例如:

du data

可能输出:

123456  data/subdir1
789012  data/subdir2
912468  data

这样的数字难以直观理解。-h(human-readable)选项的出现解决了这个问题,它会自动选择最合适的单位(KB、MB、GB 或 TB)来显示大小:

du -h data

输出变为:

4.0K    data/subdir1
8.2M    data/subdir2
1.2G    data

在这里插入图片描述

二、du -h 命令详解

输出解读

du -h 的典型输出包含多行信息:

  1. 子目录行:显示每个子目录的大小和路径
  2. 总计行(最后一行):显示指定目录的总大小

例如:

4.0K    data/subdir1
8.2M    data/subdir2
1.2G    data

这里:

  • data/subdir1 占用 4.0KB
  • data/subdir2 占用 8.2MB
  • 整个 data 目录占用 1.2GB

常用选项组合

  1. -s(汇总):仅显示总大小,不显示子目录详情

    du -sh data
    

    输出:

    1.2G    data
    
  2. -c(总计):在最后添加一个总计行

    du -hc data
    

    输出:

    4.0K    data/subdir1
    8.2M    data/subdir2
    1.2G    data
    1.2G    总用量
    
  3. --max-depth=N:控制显示的目录深度

    du -h --max-depth=1 data
    

    只显示 data 下第一级子目录的大小

三、du 与其他命令的对比

du vs df

  • du(Disk Usage):从文件系统角度计算文件和目录占用的空间
  • df(Disk Free):显示文件系统的整体磁盘使用情况

du 更适合查找具体目录或文件占用的空间,而 df 更适合查看整个磁盘或分区的使用情况。

du vs ls -l

  • ls -l 显示的是文件的实际大小(逻辑大小)
  • du 显示的是文件占用的磁盘空间(可能因块分配而大于实际大小)

例如,一个 1 字节的文件:

  • ls -l 显示 1 字节
  • du 可能显示 4KB(取决于文件系统的块大小)

四、实际应用场景

1. 查找大目录

du -h / | sort -rh | head -n 20

这条命令组合:

  1. 从根目录开始计算所有目录大小
  2. 按人类可读格式输出
  3. 按大小逆序排序
  4. 显示前 20 个最大的目录

2. 监控用户磁盘使用

du -sh /home/*

快速查看所有用户主目录的磁盘使用情况。

3. 排除特定目录

du -h --exclude='*.log' /var

统计 /var 目录大小,但排除所有 .log 文件。

4. 比较目录变化

du -sh data
# 进行一些操作后
du -sh data

通过两次执行比较目录大小的变化。

五、高级技巧与注意事项

1. 处理符号链接

默认情况下,du 会统计符号链接指向的文件大小。使用 -L 选项可以跟随符号链接:

du -Lh /path

2. 显示修改时间

结合 --time 选项可以显示最后修改时间:

du -h --time data

3. 性能优化

对于大型文件系统,du 可能需要较长时间。可以:

  1. 使用 --apparent-size 显示表观大小而非磁盘使用量(更快但不够准确)
  2. 限制目录深度 --max-depth
  3. 在非高峰时段运行

4. 跨文件系统统计

默认 du 会统计挂载点下的其他文件系统。使用 -x 可以限制在当前文件系统:

du -xh /

六、常见问题解答

Q1:为什么 dudf 显示的总空间不一致?

A1:可能原因包括:

  • 已删除但仍有进程打开的文件
  • 文件系统保留空间
  • 不同的统计方法(df 统计整个文件系统,du 统计具体文件)

Q2:如何统计目录中的文件数量而非大小?

A2:使用 findwc

find data -type f | wc -l

Q3:du 显示的 size 为什么比实际文件总和要大?

A3:du 统计的是磁盘使用量,包括:

  • 文件实际内容
  • 文件系统元数据
  • 由于块分配导致的额外空间

觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍

🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2371479.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2048游戏(含Python源码)

前言 相关参考游戏: 像素飞机大战(含Python源码)-CSDN博客https://blog.csdn.net/weixin_64066303/article/details/147693018?spm1001.2014.3001.5501使用DeepSeek定制Python小游戏——以“俄罗斯方块”为例-CSDN博客https://blog.csdn.n…

中间件-RocketMQ

RocketMQ 基本架构消息模型消费者消费消息模式顺序消息机制延迟消息批量消息事务消息消息重试最佳实践 基本架构 nameServer: 维护broker列表信息,客户端连接时只需要连接nameServer。可配置成集群。 broker:broker分为master和slave,master负…

Python就业方向有哪些?

Python 作为一门通用、易学且功能强大的编程语言,在多个领域都有广泛的应用,因此就业方向也非常多样化。以下是 Python 主要的就业方向及相关技能要求。 1. Web 开发 岗位:Python Web 开发工程师、后端工程师、全栈工程师技术栈&#xff1a…

iptables 访问控制列表使用记录

iptables 是linux操作系统上自带的防火墙程序,功能强大,能够依据策略过滤掉一些恶意访问流量,本次记录一下iptables的常见使用方法,未尽之处,欢迎补充。 一、iptables 下载 我这里使用的是华为openEuler 22.03版本&am…

16. Qt系统相关:事件、定时器

1. Qt事件 1.1 简介 事件是应用程序内部或者外部产生的事情或者动作的统称。在Qt中使用一个对象来表示一个事件。所有的Qt事件均继承于抽象类QEvent。事件是由系统或者Qt平台本身在不同的时刻发出的。当用户按下鼠标、敲下键盘,或者是窗口需要重新绘制的时候&#…

云平台搭建

物联网云平台的基本概述 基本概念 随着物联网技术的快速发展,越来越多的设备需要接入网络以实现智能化功能,物联网平台应运而生。 物联网云平台(IoT Cloud Platform)是物联网生态系统中的核心组件,它通过提供一系列…

数学实验(Matlab语言环境和线性代数实验)

一、Matlab语言环境和线性代数实验 1.Matlab语言环境 Matlab简介 Matlab:Matrix Laboratry 矩阵实验室 Matlab 提供了强大的科学计算、灵活的程序设计流程、高质量的图形可视化与界面设计等功能,被广泛应用于科学计算、控制系统、信息处理等领域的分…

Elasticsearch 中的索引模板:如何使用可组合模板

作者:来自 Elastic Kofi Bartlett 探索可组合模板以及如何创建它们。 更多阅读: Elasticsearch:可组合的 Index templates - 7.8 版本之后 想获得 Elastic 认证吗?查看下一期 Elasticsearch Engineer 培训的时间! El…

【LeetCode 42】接雨水(单调栈、DP、双指针)

题面: 思路: 能接雨水的点,必然是比两边都低(小)的点。有两种思路,一种是直接计算每个点的最大贡献(也就是每个点在纵向上最多能接多少水),另一种就是计算每个点在横向上…

【JS逆向基础】前端基础-HTML与CSS

1,flask框架 以下是一个使用flask框架写成的serve程序 # noinspection PyUnresolvedReferences #Flash框架的基本内容from flask import Flask app Flask(__name__)app.route(/index) def index():return "hello index"app.route(/login) def login():re…

手机网页提示ip被拉黑名单什么意思?怎么办

‌当您使用手机浏览网页时,突然看到“您的IP地址已被列入黑名单”的提示,是否感到困惑和不安?这种情况在现代网络生活中并不罕见,但确实会给用户带来诸多不便。本文将详细解释IP被拉黑的含义、常见原因,并提供一系列实…

CCF编程能力等级认证 一级 第一次课

介绍 CCF 编程能力等级认证(GESP)为青少年计算机和编程学习者提供学业能力验证的规则和平台,由中国计算机学会发起并主办。 每年考试分四次,时间是每年的3月、6月、9月、12月,以当年每期公布的时间为准。 GESP适用年…

SpringBoot 讯飞星火AI WebFlux流式接口返回 异步返回 对接AI大模型 人工智能接口返回

介绍 用于构建基于 WebFlux 的响应式 Web 应用程序。集成了 Spring WebFlux 模块,支持响应式编程模型,构建非阻塞、异步的 Web 应用。WebFlux 使用了非阻塞的异步模型,能够更好地处理高并发请求。适合需要实时数据推送的应用场景。 WebClie…

Python爬虫中time.sleep()与动态加载的配合使用

一、动态加载网页的挑战 动态加载网页是指网页的内容并非一次性加载完成,而是通过JavaScript等技术在用户交互或页面加载过程中逐步加载。这种设计虽然提升了用户体验,但对于爬虫来说,却增加了抓取的难度。传统的爬虫方法,如简单…

AtCoder Beginner Contest 404 A-E 题解

还是ABC好打~比ARC好打多了&#xff08; 题解部分 A - Not Found 给定你一个长度最大25的字符串&#xff0c;任意输出一个未出现过的小写字母 签到题&#xff0c;map或者数组下标查询一下就好 #include<bits/stdc.h>using namespace std;#define int long long #def…

【mysql】常用命令

一 系统mysql用户密码查询 1、在工程目录如/usr/local/httpd/下的*.php中查找类似有db.inf的文件 以php为例。 2、在代码文件中确认有数据库连接的的功能实现 例如&#xff1a; $dbconf parse_ini_file(/usr/local/httpd/conf/db.inf); $link mysql_connect($dbconf[d…

macOS Arduino IDE离线安装ESP8266支持包

其实吧&#xff0c;本来用platformio也是可以的&#xff0c;不过有时候用Arduino IDE可能更快一些&#xff0c;因为以前一直是Arduino.app和Arduino IDE.app共存了一段时间&#xff0c;后来下决心删掉Arduino.app并升级到最新的Arduino IDE.app。删除了旧的支持板级支持包之后就…

网络靶场基础知识

一、网络靶场的核心概念 网络靶场&#xff08;Cyber Range&#xff09;是一种基于虚拟化和仿真技术的网络安全训练与测试平台&#xff0c;通过模拟真实网络环境和业务场景&#xff0c;为攻防演练、漏洞验证、安全测试和人才培养提供安全可控的实验空间。其核心目标是通过“虚实…

Python项目源码57:数据格式转换工具1.0(csv+json+excel+sqlite3)

1.智能路径处理&#xff1a;自动识别并修正文件扩展名&#xff0c;根据转换类型自动建议目标路径&#xff0c;实时路径格式验证&#xff0c;自动补全缺失的文件扩展名。 2.增强型预览功能&#xff1a;使用pandastable库实现表格预览&#xff0c;第三方模块自己安装一下&#x…

雷赛伺服电机

ACM0经济 编码器17位&#xff1a; ACM1基本 编码器23位磁编&#xff0c; ACM2通用 编码器24位光电&#xff0c; 插头定义&#xff1a;