Ubuntu系统资源监控实战:从命令行到图形化工具全解析
1. 为什么需要监控Ubuntu系统资源刚装好的Ubuntu系统跑得飞快用着用着突然发现电脑变卡了浏览器开多几个标签页就开始转圈这种情况我遇到过太多次了。后来才发现很多时候是因为某个程序偷偷吃掉了大量CPU或内存资源。学会监控系统资源就像给电脑装了个健康监测仪随时掌握系统运行状态。系统资源监控主要关注四大指标CPU使用率、内存占用、磁盘I/O和网络流量。CPU使用率过高会导致系统响应变慢内存不足会触发频繁的磁盘交换磁盘I/O瓶颈会影响程序加载速度网络流量异常可能意味着后台有未知的数据传输。通过实时监控这些指标我们可以快速定位导致系统变慢的罪魁祸首发现异常进程比如挖矿病毒合理规划硬件升级比如是否需要加内存优化程序性能识别资源消耗大的代码在服务器环境下资源监控更是运维人员的必备技能。我曾经管理过一台Web服务器通过持续监控发现MySQL服务内存泄漏及时处理避免了服务中断。接下来我会详细介绍Ubuntu下各种监控工具的使用技巧。2. 命令行三剑客top/htop/atop2.1 老当益壮的top命令打开终端输入top你会看到一个动态刷新的界面。别看它界面简陋信息量可不小。顶部5行显示系统整体状态top - 14:30:45 up 2 days, 3:21, 2 users, load average: 0.15, 0.10, 0.05 Tasks: 215 total, 1 running, 214 sleeping, 0 stopped, 0 zombie %Cpu(s): 5.3 us, 1.2 sy, 0.0 ni, 93.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st MiB Mem : 7824.4 total, 1024.2 free, 4096.3 used, 2703.9 buff/cache MiB Swap: 2048.0 total, 2048.0 free, 0.0 used. 3402.1 avail Mem这里有几个关键指标需要关注load average三个数字分别代表1分钟、5分钟、15分钟的系统平均负载。这个值超过CPU核心数就说明系统过载%Cpu(s)us表示用户空间占用sy表示内核空间占用id表示空闲比例。如果id经常低于20%就该考虑升级CPU了Mem重点看available内存这个值才代表真正可用的内存量在top界面中按这些键可以交互操作M按内存使用排序P按CPU使用排序k结束指定PID的进程q退出top2.2 颜值担当htop如果觉得top太简陋可以试试它的升级版htop。安装命令sudo apt install htop htophtop的优势非常明显彩色界面更直观支持鼠标操作树状显示进程关系可以批量操作进程我特别喜欢它的CPU使用率条形图不同核心的使用情况一目了然。按F2进入设置菜单还能自定义显示列。比如我通常会添加IO读写列方便发现磁盘IO高的进程。2.3 全能选手atopatop是更专业的监控工具记录历史数据是它的独门绝技。安装sudo apt install atop sudo systemctl enable --now atopatop会定期记录系统状态默认10分钟一次可以用atop -r回放历史数据。这对排查间歇性性能问题特别有用。比如上周三下午系统突然变慢用atop -r -l 14:00 16:00就能查看那个时间段的系统状态。atop界面中按d显示磁盘详情n显示网络详情m显示内存详情。它的磁盘监控特别强大能精确到每个进程的读写量。3. 内存监控专项工具3.1 free命令详解free命令是查看内存使用的最直接方式。建议加上-h参数人类可读格式和-w参数分开显示buffers和cachefree -hw输出示例total used free shared buffers cache available Mem: 7.7G 3.2G 1.1G 123M 345M 3.0G 4.0G Swap: 2.0G 0.0G 2.0G这里最容易误解的是available列它表示系统当前可用的内存量包括未被使用的内存和可回收的缓存。当available接近0时系统就会开始使用swap性能会明显下降。3.2 /proc/meminfo的秘密free命令的数据其实来自/proc/meminfo直接查看这个文件能获取更详细的信息cat /proc/meminfo这里有几个关键指标MemTotal物理内存总量MemAvailable可用内存估算值SwapCached被缓存使用的swap空间Active/Inactive活跃/非活跃内存页我经常用这个命令检查内存泄漏watch -n 1 cat /proc/meminfo | grep -E MemTotal|MemFree|Buffers|Cached|SwapTotal|SwapFree4. CPU监控深度解析4.1 mpstat多核监控mpstat是sysstat工具包的一部分能显示每个CPU核心的详细使用情况。首先安装sudo apt install sysstat查看所有CPU核心的使用率1秒刷新共5次mpstat -P ALL 1 5输出示例CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle all 5.32 0.00 1.25 0.12 0.00 0.06 0.00 0.00 0.00 93.25 0 7.12 0.00 1.56 0.12 0.00 0.12 0.00 0.00 0.00 91.08 1 3.52 0.00 0.94 0.12 0.00 0.00 0.00 0.00 0.00 95.42重点关注%iowaitCPU等待IO的时间占比持续高于5%说明磁盘是瓶颈%idleCPU空闲率所有核心都低于20%就该考虑升级了4.2 性能分析神器perfperf是Linux内核自带的性能分析工具可以定位函数级的热点sudo apt install linux-tools-common linux-tools-generic perf top这个命令会实时显示消耗CPU最多的函数对性能调优特别有用。比如我发现一个Python程序跑得慢用perf top发现大部分时间花在字符串处理上优化后性能提升了3倍。5. 图形化监控工具5.1 Gnome系统监视器Ubuntu自带的图形化工具在应用菜单搜索System Monitor就能打开。它分为三个标签页进程类似任务管理器可以结束进程或调整优先级资源直观的CPU、内存、网络历史图表文件系统磁盘空间使用情况我推荐在资源标签页开启绘制平滑图形这样能更清晰地观察趋势变化。不过它的功能比较基础适合临时查看用。5.2 Conky桌面监控Conky是高度可定制的桌面监控工具安装配置稍复杂sudo apt install conky-all cp /etc/conky/conky.conf ~/.conkyrc conky默认配置比较简陋我推荐从GitHub找现成的主题。比如这个星空主题wget https://raw.githubusercontent.com/brndnmtthws/conky/master/data/configs/conky.conf -O ~/.conkyrc配置Conky需要编辑~/.conkyrc文件常见的监控项包括CPU温度${hwmon 0 temp 1}°C网速${downspeed eth0} / ${upspeed eth0}磁盘IO${diskio_write /dev/sda} / ${diskio_read /dev/sda}5.3 状态栏指示器想要随时查看系统状态又不占地方可以安装这些状态栏工具indicator-sysmonitorsudo add-apt-repository ppa:fossfreedom/indicator-sysmonitor sudo apt update sudo apt install indicator-sysmonitor启动后右键点击状态栏图标选择Preferences进行配置。我常用的显示格式CPU: {cpu}% | MEM: {mem}% | {net}indicator-multiloadsudo apt install indicator-multiload这个工具会在状态栏显示迷你曲线图鼠标悬停能看到具体数值。6. 网络监控专项6.1 实时流量监控iftopiftop可以像top一样实时显示网络流量sudo apt install iftop sudo iftop -i eth0界面分为三部分顶部流量刻度尺中部当前连接及流量表示发送表示接收底部统计信息峰值速率、累计流量等按t可以切换显示模式p暂停刷新q退出。我发现它特别适合排查异常网络连接比如发现某个IP持续大量上传数据可能就是木马在作怪。6.2 全能网络监控nethogs如果想看每个进程的网络流量可以用nethogssudo apt install nethogs sudo nethogs eth0输出示例PID USER PROGRAM DEV SENT RECEIVED 1234 root /usr/bin/python3 eth0 12.3KB 45.6KB 5678 alice firefox eth0 5.2MB 1.3MB按m可以在KB/s、KB、B等不同单位间切换。我曾经用它发现一个异常进程在不断连接境外IP及时处理避免了数据泄露。7. 磁盘I/O监控方案7.1 iostat磁盘负载分析iostat是分析磁盘性能的利器属于sysstat包iostat -x 1关键指标解读%util设备利用率接近100%说明磁盘饱和awaitIO平均等待时间(ms)超过10就要注意svctmIO平均服务时间(ms)我常用的组合命令watch -n 1 iostat -xmdz 1 1 | grep -v ^$ | tail -n 47.2 iotop进程级IO监控iotop可以像top一样显示进程的IO使用情况sudo apt install iotop sudo iotop按o只显示有IO活动的进程a切换累计/实时模式。它的输出非常直观Total DISK READ: 1.2 MB/s | Total DISK WRITE: 0.8 MB/s PID PRIO USER DISK READ DISK WRITE SWAPIN IO COMMAND 1234 be/4 root 1.2 MB/s 0.0 KB/s 0.0 % 5.2 % [jbd2/sda1-8] 5678 be/4 mysql 0.0 KB/s 0.8 MB/s 0.0 % 3.1 % mysqld曾经有个服务器磁盘IO异常用iotop发现是MySQL在疯狂写临时文件优化查询后问题解决。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2468667.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!