JVM 性能问题排查实战10连击

news2025/5/22 17:45:03

🗂️ 目录

  • 前言:理论掌握只是起点,定位能力才是核心
  • 全局排查模型:三步法
  • 1️⃣Full GC 频繁触发:老年代压力过大
  • 2️⃣ OOM 爆炸:元空间泄漏 or 缓存未清理
  • 3️⃣ CPU 飙升却不是 GC:线程阻塞或热方法失控
  • 4️⃣ Redis 连接池打满:小问题大代价
  • 5️⃣ 死锁诊断:必备 jstack 武器
  • 6️⃣ GC 抖动严重:年轻代设置不合理
  • 7️⃣ 堆外内存泄漏:被忽视的 DirectBuffer
  • 8️⃣ JIT 编译失效:小细节大瓶颈
  • 9️⃣ GC 长时间 STW:暂停时间不可控
  • 🔟 工具组合套件:不止是命令更是组合拳
  • 📌 实战总结:你该构建的不是记忆,而是体系
  • 🚀 下一篇预告:第九篇《JVM 即时编译机制详解》

前言:理论掌握只是起点,定位能力才是核心

如果说掌握 JVM 内存模型与 GC 原理是性能优化的“基础体能”,那么系统性地排查 JVM 性能瓶颈,才是真正能打硬仗的核心能力。
本文将结合真实项目中的排查场景,通过 10 个高频实战问题,帮你理清:

  • 问题出现的底层原理
  • 如何利用工具快速定位
  • 排查思路是否体系化
  • 如何规避同类问题再次发生

全局排查模型:三步法

JVM 层性能问题,一般可抽象为以下三步分析模型:

▶ 现象定位:是否是 GC / OOM / 卡顿 / 死锁 / CPU 异常
▶ 数据采集:jstat、jmap、jstack、GC 日志、Arthas 等
▶ 根因分析:内存泄漏?线程阻塞?资源未释放?配置不合理?

无论你面对的是线上事故,还是慢请求报警,这个三步法都能迅速组织你的思路。

性能问题 10 连击实战

1️⃣Full GC 频繁触发:老年代压力过大

现象:

  • 日志中频繁出现 Full GC 记录,STW 停顿显著。
  • 应用响应时间骤升。

排查方式:

  • jstat -gcutil PID 1000 5 查看 OU(Old Used)占比是否持续高位。
  • 分析 GC 日志,查看 Full GC 的触发频率与耗时。

常见原因:

  • 老年代对象过多,晋升频繁(可调大 -XX:SurvivorRatio)。
  • 内存回收不及时,内存泄漏或大对象直接进入老年代。

2️⃣ OOM 爆炸:元空间泄漏 or 缓存未清理

常见异常:

java.lang.OutOfMemoryError: Metaspace

java.lang.OutOfMemoryError: GC overhead limit exceeded

可能原因:

  • 类频繁加载却未卸载(典型于 SPI 或动态生成类场景,如 CGLIB)。
  • 缓存未设置过期时间,堆持续膨胀。

解决建议:

  • 增大元空间:-XX:MaxMetaspaceSize=256m。
  • 对动态类使用 WeakReference 或确保卸载条件。
  • 定期清理缓存(如 Guava Cache)。

3️⃣ CPU 飙升却不是 GC:线程阻塞或热方法失控

现象:

  • CPU 占用长期 100%,GC 日志无异常。

排查方式:

top -Hp <pid>       # 找出高 CPU 线程
jstack <pid>        # 查看线程栈

常见原因:

  • 死循环或大量计算(可定位热方法)。
  • 锁竞争过高,线程频繁阻塞。

4️⃣ Redis 连接池打满:小问题大代价

现象:

  • 应用响应超时,线程堆栈显示阻塞在 redis.getConnection()

原因剖析:

  • 连接池默认配置过小。
  • 未正确关闭连接,资源泄漏。

优化建议:

  • 增大连接池:maxTotalmaxIdle
  • 使用 try-with-resource 自动关闭连接。

5️⃣ 死锁诊断:必备 jstack 武器

jstack <pid> | grep -A20 "Found one Java-level deadlock"

死锁典型模式:

  • A 等 B 的锁,B 等 A 的锁。
  • Synchronized 和数据库锁混用场景最危险。

6️⃣ GC 抖动严重:年轻代设置不合理

现象:

  • Minor GC 频繁,每次暂停虽短,但整体 TPS 明显下降。

检查项:

  • eden 区域太小。
  • Survivor 区太小,导致频繁晋升。

调优建议:

  • -XX:NewRatio=2 控制新老年代比例。
  • -XX:SurvivorRatio=6 优化 Eden 与 Survivor 比例。

7️⃣ 堆外内存泄漏:被忽视的 DirectBuffer

典型异常:

java.lang.OutOfMemoryError: Direct buffer memory

常见原因:

  • Netty、NIO 分配了大量堆外内存,但未及时释放。

建议:

  • 调整堆外内存限制:-XX:MaxDirectMemorySize
  • 定期调用 System.gc() 强制回收(仅限测试)。

8️⃣ JIT 编译失效:小细节大瓶颈

现象:

  • 方法多次执行但未触发 JIT 编译。
  • 程序热启动后,性能没有提升。

诊断方式

-XX:+PrintCompilation

可能原因:

  • 方法体太大、递归调用、异常处理复杂等。

9️⃣ GC 长时间 STW:暂停时间不可控

典型表现:

  • 一次 GC 停顿达 5s~10s,甚至触发服务降级。

根因可能是:

  • CMS GC remark 阶段 STW。
  • G1 的 Mixed GC 调优不足。

建议:

  • 切换至 ZGC / Shenandoah 这类低暂停收集器。
  • 或通过 -XX:MaxGCPauseMillis 精细化配置。

🔟 工具组合套件:不止是命令更是组合拳

工具用途
jstat实时 GC 状态
jmap导出堆 dump、统计 histogram
jstack查看线程状态、死锁排查
Arthas在线诊断神器
MAT深度内存分析、泄漏跟踪

👉 实战建议:配合使用才最强大。诊断时不要只靠一个命令,要构建工具链与排查路径。

📌 实战总结:你该构建的不是记忆,而是体系

与其死记参数和现象,不如掌握背后的“排查模式”和“性能地图”:

  • 全局模型:资源 -> 配置 -> 行为 -> 报错。
  • 工具分工:实时监控、快照导出、代码热插拔。
  • 联动思维:GC 不一定是根因,可能是症状。

只要你构建出一套属于自己的排查体系,面对任何线上问题,都会更有底气。

🚀 下一篇预告:第九篇《JVM 即时编译机制详解》

下一篇我们将深入探讨 JVM 的 JIT 编译原理,包括 C1/C2 编译器、热点探测、逃逸分析以及生产环境如何诊断 JIT 编译引发的性能变化。

如果你觉得这篇文章对你有启发,欢迎 点赞👍、收藏⭐、关注✅,你的支持是我持续更新高质量 JVM 系列的最大动力!

如有实际问题,也欢迎评论区交流,我会持续整理典型问题加入专栏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2383284.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GUI实验

题目&#xff1a; 编程包含一个标签和一个按钮&#xff0c;单击按钮时&#xff0c;标签的内容在"你好"和"再见"之间切换。 分析&#xff1a; 导入所需的Java库&#xff1a;程序使用了 javax.swing 包中的一些类来创建图形用户界面。 创建一个 JFrame 对象…

量子计算 | 量子密码学的挑战和机遇

量子计算在密码学中的应用现主要体现在对现有加密算法的威胁上。最著名的例子是Shor算法&#xff0c;该算法能够在多项式时间内分解大整数&#xff0c;从而威胁到基于大数分解的加密算法&#xff0c;如RSA加密。此外&#xff0c;量子计算还可以加速某些类型的密码分析&#xff…

分享一些多模态文档解析思路

多模态文档解析思路小记 作者&#xff1a;Arlene 原文&#xff1a;https://zhuanlan.zhihu.com/p/1905635679293122466 多模态文档解析内容涉及&#xff1a;文本、表格和图片 解析思路v1 基于mineru框架对pdf文件进行初解析 其具备较完整的布局识别和内容识别&#xff0c;并将…

AI知识梳理——RAG、Agent、ReAct、LangChain、LangGraph、MCP、Function Calling、JSON-RPC

AI技术I AI技术II RAG &#x1f4cc; 高度凝练表达 RAG &#xff08;检索增强生成&#xff09;是一种结合信息检索与生成式人工智能的技术框架&#xff0c;旨在提升大型语言模型&#xff08;LLM&#xff09;的输出准确性和实用性。通过在生成响应前引入外部知识库的信息&#…

【实用教程】如何快速搭建一套私有的埋点系统?

这篇教程将基于开源项目-ClkLog&#xff0c;教大家快速搭建一套自有的埋点系统&#xff0c;从0开始完成数据采集、分析与展示&#xff0c;全流程掌控用户行为数据。 ClkLog是一款支持私有化部署的全开源用户行为数据采集与分析系统&#xff0c;兼容Web、App、小程序多端埋点&am…

深入解析 Uniswap:自动做市商模型的数学推导与智能合约架构

目录 1. 自动做市商&#xff08;AMM&#xff09;模型的数学推导1.1 恒定乘积公式推导1.2 价格影响与滑点 2. Uniswap 智能合约架构解析2.1 核心合约&#xff08;Core&#xff09;2.1.1 工厂合约&#xff08;Factory&#xff09;2.1.2 交易对合约&#xff08;Pair&#xff09; 2…

React 19版本refs也支持清理函数了。

文章目录 前言一、refs 支持清理函数二、案例演示1.useEffect写法2.React 19改进 的ref写法 总结 前言 React 19版本发布了ref支持清理函数了&#xff0c;这样就可以达到useEffect一样的效果了。为啥需要清理函数呢&#xff0c;这是因为节约内存。 清理事件监听&#xff08;避…

阿尔泰科技助力电厂——520为爱发电!

当城市的霓虹在暮色中亮起&#xff0c;当千万个家庭在温暖中共享天伦&#xff0c;总有一群默默的 "光明守护者" 在幕后坚守 —— 它们是为城市输送能量的电厂&#xff0c;更是以科技赋能电力行业的阿尔泰科技。值此 520 爱意满满的日子&#xff0c;阿尔泰科技用硬核技…

C#语法篇 :基类子类转换,成员变化情况

在C#中&#xff0c;会有从子类对象到基类对象的转换&#xff0c;这属于C#中的向上扩容&#xff0c;一般可以默认转换。 方法的转换 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks;namespace ex3._4 …

【漫话机器学习系列】264.内距(又称四分位差)Interquartile Range

深入理解内距&#xff08;Interquartile Range&#xff0c;IQR&#xff09;——数据分析中的异常值利器 在日常的数据分析中&#xff0c;我们经常需要识别和处理异常值&#xff08;Outliers&#xff09;&#xff0c;而内距&#xff08;Interquartile Range&#xff0c;简称 IQR…

海外盲盒系统开发:重构全球消费体验的科技引擎

当盲盒文化席卷全球&#xff0c;海外盲盒系统开发已成为重构消费体验的核心赛道。数据显示&#xff0c;2025年全球盲盒市场规模突破120亿&#xff0c;东南亚市场年增长率达4540。我们开发的海外盲盒系统&#xff0c;以技术创新为驱动&#xff0c;打造覆盖全链路的全球化解决方案…

高噪声下扩展边缘检测算子对检测边缘的影响

目录 一、常见的边缘检测算子 二、扩展边缘检测算子对检测边缘的影响 三、结论 一、常见的边缘检测算子 Sobel 算子: Prewitt算子;

vuejs处理后端返回数字类型精度丢失问题

标题问题描述 后端返回数据有5.00和3.30这种数据&#xff0c;但是前端展示的时候返回对应分别为5和3.0&#xff0c;小数点后0都丢失了。 接口返回数据展示network-Response&#xff1a; 接口返回数据展示network-Preview&#xff1a; 错误数据效果展示 发现问题 浏览器接口…

mysql数据库-中间件MyCat

1. MyCat简介 在整个 IT 系统架构中&#xff0c;数据库是非常重要&#xff0c;通常又是访问压力较大的一个服务&#xff0c;除了在程序开发的本身做优化&#xff0c;如&#xff1a; SQL 语句优化、代码优化&#xff0c;数据库的处理本身优化也是非常重要的。主从、热备、分表分…

手搓四人麻将程序

一、麻将牌的表示 在麻将游戏中&#xff0c;总共有一百四十四张牌&#xff0c;这些牌被分为多个类别&#xff0c;每个类别又包含了不同的牌型。具体来说&#xff0c;麻将牌主要包括序数牌、字牌和花牌三大类。序数牌中&#xff0c;包含有万子、条子和筒子&#xff0c;每种花色…

PotPlayer 安装 madVR、LAV Filters 以提升解码能力和视频音频效果

PotPlayer自带的解码器并不是最好&#xff0c;如下两张截图都是出自 TOP GUN: Maverick 较暗、灰蒙蒙的一张&#xff0c;是安装插件之前明亮的一张&#xff0c;是安装插件之后 详细安装参考 https://www.bilibili.com/video/BV1UV5qzuE74?spm_id_from333.788.videopod.sectio…

Kind方式部署k8s单节点集群并创建nginx服务对外访问

资源要求 请准备好doker环境&#xff0c;尽量用比较新的版本。我的docker环境如下 docker 环境&#xff1a; Docker version 20.10.21, build 20.10.21-0ubuntu1~18.04.3 安装kind kind表现上就是一个二进制程序&#xff0c;下载对应版本并增加执行权限即可&#xff1a; cu…

K个一组链表翻转

目录 1. 题意 2. 解题思路 3. 代码 1. 题意 给一个链表&#xff0c;按 k 进行翻转&#xff0c;也就是 k 2 &#xff0c;两两进行翻转&#xff0c;如果不够2则不动。 2. 解题思路 首先思考怎么翻转一个链表&#xff0c;反转链表&#xff1a;https://leetcode.cn/problems…

Python60日基础学习打卡D32

我们已经掌握了相当多的机器学习和python基础知识&#xff0c;现在面对一个全新的官方库&#xff0c;看看是否可以借助官方文档的写法了解其如何使用。 我们以pdpbox这个机器学习解释性库来介绍如何使用官方文档。 大多数 Python 库都会有官方文档&#xff0c;里面包含了函数…

面向恶劣条件的道路交通目标检测----大创自用(当然你也可以在里面学到很多东西)

全部内容梳理 目标检测的两个任务&#xff1a; 预测标签 边界框 语义分割 实力分割 一个是类别 一个是实例级别 分类任务把每个图像当作一张图片看待 所有解决方法是先生成候选区域 再进行分类 置信度&#xff1a; 包括对类别和边界框预测的自信程度 输出分类和IOU分数的…