10.JVM-垃圾回收器
Serial 与 Serial Old核心特征单线程、Stop The World (STW)。工作机制它们在进行垃圾回收时必须暂停所有其他的工作线程直到它收集结束。Serial新生代采用标记-复制算法。Serial Old老年代采用标记-整理算法。面试考点现在还有人用吗答案有。它依然是 HotSpot 虚拟机运行在客户端模式Client下的默认新生代收集器。因为对于内存只有几百兆的桌面应用单线程没有线程切换开销STW 时间也就几十毫秒完全可以接受。执行流程触发 GC当新生代 Eden 区空间不足时触发 Minor GC。触发 STWJVM 挂起所有用户线程进入安全点Safepoint。单线程执行由唯一一条 GC 线程完成扫描、标记、复制/整理以及清理动作。恢复运行垃圾清理完成用户线程继续执行。优势尽管 Serial 收集器看似过时但在特定场景下依然具有不可替代的优势简单高效它是所有收集器中额外内存消耗Memory Footprint最小的。单核性能极佳由于没有线程交互同步、切换的开销专心做垃圾收集在单 CPU 环境下效率最高。轻量级在微服务容器化场景下如果分配的 CPU 核心数较少如 1 核Serial的表现往往优于多线程收集器。劣势停顿时间不可控随着堆内存的增大单线程收集的耗时线性增长会导致明显的应用卡顿。无法利用多核在多核 CPU 环境下无法发挥硬件并行计算的能力。适用场景客户端模式Client ModeJava 应用在桌面端运行时内存占用通常不大Serial 是默认的新生代收集器。单核 CPU 环境在资源受限的硬件或极小规格的容器如 1 Core / 1GB RAM中Serial是最佳选择。嵌入式设备对内存敏感且主频较低的嵌入式 JVM 环境。Parallel Scavenge 与 Parallel OldParallel Scavenge基本定义一种运行在新生代、采用标记-复制算法的多线程并行收集器。核心目标达到一个可控制的吞吐量。吞吐量公式吞吐量 \frac{运行用户代码时间}{运行用户代码时间 垃圾收集时间}与 ParNew 的区别ParNew 的主要目的是为了配合 CMS 收集器关注点在于低延迟。Parallel Scavenge 的关注点在于高效利用 CPU 资源尽快完成程序的运算任务。Parallel Old基本定义Parallel Scavenge 收集器的老年代版本采用标记-整理算法的多线程并行收集器。历史背景在 JDK 1.6 之前Parallel Scavenge 只能与单线程的 Serial Old配合导致整体吞吐量受限于老年代。Parallel Old 的引入补齐了“吞吐量优先”收集器组的最后一块短板。执行逻辑在进行老年代收集时多个 GC 线程并发执行标记和整理动作显著缩短了 Full GC 的停顿时间。核心特性自适应调节策略这是 Parallel Scavenge 收集器区别于其他收集器的一个重要特征。参数-XX:UseAdaptiveSizePolicy工作原理激活后无需手动指定新生代大小-Xmn、Eden 与 Survivor的比例-XX:SurvivorRatio以及晋升老年代对象年龄-XX:MaxTenuringThreshold等细节。动态优化JVM会根据当前系统的运行情况收集性能监控信息动态调整这些参数以提供最合适的停顿时间或最大的吞吐量。、执行模式全暂停并行STW 机制在进行 GC 时依然会触发 Stop The World。并行化与 Serial 收集器的单线程 STW 不同Parallel 组合利用多个 CPU核心同时进行垃圾清理大幅提高了单位时间内的处理能力。适用场景后台运算任务如大批量数据处理、科学计算、离线报表生成等。非交互式应用用户对单次 GC 造成的几百毫秒停顿不敏感但要求程序整体运行速度最快。多核服务器能够充分利用硬件资源实现高效率。CMS它的出现是为了解决老年代长时间 STW 的痛点。核心特征多线程并发收集、追求最短回收停顿时间。工作机制作用于老年代基于标记-清除算法。运作四大步骤初始标记 (Initial Mark) —— STW动作只标记那些与 GC Roots 直接相连的对象。耗时非常短因为只看第一层关系。感受用户线程停了一下但瞬间就恢复了。并发标记 (Concurrent Mark) —— 与用户线程并发动作从初始标记的对象开始沿着引用链往下遍历Trace。核心点这时候用户程序还在跑代价这个阶段最耗时但因为它和程序一起跑所以用户感知不到停顿。重新标记 (Remark) —— STW动作修补在“并发标记”期间因为用户程序运行而导致变动的对象引用关系。为什么需要在并发标记用户在改变引用。你得停下来STW最后确认一下那些变动的“垃圾”到底收不收。耗时比初始标记长但比并发标记短得多。并发清除 (Concurrent Sweep) —— 与用户线程并发动作清理掉标记好的垃圾对象。核心点这时候用户程序还在跑 不需要 STW。致命缺陷面试必问内存碎片因为是标记-清除算法老年代会产生大量空间碎片。大对象分配不下时会引发极其耗时的 Full GC。浮动垃圾并发清除阶段产生的垃圾只能等下次收需要预留内存空间。并发失败预留内存不足以支撑用户线程继续分配时会退化为单线程的 Serial Old停顿时间爆炸。三色标记法三种颜色的定义在标记过程中每个对象会根据“扫描进度”被涂成三种颜色之一白色 (White)定义还没被扫描到的对象。状态在标记开始前所有对象都是白色。如果标记结束后还是白色说明不可达就是垃圾。灰色 (Gray)定义对象已经被扫描过但它引用的对象还没扫完。状态它是“正在传染”的中间状态会被放进一个队列里等待继续扫描。黑色 (Black)定义对象已经被扫描过且它引用的所有对象也全部扫完了。状态它是“绝对安全”的存活对象。黑色对象不会再次被扫描也不会直接指向白色对象在正常扫描结束时。标准扫描流程正常情况初始状态所有对象都是白色。初始标记从 GC Roots 直接引用的对象出发把它们涂成灰色。并发标记从灰色对象集合中取出一个对象将其涂成黑色。遍历这个对象引用的所有对象把它们涂成灰色。重复直到灰色对象集合为空。清理剩下的白色对象即为垃圾直接回收。并发标记的“致命问题”漏标如果只有 GC线程在跑三色标记很完美。但在并发阶段用户线程也在跑它可能会修改对象的引用关系导致严重的后果把活的对象当成垃圾删了。漏标对象丢失发生的两个必要条件赋值动作一个黑色对象突然指向了一个白色对象比如black.field white。断开动作原本指向该白色对象的灰色对象断开了与它的引用比如gray.field null。结果这个白色对象明明还被黑色对象引用着它是活的但因为黑色对象已经扫完了不会再回头看而灰色对象也断开了没法带路去扫它。这个白色对象就“消失”在视野里最后被误删。解决方案写屏障为了解决漏标JVM 引入了写屏障Write Barrier。写屏障就是在执行“引用赋值”这一行代码的前后自动插入一小段逻辑。CMS 和 G1 选择了不同的解决策略增量更新 (Incremental Update) —— CMS 的选择核心思想破坏条件 1黑色指向白色。做法只要黑色对象插入了指向白色对象的引用写屏障就记录下这个操作。逻辑在 Remark重新标记阶段JVM 会把这些黑色对象重新变回灰色再扫一遍。原始快照 (Snapshot At The Beginning, SATB) —— G1 的选择核心思想破坏条件 2灰色断开白色。做法当灰色对象准备断开指向白色对象的引用时写屏障会记录下这个旧引用。逻辑在标记结束时JVM会以这些旧引用为准依然认为那个白色对象是活的。G1 (Garbage First) (JDK 9 默认)G1 (Garbage-First) 垃圾收集器是 Java虚拟机JVM的一款面向服务端应用的垃圾收集器设计目标是在满足高吞吐量的同时尽可能满足用户设定的暂停时间目标Pause Time Goal。核心设计理念G1放弃了传统收集器将堆内存划分为固定大小、物理连续的分代区域如独立的年轻代和老年代的做法而是采用基于 Region 的堆内存布局。Region 划分堆内存被划分为一组大小相等的独立区域Region大小通常在 1MB 到32MB 之间必须是 2 的幂。逻辑分代Region 依然保留了 Eden、Survivor 和 Old的概念但它们在物理上不再连续而是动态地散布在堆内存中。Humongous Region专门用于存储大对象超过 Region 容量 50%的对象。如果一个对象过大会跨越多个连续的 Humongous Region 存储。回收策略G1 的名称源于其回收策略优先回收垃圾最多的Region。它通过维护一个优先级列表根据用户设定的允许收集时长回收价值最大的 Region 集合CSet, Collection Set。垃圾回收过程G1 的运行过程主要分为以下几个阶段年轻代回收当 Eden 区满时触发。过程将 Eden 和 Survivor 区中的存活对象复制到新的 Survivor 区或老年代区。特性STWStop-The-World并行执行。B. 并发标记周期Concurrent Marking Cycle并发标记周期当堆内存占用率达到阈值默认 45%时会触发并发标记为后续的混合回收做准备初始标记标记 GC Roots 直接关联的对象。STW通常借用 Young GC 的STW 阶段完成。根区域扫描扫描 Survivor 区指向老年代的对象。并发标记在整个堆中进行可达性分析标记存活对象。与应用程序并发执行。最终标记处理并发阶段遗留的少量变动。STW采用 SATB (Snapshot-At-The-Beginning) 算法。筛选清除统计每个 Region 的回收价值和成本并进行排序。识别完全空闲的 Region并直接清空。STW。混合回收触发条件并发标记结束后G1 掌握了堆的垃圾分布情况。回收范围回收所有的年轻代 Region 和部分回收价值高的老年代 Region。目标通过多次混合回收逐步降低老年代的内存占用直到其恢复到安全水平。SATBSATB 主要用于解决并发标记阶段应用程序修改对象引用关系导致的对象漏标问题。设计原理逻辑快照在并发标记开始时G1 会为堆中的对象图生成一个逻辑上的“快照”。存活判定在标记周期内只要一个对象在快照开始时是存活的或者是在标记过程中新分配的G1 都会将其视为本次收集循环中的存活对象。实现机制写前屏障操作逻辑当编译器发现代码尝试修改一个引用如 obj.field new_value时会在修改前插入指令。记录旧值写前屏障会捕获该字段在修改前的旧引用值并将其放入一个名为 SATB Marking Queue 的队列中。并发处理后台线程会定期处理该队列标记这些旧引用的目标对象及其可达路径确保在快照中原本存活的对象不会因引用关系改变而被漏标。TAMS (Top-at-Mark-Start) 指针为了识别标记开始后新分配的对象G1 在每个 Region 中使用了两个指针PrevTAMS指向上一次标记周期的堆顶。NextTAMS指向本次标记周期开始时的堆顶。处理规则在 NextTAMS 之上新分配的对象被隐式视为存活不参与本次并发标记过程。关键技术RSetRSet 用于记录跨 Region 的对象引用关系目的是在回收某个 Region 时无需扫描整个堆就能识别出哪些对象被其他 Region 引用。核心结构Points-into记录方向RSet 记录的是“谁指向了我”。粒度控制G1 将堆内存划分为 512 字节的 Card (卡页)。RSet 存储的是引用者对象所在的 Region 及其对应的 Card 索引。实现机制写后屏障拦截更新当发生 obj.field target 赋值操作时写后屏障会检查 obj 和 target 是否处于不同的 Region。脏卡记录如果是跨 Region 引用屏障会将 obj 所在的 Card 标记为 Dirty (脏卡)并放入 Dirty Card Queue。更新流程并发细化Refinement Threads一组后台线程会持续监听 Dirty Card Queue。RSet 更新这些线程解析脏卡提取出其中的跨 Region 引用关系并将其同步到目标Region 的 RSet 中。RSet 的存储级别为了平衡空间开销RSet 根据引用密度的不同采用不同的存储方式稀疏 (Sparse)使用哈希表Key 是 Region IDValue 是 Card 索引数组。细粒度 (Fine)当引用增多转为位图Bitmap位图中的每一位代表一个 Card。粗粒度 (Coarse)当引用极多转为 Region 级别的位图仅记录哪些 Region 引用了本Region不再精确到 Card。总结表特性Parallel 组合 (JDK 8 默认)CMS (搭配 ParNew)G1 (Garbage First)侧重点吞吐量优先(高效利用 CPU)低延迟(最短响应时间)可预测的低延迟内存结构物理分代 (连续空间)物理分代 (连续空间)逻辑分代物理分区 (Region)老年代算法标记-整理 (STW)标记-清除(产生碎片)标记-复制(Region 之间转移无碎片)跨代引用解决卡表 (Card Table)卡表 (Card Table)双向的记忆集 (Remembered Set极占内存)缺陷停顿时间不可控碎片化、Concurrent Mode Failure 退化风险内存占用极高 (内部维护复杂数据结构)
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2465299.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!