解读Java虚拟机垃圾回收器:探究经典算法背后的奥秘

目录

一、GC分类与性能指标

(一)垃圾回收器分类

(二)性能指标

(三)不可能三角

二、不同的垃圾回收器概述

三、Serial回收器:串行回收

四、ParNew回收器:并行回收

五、Parallel回收器:吞吐量优先

六、CMS回收器:低延迟

七、G1回收器:区域化分代式

(一)Region

(二)记忆集

(三)运行过程

八、垃圾回收器总结

九、GC日志分析


一、GC分类与性能指标

(一)垃圾回收器分类

1、按垃圾回收线程数

串行回收指同一个时间段内,只允许一个CPU用于执行垃圾回收操作,此时工作线程被暂停,直到垃圾收集工作结束。在单CPU处理器或者较小应用内存等硬件平台不是特别优越的场合,串行回收器的性能表现可以超过并行回收器和并发回收器。所以串行回收默认被应用在客户端的client模式下的JVM中

并行垃圾回收器,和串行相反,并行收集可以运用在多个CPU同时执行垃圾回收,因此提升了应用的吞吐量,不过并行回收仍然与串行回收一样,采用独占式,使用了STW机制

2、按照工作模式分

并发式:垃圾回收器与应用程序交替工作,以尽可能减少应用程序的停顿时间

独占式:一旦运行,就停止应用程序中所有的用户线程,直到垃圾回收过程完全结束

3、按照碎片处理方式

压缩式,比如标记整理算法,内存分配可以使用指针碰撞。

非压缩式,比如标记清除算法,会产生垃圾碎片,内存分配使用空闲列表

4、按个工作内存区间分

年轻代

老年代

(二)性能指标

1、吞吐量

运行用户代码的时间占总运行时间的比例

总运行时间:程序的运行时间+内存回收的时间

吞吐量优先,意味着单位时间内,STW的时间最短

2、垃圾收集开销

吞吐量的补数(运行时间=运行用户代码的时间+垃圾回收的时间),垃圾收集所占用的时间与总运行时间的比例

3、暂停时间

执行垃圾收集时,程序的工作线程被暂停的时间

暂停时间优先,意味着单次STW的时间最短,但是频率可能增加

4、收集频率

相对于应用程序的执行,收集操作发生的频率

5、内存占用

Java堆区所占的内存大小

6、快速

一个对象从诞生到被回收经历的时间

(三)不可能三角

简单来说抓住两点,吞吐量暂停时间

高吞吐量与低暂停时间,是一对互相竞争的。因为如果高吞吐量优先,必然需要降低内存回收的执行频率,导致GC需要更长的暂停时间来执行内存回收。

如果选择低暂停时间(低延迟)优先为原则,也只能频繁的执行内存回收,引起程序吞吐量的下降

现在的标准,在最大吞吐量优先的情况下,降低停顿时间(STW)

二、不同的垃圾回收器概述

7款经典垃圾收集器和垃圾分代之间的关系

垃圾收集器的组合关系

  • jdk8之前,可以用虚线参考关系
  • CMS下面的实线,是CMS回收失败的后备方案
  • JDK8中取消了红线的组合,标记为废弃的。如果要用也可以用。
  • JDK9中将红线做了remove
  • jdk14中弃用了绿线组合
  • jdk14中删除了CMS GC
  • JDK9默认G1
  • JDK8默认Parallel Scavenge 和Parallel old Gc
  • 新生代用了Parallel Scavenge 则老年代自动触发用Parallel old
  • Parallel底层与ParNew底层不同,所以不能和CMS组合

如何查看默认的垃圾收集器?

  1. -XX:+PrintCommandLineFlags
  2. jinfo -flag 相关垃圾回收器参数 进程ID

三、Serial回收器:串行回收

Serial收集器采用复制算法,串行回收和STW机制的方式执行内存回收。除了年轻代,还有用于执行老年代的Serial old收集器,同样采取了串行回收,但是用标记压缩算法。

使用一个CPU或者一条收集线程去完成垃圾收集工作,在进行垃圾收集时,必须暂停其他所有工作线程

优势:简单而高效,对于限定单个CPU的环境来说,由于没有线程交互的开销,可以获取最高的单线程收集效率

HotSpot虚拟机中,使用-XX:+UseSerialGC指定年轻代和老年代使用串行收集器

对于交互强的应用而言,并不会采取串行垃圾收集器

四、ParNew回收器:并行回收

除了采用并行回收,其他方面和Serial之间几乎没有任何区别

-XX:UseParNewGC 手动指定ParNew收集器执行内存回收任务,它表示年轻代使用,不影响老年代

-XX:ParallelGCThreads 限制线程数量,默认开启和CPU数据相同的线程数

五、Parallel回收器:吞吐量优先

也采用并行回收,同样是基于标记-复制算法实现的,但和ParNew不同,它的目标是达到一个可控制的吞吐量。所谓吞吐量就是处理器用于运行用户代码的时间与处理器总消耗时间的比值,

即:

Parallel Scavenge 收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集停顿时间
-XXMaxGCPauseMillis 参数以及直接设置吞吐量大小 -XXGCTimeRatio 参数。

接下来介绍参数

  • -XX:+UseParallelGC
    • 手动指定年轻代使用此收集器执行内存回收任务
  • -XX:+UseParallelOldGC
    • 手工指定老年代使用并行回收收集器,分别适用于新生代和老年代,默认jdk8是开启的
    • 上面这两个参数相互关联,开启一个,默认开启另一个。
  • -XX:ParallelGCThreads
    • 设置年轻代并行收集器的线程数,一般与CPU数量相同,如果CPU数量大于8个,则值=3+(5*N/8)
  • -XX:MaxGCPauseMillis
  • 设置收集器最大停顿时间,单位毫秒。允许的值是一个大于0的毫秒数,收集器将尽力保证内存回收花费的时间不超过用户设定值。
  • -XX:GCTimeRatio
    • 垃圾收集占总时间比,用于衡量吞吐量大小
    • 默认99,取值范围0-100,也就是垃圾回收时间不超过1%
    • 与上一个参数矛盾,暂停时间越长,Ratio参数就容易超过设定比例
  • -XX:+UseAdaptiveSizePolicy
    • 开启自适应调节策略。这种模式下,年轻代大小,Eden和Survivor的比例,晋升老年底对象年龄参数都会被自动调整
    • 为了达到堆大小,吞吐量和停顿时间之间的平衡点
    • 在手动调优比较困难的场景下,可以直接用自适应方式,仅指定虚拟机最大堆,目标吞吐量和停顿时间,让虚拟机自己完成调优工作

六、CMS回收器:低延迟

jdk1.5推出 Concurrent Mark Sweep 并发的标记清除,第一次实现了让垃圾收集线程与用户线程同时工作

从名字(包含 “Mark Sweep” )上就可以看出 CMS 收集器是基于标记 - 清除算法实现的,它的运作
过程相对于前面几种收集器来说要更复杂一些,整个过程分为四个步骤,包括:
  1. 初始标记:STW,仅仅只是标记处GC Roots能直接关联的对象,一旦标记完成后就会恢复之前被暂停的所有应用线程,由于直接关联对象比较小,所以这里速度非常快
  2. 并发标记:从GCRoots的直接关联对象开始遍历整个对象图的过程,这个过程耗时较长,但是不需要停顿用户线程。可以与垃圾收集线程一起并发运行
  3. 重新标记:为了修正并发标记期间,因用户程序继续运作导致标记产生变动的那一部分对象的标记记录
  4. 并发清除:清理删除标记阶段判断的已经死亡的对象,释放内存空间。由于不需要移动存活对象,所以这个阶段也可以与用户线程同时并发

初始标记和重新标记阶段仍然需要STW机制

而且由于在垃圾收集阶段用户线程没有中断,所以在CMS回收过程中,还应该确保应用程序用户线程有足够的内存可用。因此CMS收集器不能像其他收集器那样等到老年代几乎填满再进行回收,而是当堆内存使用率达到某一阈值时,便开始进行回收。

要是CMS运行期间预留的内存无法满足程序需要,就会出现一次Concurrent Mode Failure失败,这时虚拟机启用备用方案,临时启用Serial old 收集器来重新进行老年代的垃圾收集,这样停顿时间就长了。

CMS采取标记清除算法,会产生内存碎片,只能够选择空闲列表执行内存分配

为什么不采取标记压缩呢?

因为并发清除时,如果用压缩整理内存,原来的用户线程使用的内存就无法使用了。标记压缩更适合STW场景下使用

优点

  • 并发收集
  • 低延迟

缺点

  • 会产生内存碎片
  • 对CPU资源非常敏感
    • 在并发阶段会占用一部分线程导致应用程序变慢
  • 无法处理浮动垃圾
    • 并发标记阶段是与工作线程同时运行,如果并发阶段产生垃圾对象,CMS无法进行标记,导致新产生的垃圾对象没有被及时回收,只能在下一次执行GC时释放空间

接下来介绍参数

  • -XX:+UseConcMarkSweepGC
    • 手工指定CMS收集器执行内存回收任务
    • 开启后,自动将-XX:UseParNewGC打开,即ParNew(Young区)+CMS(old区)+Serial GC组合
  • -XX:CMSlnitiatingOccupanyFraction
    • 设置堆内存使用率的阈值
    • 一旦达到该阈值,则开始进行回收
    • jdk5及之前默认68,即老年代的空间使用率达到68%时会执行一次CMS回收
    • JDK6及以上默认值为92%
    • 如果内存增长缓慢,可以设置一个稍大的值,有效降低CMS的触发频率,减少老年代回收的次数
    • 如果应用程序内存使用率增加很快,则应该降低这个阈值,以避免频繁触发老年代串行收集器。
  • -XX:+UseCMSCompactAtFullCollection
    • 用于执行完Full GC后对内存空间进行压缩整理
    • 不过内存压缩无法并发执行,会带来停顿时间更长的问题
  • -XX:CMSFullGCsBeforeCompaction
    • 设置执行多少次FullGC后对内存空间进行压缩整理
  • -XX:ParallelCMSThreads
    • 设置CMS的线程数量
    • 默认启动的线程数是(ParallelGCThreads+3)/4
    • ParallelGCThreads是年轻代并行收集器的线程数

如果想要最小化使用内存和并行开销,选择Serial GC

如果最大化应用程序的吞吐量,选择ParallelGC

如果想要最小化的GC的中断或停顿时间,选择CMS GC

七、G1回收器:区域化分代式

官方给G1设定的目标就是在延迟可控的情况下,获得尽可能高的吞吐量,所以才担当起全功能收集器的重任和期望

在JDK1.7版本正式启用,jdk9以后默认垃圾回收器。JDK8还不是默认的,需要用-XX:+UseG1GC来启用

(一)Region

Garbage First是一个并行回收器,他把堆内存分割为很多不相关的区域(Region)(物理上不连续),使用不同的region表示Eden,s0,s1,老年代等。G1会跟踪各个region里面垃圾堆积的价值大小,在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region

收集器能够对扮演不同角色的Region采用不同的策略去处理,这样无论是新创建的对象还是已经存活了一段时间、熬过多次收集的旧对象都能获取很好的收集效果。
Region 中还有一类特殊的 Humongous 区域,专门用来存储大对象。 G1 认为只要大小超过了一个
Region 容量一半的对象即可判定为大对象。每个 Region 的大小可以通过参数 -XX: G1HeapRegionSize 设定,取值范围为1MB 32MB ,且应为 2 N 次幂。而对于那些超过了整个 Region 容量的超级大对象,将会被存放在N 个连续的 Humongous Region 之中, G1 的大多数行为都把 Humongous Region 作为老年代的一部分来进行看待。

将Java堆分成多个独立Region后,Region里面存在的跨Region引用对象如何解决?
比如进行新生代垃圾回收时,很有可能有老年代的对象指向新生代中的对象,如果此时还需对老年代的对象进行一次扫描,代价太高昂了。G1收集器使用记忆集来解决这个问题

(二)记忆集

每个region对应一个记忆集,通过记忆集避免全局扫描。这些记忆集会记录下别的Region 指向自己的指针,并标记这些指针分别在哪些卡页的范围之内。

每次引用类型数据写操作时,会产生一个写屏障暂时中断操作。然后检查将要赋值的引用指向的对象是否和该引用对象类型数据在不同的region,如果不同就通过CardTable把相关的引用信息记录到引用指向对象所在的Region对应的记忆集中

当进行垃圾收集时,在GC根节点枚举范围加入记忆集,就可以保证不进行全局扫描,也不会有遗漏

(三)运行过程

如果我们不去计算用户线程运行过程中的动作(如使用写屏障维护记忆集的操作), G1 收集器的
运作过程大致可划分为以下四个步骤:
初始标记 Initial Marking ):仅仅只是标记一下 GC Roots 能直接关联到的对象,并且修改 TAMS 指针的值,让下一阶段用户线程并发运行时,能正确地在可用的Region 中分配新对象。这个阶段需要停顿线程,但耗时很短,而且是借用进行Minor GC 的时候同步完成的,所以 G1 收集器在这个阶段实际并没有额外的停顿。
并发标记 Concurrent Marking ):从 GC Root 开始对堆中对象进行可达性分析,递归扫描整个堆里的对象图,找出要回收的对象,这阶段耗时较长,但可与用户程序并发执行。当对象图扫描完成以后,还要重新处理SATB记录下的在并发时有引用变动的对象。
最终标记 Final Marking ):对用户线程做另一个短暂的暂停,用于处理并发阶段结束后仍遗留
下来的最后那少量的 SATB 记录。
筛选回收 Live Data Counting and Evacuation ):负责更新 Region 的统计数据,对各个 Region 的回收价值和成本进行排序,根据用户所期望的停顿时间来制定回收计划,可以自由选择任意多个Region 构成回收集,然后把决定回收的那一部分Region 的存活对象复制到空的 Region 中,再清理掉整个旧Region的全部空间。这里的操作涉及存活对象的移动,是必须暂停用户线程,由多条收集器线程并行完成的

优势

  • 并行与并发
  • 分代收集:同时兼顾年轻代与老年代
  • 空间整合
    • region之间用复制算法,整体可以看做是标记压缩算法。
    • 两种算法都避免内存碎片,有利于程序长时间运行,分配大对象不会因为无法找到连续空间提前触发下一次GC,尤其当Java堆非常大的时候,G1优势更加明显
  • 可预测的停顿时间模型
    • 能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不能超过N毫秒

缺点

  • 相较于CMS,G1不具备全方位,压倒性优势。比如用户程序运行中,G1无论是为了垃圾收集产生的内存占用,还是程序运行时的额外执行负载都要比CMS要高
  • 经验上来说,小内存应用CMS表现大概率优于G1,在大内存上G1优势发挥更多,平衡点再6-8GB

参数设置

  • -XX:+UseG1GC
  • -XX:G1HeapRegionSize
    • 设置每个Region大小,值是2的幂,范围是1MB到32MB之间,目标是根据最小的Java堆划分出约2048个区域,默认是堆内存的1/2000
  • -XX:MaxGCPauseMillis
    • 设置期望达到的最大GC停顿时间指标,JVM尽力但不保证,默认200ms
  • -XX:ParallelGCThread
    • 设置STW工作线程数的值,最多设置8
  • -XX:ConcGCThreads
    • 设置并发标记的线程数,将N设置为并行垃圾回收线程数(parallelGCThreads)的1/4左右
  • -XX:InitiatingHeapOccupancyPercent
    • 设置触发并发GC周期的Java堆占用率阈值,超过此值就触发GC,默认是45

G1提供了三种垃圾回收模式在不同的条件下触发

  • YoungGC:当年轻代eden区用尽时
  • MixedGC:G1老年代回收器不需要整个老年代都被回收,一次只需要扫描回收价值高的小部分老年代的region就可以了。同时这个老年代回收是和年轻代一起被回收的。
  • FullGC:当堆内存使用到一定值,默认45%

八、垃圾回收器总结

九、GC日志分析

我们可以通过加以下参数输出GC日志,然后进行分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/212006.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Nginx实现多虚拟主机配置

Nginx实现多虚拟主机配置 Nginx为什么要进行多虚拟主机配置呢?what? Nginx实现多虚拟主机配置的主要原因是,一个服务器可能会承载多个网站或应用程序,这些网站或应用程序需要使用不同的域名或IP地址来进行访问。如果只有一个虚拟…

SHAP(五):使用 XGBoost 进行人口普查收入分类

SHAP(五):使用 XGBoost 进行人口普查收入分类 本笔记本演示了如何使用 XGBoost 预测个人年收入超过 5 万美元的概率。 它使用标准 UCI 成人收入数据集。 要下载此笔记本的副本,请访问 github。 XGBoost 等梯度增强机方法对于具有…

Python----Pandas

目录 Series属性 DataFrame的属性 Pandas的CSV文件 Pandas数据处理 Pandas的主要数据结构是Series(一维数据)与DataFrame(二维数据) Series属性 Series的属性如下: 属性描述pandas.Series(data,index,dtype,nam…

模板初阶(2):函数模板的匹配原则,类模板的实例化

一、函数模板的匹配原则 int Add(const int& x, const int& y) {return x y; }template <class T> T Add(const T& x, const T& y) {return x y; }int main() {int a1 1, a2 2;Add(a1, a2);double d1 1.1, d2 2.2;Add(d1, d2);return 0; }一个非模…

ELK配置记录

1. filebeat.yml配置 启动命令&#xff1a; ./filebeat -e -c filebeat.yml # 输入 filebeat.inputs: - type: logenabled: truepaths:- /soft/log/base.*#跨行日志正则&#xff0c;从有时间的开始&#xff0c;到下一个时间之前结束multiline.pattern: ^\[[0-9]{4}-[0-9]{2}…

责任链设计模式

package com.jmj.pattern.responsibility;/*** 请假条类*/ public class LeaveRequest {//姓名private String name;//请假天数private int num;//请假内容private String content;public LeaveRequest(String name, int num, String content) {this.name name;this.num num;…

FL Studio21.2汉化永久中文语言包

FL Studio21.2这款软件在国内被广泛使用&#xff0c;因此又被称为"水果"。它提供音符编辑器&#xff0c;可以针对作曲者的要求编辑出不同音律的节奏&#xff0c;例如鼓、镲、锣、钢琴、笛、大提琴、筝、扬琴等等任何乐器的节奏律动。此外&#xff0c;它还提供了方便快…

使用极限网关助力 ES 集群无缝升级、迁移上/下云

在工作中大家可能会遇到以下这些场景&#xff1a; 自建 ES 集群需要平滑迁移到 XX 云&#xff1b;从 XX 云将 ES 集群迁移到自建机房&#xff1b;ES 集群进行跨版本升级&#xff0c;同时保留回退能力&#xff1b; 这些场景往往都还有个共同的需求&#xff1a;迁移过程要保证业…

【经验分享】DDNS配置--使用DDNS-GO

DDNS配置 DDNS&#xff08;Dynamic Domain Name Server&#xff0c;动态域名服务&#xff09;是将用户的动态IP地址映射到一个固定的域名解析服务上&#xff0c;用户每次连接网络的时候客户端程序就会通过信息传递把该主机的动态IP地址传送给位于服务商主机上的服务器程序&…

Python标准库:copy库【侯小啾python领航班系列(十五)】

Python标准库:copy库【侯小啾python领航班系列(十五)】 大家好,我是博主侯小啾, 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ…

Javaweb之Vue组件库Element案例分页工具栏的详细解析

4.4.3.5.3 分页工具栏 分页条我们之前做过&#xff0c;所以我们直接找到之前的案例&#xff0c;复制即可&#xff0c;代码如下&#xff1a; 其中template模块代码如下&#xff1a; <!-- Pagination分页 --> <el-paginationsize-change"handleSizeChange"c…

7、Jenkins+Nexus3+Docker+K8s实现CICD

文章目录 基本环境配置一、Jenkins安装必要插件二、Jenkins系统配置三、新建流水线四、在项目工程里添加Jenkinsfile、deploy.yml五、在项目工程里添加Dockerfile在这里插入图片描述 总结 提示&#xff1a;本章主要记录各基本环境搭建好后如何配置Jenkins流水线部署微服务到K8s…

Spring Framework详解

学习目标 能够说出Spring的体系结构 能够编写IOC入门案例 能够编写DI入门案例 能够配置setter方式注入属性值 能够配置构造方式注入属性值 能够理解什么是自动装配 一、Spring简介 1 Spring课程介绍 问题导入 我们为什么要学习Spring框架&#xff1f; 1.1 为什么要学 Spri…

C++的类和对象(一)

目录 1、面向过程和面向对象初认识 2、为什么要有类 3、类的定义 类的两种定义方式 4、类的访问限定符 5、类的作用域 5.1 为什么要有作用域&#xff1f; 5.2类作用域 6、类的实例化 6.1类的实例化的定义 6.2类的实例化的实现 6.3经典面试题 7、类对象 7.1类对…

QT 中使用 QTableView 和 QStandardItemModel 实现将数据导出到Excel 和 从Excel导入到 QTableView 的功能

简介 在Qt中&#xff0c;使用QTableView和QStandardItemModel来实现将数据导出到Excel和从Excel导入到QTableView的功能&#xff0c;而不使用第三方库&#xff08;如QXlsx&#xff09;。 效果 将 QTableView 中的数据导出到Excel //从tableview 导出到 EXcle void MainInterfa…

CSS BFC特性和应用

目录 1&#xff0c;介绍2&#xff0c;BFC布局规则3&#xff0c;创建BFC4&#xff0c;BFC应用1&#xff0c;浮动子元素使父级高度坍塌2&#xff0c;非浮动元素被浮动元素覆盖3&#xff0c;margin 合并1&#xff0c;父子 margin 合并&#xff1a;父级和第1个/最后1个子元素2&…

Ubuntu 安装 MySQL8 配置、授权、备份、远程连接

目录 0100 系统环境0200 下载0300 安装0400 服务管理0401 关闭、启动、重启服务0402 查看服务状态 0500 查看配置文件0600 账号管理0601 添加账号0602 删除账号0603 修改密码0604 忘记root密码 0700 自动备份0800 远程访问 0100 系统环境 [rootlocalhost ~]# cat /proc/versio…

SQL Server数据库部署

简介 21世纪&#xff0c;人类迈入了“信息爆炸时代”&#xff0c;大量的数据、信息在不断产生&#xff0c;伴随而来的就是如何 安全、有效地存储、检索和管理它们。对数据的有效存储、高效访问、方便共享和安全控制已经成 为信息时代亟待解决的问题。数据库&#xff08;Databas…

锐捷RG-UAC应用网关 前台RCE漏洞复现

0x01 产品简介 锐捷RG-UAC系列应用管理网关是锐捷自主研发的应用管理产品。 0x02 漏洞概述 锐捷RG-UAC应用管理网关 nmc_sync.php 接口处存在命令执行漏洞&#xff0c;未经身份认证的攻击者可执行任意命令控制服务器权限。 0x03 复现环境 FOFA&#xff1a;app"Ruijie-R…

〖大前端 - 基础入门三大核心之JS篇㊹〗- DOM事件委托

说明&#xff1a;该文属于 大前端全栈架构白宝书专栏&#xff0c;目前阶段免费&#xff0c;如需要项目实战或者是体系化资源&#xff0c;文末名片加V&#xff01;作者&#xff1a;不渴望力量的哈士奇(哈哥)&#xff0c;十余年工作经验, 从事过全栈研发、产品经理等工作&#xf…