JVM(Java Virtual Machine)垃圾收集器是Java虚拟机中的一个重要组件,负责自动管理Java堆内存中的对象。垃圾收集器的主要任务是找出那些不再被程序使用的对象,并释放它们占用的内存,以便为新的对象分配空间。这个过程被称为垃圾收集(Garbage Collection,GC)。
首先我们了解各种垃圾收集器的原理。以及如何通知参数命令设置垃圾收集器,其次通过分析解读GC日志,对垃圾收集器进一步的认识。
一、Serial垃圾收集器(串行垃圾收集器)
这是一个单线程的收集器,使用一个线程去完成垃圾收集工作。在进行垃圾收集时,它会暂停所有的应用线程(Stop-The-World),直到收集完成。这种收集器适合单线程环境,特别是客户端模式下的JVM。
测试代码:
public class TestGC {
public static void main(String[] args) throws Exception {
List<Object> list = new ArrayList<Object>();
while (true) {
int sleep = new Random().nextInt(200);
if (System.currentTimeMillis() % 2 == 0) {
list.clear();
} else {
for (int i = 0; i < 5000; i++) {
Properties properties = new Properties();
properties.put("key_" + i, "value_" + System.currentTimeMillis() + i);
list.add(properties);
}
}
Thread.sleep(sleep);
}
}
}
参数设置:
-XX:+UseSerialGC 指定年轻代和老年代都使用串行垃圾收集器
-XX:+PrintGCDetails 打印垃圾回收的详细信息
为了测试GC,将堆的初始和最大内存都设置为16M
‐XX:+UseSerialGC ‐XX:+PrintGCDetails ‐Xms16m ‐Xmx16m
启动程序,可以看到下面信息:
日志分析:
DefNew:表示使用的是串行垃圾收集器。
0.0000107:表示GC所用的时间,单位为毫秒。
二、并行垃圾收集器
2.1 ParNew垃圾收集器
ParNew垃圾收集器是工作在年轻代上的,只是将串行的垃圾收集器改为了并行。通过-XX:+UseParNewGC参数设置年轻代使用ParNew回收器,老年代使用的依然是串行收集器。
参数设置:
-XX:+UseParNewGC 设置年轻代使用ParNew回收器
-XX:+UseParNewGC -XX:+PrintGCDetails -Xms16m -Xmx16m
由以上信息可以看出,使用的是ParNew收集器。其他信息和串行收集器一致。
2.2 ParallelGC垃圾收集器
ParallelGC收集器工作机制和ParNewGC收集器一样,只是在此基础之上,新增了两个和系统吞吐量相关的参数,使得其使用起来更加的灵活和高效。
参数设置:
-XX:+UseParallelGC 年轻代使用ParallelGC垃圾回收器,老年代使用串行回收器。
-XX:+UseParallelOldGC 年轻代使用ParallelGC垃圾回收器,老年代使用ParallelOldGC垃圾回收器。
-XX:MaxGCPauseMillis
设置最大的垃圾收集时的停顿时间,单位为毫秒
需要注意的时,ParallelGC为了达到设置的停顿时间,可能会调整堆大小或其他的参数,如果堆的大小设置的较小,就会导致GC工作变得很频繁,反而可能会影响到性能。
-XX:GCTimeRatio
设置垃圾回收时间占程序运行时间的百分比,公式为1/(1+n)。
它的值为0~100之间的数字,默认值为99,也就是垃圾回收时间不能超过1%
-XX:UseAdaptiveSizePolicy
自适应GC模式,垃圾回收器将自动调整年轻代、老年代等参数,达到吞吐量、堆大小、停顿时间之间的平衡。
一般用于,手动调整参数比较困难的场景,让收集器自动进行调整。
-XX:+UseParallelGC -XX:+UseParallelOldGC -XX:MaxGCPauseMillis=100 -XX:+PrintGCDetails -Xms16m -Xmx16m
可以看出,年轻代和老年代都使用了ParallelGC垃圾回收器。
三、CMS垃圾收集器
CMS全称ConcurrentMarkSweep,是一款并发的、使用标记-清除算法的垃圾回收器,该回收器是针对老年代垃圾回收的,通过参数-XX:+UseConcMarkSweepGC进行设置。
参数设置:
-XX:+UseConcMarkSweepGC 指定使用CMS垃圾收集器
CMS垃圾回收器的执行过程如下:
①初始化标记(CMS-initial-mark),标记root,会导致stw。
②并发标记(CMS-concurrent-mark),与用户线程同时运行。
③预清理(CMS-concurrent-preclean),与用户线程同时运行。
④重新标记(CMS-remark),会导致stw。
⑤并发清除(CMS-concurrent-sweep),与用户线程同时运行。
⑥调整堆大小,设置CMS在清理之后进行内存压缩,目的是清理内存中的碎片。
⑦并发重置状态等待下次CMS的触发(CMS-concurrent-reset),与用户线程同时运行。
-XX:+UseConcMarkSweepGC -XX:+PrintGCDetails -Xms16m -Xmx16m
日志分析CMS的执行过程
1.第一步,初始标记
[GC (CMS Initial Mark) [1 CMS-initial-mark: 7796K(10944K)] 8485K(15872K), 0.0004397 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
2.第二步,并发标记
[CMS-concurrent-mark-start]
[CMS-concurrent-mark: 0.005/0.005 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
3.第三步,预处理
[CMS-concurrent-preclean-start]
[CMS-concurrent-preclean: 0.000/0.000 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
4.重新标记
[GC (CMS Final Remark) [YG occupancy: 2840 K (4928 K)][Rescan (parallel) , 0.0036107 secs][weak refs processing, 0.0002206 secs][class unloading, 0.0007605 secs][scrub symbol table, 0.0005148 secs][scrub string table, 0.0001229 secs][1 CMS-remark: 7796K(10944K)] 10636K(15872K), 0.0054019 secs] [Times: user=0.02 sys=0.00, real=0.00 secs]
5.并发清理
[CMS-concurrent-sweep-start]
[CMS-concurrent-sweep: 0.004/0.007 secs] [Times: user=0.01 sys=0.02, real=0.01 secs]
6.重置
[CMS-concurrent-reset-start]
[CMS-concurrent-reset: 0.000/0.000 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
四、G1垃圾收集器
G1垃圾收集器是在jdk1.7中正式使用的全新的垃圾收集器,oracle官方计划在jdk9中将G1变成默认的垃圾收集器,以替代CMS。
G1的设计原则就是简化JVM性能调优,开发人员只需要简单的三步即可完成调优:
1.第一步,开启G1垃圾收集器
2.第二步,设置堆的最大内存
3.第三步,设置最大的停顿时间
G1中提供了三种模式垃圾回收模式,YoungGC、MixedGC和FullGC,在不同的条件下被触发。
原理说明:
G1垃圾收集器相对比其他收集器而言,最大的区别在于它取消了年轻代、老年代的物理划分,取而代之的是将堆划分为若干个区域(Region),这些区域中包含了有逻辑上的年轻代、老年代区域。
这样做的好处就是,我们再也不用单独的空间对每个代进行设置了,不用担心每个代内存是否足够。
在G1划分的区域中,年轻代的垃圾收集依然采用暂停所有应用线程的方式,将存活对象拷贝到老年代或者Survivor空间,G1收集器通过将对象从一个区域复制到另外一个区
域,完成了清理工作。
这就意味着,在正常的处理过程中,G1完成了堆的压缩(至少是部分堆的压缩),这样也就不会有cms内存碎片问题的存在了。
在G1中,有一种特殊的区域,叫Humongous区域。
如果一个对象占用的空间超过了分区容量50%以上,G1收集器就认为这是一个巨型对象。这些巨型对象,默认直接会被分配在老年代,但是如果它是一个短期存在的巨型对
象,就会对垃圾收集器造成负面影响。
为了解决这个问题,G1划分了一个Humongous区,它用来专门存放巨型对象。如果一个H区装不下一个巨型对象,那么G1会寻找连续的H分区来存储。为了能找到连续的H区,有时候不得不启动FullGC。
YoungGC
YoungGC主要是对Eden区进行GC,它在Eden空间耗尽时会被触发。
Eden空间的数据移动到Survivor空间中,如果Survivor空间不够,Eden空间的部分数据会直接晋升到年老代空间。
Survivor区的数据移动到新的Survivor区中,也有部分数据晋升到老年代空间中。最终Eden空间的数据为空,GC停止工作,应用线程继续执行。
RememberedSet(已记忆集合)
在GC年轻代的对象时,我们如何找到年轻代中对象的根对象呢?根对象可能是在年轻代中,也可以在老年代中,那么老年代中的所有对象都是根么?如果全量扫描老年代,那么这样扫描下来会耗费大量的时间。于是,G1引进了RSet的概念。它的全称是RememberedSet,其作用是跟踪指向某个堆内的对象引用。
每个Region初始化时,会初始化一个RSet,该集合用来记录并跟踪其它Region指向该
Region中对象的引用,每个Region默认按照512Kb划分成多个Card,所以RSet需要记录的东西应该是xxRegion的xxCard。
MixedGC
越来越多的对象晋升到老年代oldregion时,为了避免堆内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即MixedGC,该算法并不是一个OldGC,除了回收整个Young
Region,还会回收一部分的OldRegion,这里需要注意:是一部分老年代,而不是全部老年代,可以选择哪些oldregion进行收集,从而可以对垃圾回收的耗时时间进行控制。也要注意的是MixedGC并不是FullGC。
MixedGC什么时候触发?由参数-XX:InitiatingHeapOccupancyPercent=n决定。默
认:45%,该参数的意思是:当老年代大小占整个堆大小百分比达到该阀值时触发。
它的GC步骤分2步:
1.全局并发标记(globalconcurrentmarking)
2.拷贝存活对象(evacuation)
①.全局并发标记
1.初始标记(initialmark,STW)
标记从根节点直接可达的对象,这个阶段会执行一次年轻代GC,会产生全局停顿。
2.根区域扫描(rootregionscan)
G1GC在初始标记的存活区扫描对老年代的引用,并标记被引用的对象。
该阶段与应用程序(非STW)同时运行,并且只有完成该阶段后,才能开始下一次STW年轻代垃圾回收。
3.并发标记(ConcurrentMarking)
G1GC在整个堆中查找可访问的(存活的)对象。该阶段与应用程序同时运行,可以被STW年轻代垃圾回收中断。
4.重新标记(Remark,STW)
该阶段是STW回收,因为程序在运行,针对上一次的标记进行修正。
5.清除垃圾(Cleanup,STW)
清点和重置标记状态,该阶段会STW,这个阶段并不会实际上去做垃圾的收集,等待evacuation阶段来回收。
②.拷贝存活对象
Evacuation阶段是全暂停的。该阶段把一部分Region里的活对象拷贝到另一部分Region 中,从而实现垃圾的回收清理。
参数设置:
-XX:+UseG1GC 使用G1垃圾收集器
-XX:MaxGCPauseMillis 设置期望达到的最大GC停顿时间指标(JVM会尽力实现,但不保证达到),默认值是200毫秒。
-XX:G1HeapRegionSize=n 设置的G1区域的大小。值是2的幂,范围是1MB到32MB之间。目标是根据最小的Java堆大小划分出约2048个区域。默认是堆内存的1/2000。
-XX:ParallelGCThreads=n
设置STW工作线程数的值。将n的值设置为逻辑处理器的数量。n的值与逻辑处理器的数量相同,最多为8。
-XX:ConcGCThreads=n
设置并行标记的线程数。将n设置为并行垃圾回收线程数(ParallelGCThreads)的1/4左右。
-XX:InitiatingHeapOccupancyPercent=n
设置触发标记周期的Java堆占用率阈值。默认占用率是整个Java堆的45%。
‐XX:+UseG1GC ‐XX:MaxGCPauseMillis=100 ‐XX:+PrintGCDetails ‐Xmx256m
GC日志分析:
1.扫描根节点
[Ext Root Scanning (ms): Min: 0.0, Avg: 0.1, Max: 0.2, Diff: 0.2, Sum: 1.2]
2.更新RS区域所消耗的时间
[Update RS (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0]
3.对象拷贝
[Object Copy (ms): Min: 0.1, Avg: 1.0, Max: 1.2, Diff: 1.1, Sum: 8.3]
4.清空CardTable
[Clear CT: 0.1 ms]
5.选取CSet
[Choose CSet: 0.0 ms]
6.弱引用、软引用的处理耗时
[Ref Proc: 0.4 ms]
7.弱引用、软引用的入队耗时
[Ref Enq: 0.0 ms]
8.大对象区域注册耗时
[Humongous Register: 0.0 ms]
9.大对象区域回收耗时
[Humongous Reclaim: 0.0 ms]
10.年轻代的大小统计
[Eden: 12.0M(12.0M)->0.0B(12.0M) Survivors: 0.0B->2048.0K Heap: 12.0M(256.0M)->3384.0K(256.0M)]
G1垃圾收集器使用建议
①.年轻代大小
1.避免使用-Xmn选项或-XX:NewRatio等其他相关选项显式设置年轻代大小。
2.固定年轻代的大小会覆盖暂停时间目标。
②.暂停时间目标不要太过严苛
1.G1GC的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间。
2.评估G1GC的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表示您愿意承受更多的垃圾回收开销,而这会直接影响到吞吐量。
最后:垃圾收集器使用范围:
1.新生代的收集器包括:
Serial
PraNew
Parallel Scavenge
2.老年代的收集器包括:
Serial Old
Parallel Old
CMS
3.回收整个Java堆(新生代和老年代)
G1收集器