内存泄漏:指的是不再使用的对象在系统中未被回收,内存泄漏的积累可能会导致内存溢出
什么是垃圾回收
Java中为了简化对象的释放,引入了自动的垃圾回收(Garbage Collection
简称GC
)机制。通过垃
圾回收器来对不再使用的对象完成自动的回收,垃圾回收器主要负责对【堆】上的内存进行回收。其他
很多现代语言比如C#、Python、Go
都拥有自己的垃圾回收器。
自动垃圾回收 java
自动根据对象是否使用由虚拟机来回收对象
• 优点:降低程序员实现难度、降低对象回收bug的可能性
• 缺点:程序员无法控制内存回收的及时性
手动垃圾回收 C\C++
由程序员编程实现对象的删除
• 优点:回收及时性高,由程序员把控回收的时机
• 缺点:编写不当容易出现悬空指针、重复释放、内存泄漏等问题
Java虚拟机在运行Java程序过程中管理的内存区域,称之为运行时数据区。线程不共享的部分(程序计数器、虚拟机栈、本地方法区),都是伴随着线程的创建而创建,线程的销毁而销毁。而方法的栈帧在执行完方法之后就会自动弹出栈并释放掉对应的内存。
一、方法区的回收
方法区中能回收的内容主要就是不再使用的类。判定一个类可以被卸载,需要同时满足三个条件:
-
此类所有实例对象都已被回收,在堆中不存在任何该类的实例对象以及子类对象。
-
加载该类的类加载器已被回收。
-
该类对应的 java.lang.Class 对象没有在任何地方被引用。
开发中此类场景一般很少出现,主要在如
OSGi、JSP
的热部署等应用场景中。每个jsp文件对应一个唯一的类加载器,当一个jsp
文件修改了,就直接卸载这个jsp类加载器。重新创建类加载器,重新加载jsp文件。
手动触发回收
如果需要手动触发垃圾回收,可以调用System.gc()
方法。
语法: System.gc()
注意事项:调用
System.gc()
方法并不一定会立即回收垃圾,仅仅是向Java虚拟机
发送一个垃圾回收的请求,具体是否需要执行垃圾回收Java虚拟机会自行判断。
二、堆回收
1. 如何判断堆上的对象可以回收?
Java中的对象是否能被回收,是根据对象是否被引用来决定的。
如果对象被引用了,说明该对象还在使用,不允许被回收。
图中A的实例对象要回收,有两个引用要去除:
- 栈中
a1
变量到对象的引用 2.B
对象到A
对象的引用
即a1 = null; b1.a = null;
2. 如何判断堆上的对象没有被引用?
常见的有两种方法:引用计数法、可达性分析法
2.1 引用计数法
会为每个对象维护一个引用计数器,当对象被引用时加1,取消引用时减1。
优点:实现简单,C++中的智能指针就采用了引用计数法
缺点:
1.每次引用和取消引用都需要维护计数器,对系统性能会有一定的影响
2.存在循环引用问题,所谓循环引用就是当A引用B,B同时引用A时会出现对象无法回收的问题。
查看垃圾回收日志,可以使用-verbose:gc参数。
语法: -verbose:gc
2.2 可达性分析法
Java使用的是可达性分析算法来判断对象是否可以被回收。可达性分析将对象分为两类:垃圾回收的根对象(GC Root
)和普通对象,对象与对象之间存在引用关系。
下图中A到B再到C和D,形成了一个引用链,可达性分析算法指的是如果从某个到GC Root对象是可达的,对象就不可被回收。
哪些对象被称之为GC Root
对象呢?
1)线程Thread对象。引用线程栈帧中的方法参数、局部变量等
2)系统类加载器加载的java.lang.Class
对象。引用类中的静态变量
3)监视器对象,用来保存同步锁synchronized
关键字持有的对象。
4)本地方法调用时使用的全局对象。
查看GC Root
通过arthas
和eclipse Memory Analyzer (MAT)
工具可以查看GC Root
,MAT
工具是eclipse
推出的Java堆内存
检测工具。具体操作步骤如下:
1、使用arthas
的heapdump
命令将堆内存快照保存到本地磁盘中。
2、使用MAT
工具打开堆内存快照文件。
3、选择GC Roots
功能查看所有的GC Root
。
2.3 几种常见的对象引用
可达性算法中描述的对象引用,一般指的是强引用,即是GCRoot
对象对普通对象有引用关系,只要这层关系存在,普通对象就不会被回收。
除了强引用之外,Java中还设计了几种其他引用方式:软引用、弱引用、虚引用、终结器引用
1)软引用:
相对于强引用是一种比较弱的引用关系,如果一个对象只有软引用关联到它,当程序内存不足时,就会将软引用中的数据进行回收。在JDK 1.2
版之后提供了SoftReference
类来实现软引用,软引用常用于缓存中
软引用的执行过程如下:
1 将对象使用软引用包装起来,new SoftReference<对象类型>(对象)
。
2 内存不足时,虚拟机尝试进行垃圾回收。
3 如果垃圾回收仍不能解决内存不足的问题,回收软引用中的对象。
4 如果依然内存不足,抛出OutOfMemory
异常。
软引用中的对象如果在内存不足时回收,SoftReference
对象本身也需要被回收。如何知道哪些SoftReference
对象需要回收呢?SoftReference
提供了一套队列机制:
1 软引用创建时,通过构造器传入引用队列
2 在软引用中包含的对象被回收时,该软引用对象会被放入引用队列
3 通过代码遍历引用队列,将SoftReference
的强引用删除
2)弱引用:
整体机制和软引用基本一致,区别在于弱引用包含的对象在垃圾回收时,不管内存够不够都会直接被回收。在JDK 1.2
版之后提供了WeakReference
类来实现弱引用,弱引用主要在ThreadLocal
中使用。弱引用对象本身也可以使用引用队列进行回收。
3)虚引用和终结器引用
- 这两种引用在常规开发中不会使用到,仅了解。
- 虚引用也叫幽灵引用/幻影引用,不能通过虚引用对象获取到包含的对象。虚引用唯一的用途是当对象被垃圾回收器回收时可以接收到对应的通知。Java中使用
PhantomReference
实现了虚引用,直接内存中为了及时知道直接内存对象不再使用,从而回收内存,使用了虚引用来实现。 - 终结器引用指的是在对象需要被回收时,终结器引用会关联对象并放置在
Finalizer
类中的引用队列中,在稍后由一条由FinalizerThread
线程从队列中获取对象,然后执行对象的finalize
方法,在对象第二次被回收时,该对象才真正的被回收。在这个过程中可以在finalize
方法中再将自身对象使用强引用关联上,但是不建议这样做。
三、垃圾回收算法
垃圾回收要做的有两件事:
1)找到内存中存活的对象
2)释放不再存活对象的内存,使得程序能再次利用这部分空间
四种算法:标记-清除算法、复制算法、标记-整理算法、分代GC
垃圾回收算法的评价标准
Java垃圾回收过程会通过单独的GC线程来完成,但是不管使用哪一种GC算法,都会有部分阶段需要停止所有的用户线程。这个过程被称之为
Stop The World
简称STW
,如果STW时间过长则会影响用户的使用。
判断GC算法是否优秀,可以从三个方面来考虑:
1)吞吐量:指的是 CPU 用于执行用户代码的时间
与 CPU 总执行时间的比值
即吞吐量
= 执行用户代码时间
/(执行用户代码时间 + GC时间)
。吞吐量数值越高,垃圾回收的效率就越高。比如:虚拟机总共运行了 100 分钟,其中GC花掉 1 分钟,那么吞吐量就是 99%
2)最大暂停时间:最大暂停时间指的是所有在垃圾回收过程中的STW时间最大值
。最大暂停时间越短,用户使用系统时受到的影响就越短。
比如如下的图中,黄色部分的STW就是最大暂停时间,显而易见上面的图比下面的图拥有更少的最大暂停时间。
3)堆使用效率:不同垃圾回收算法,对堆内存的使用方式是不同的。比如标记清除算法,可以使用完整的堆内存。而复制算法会将堆内存一分为二,每次只能使用一半内存。从堆使用效率上来说,标记清除算法要优于复制算法。
上述三种评价标准:堆使用效率、吞吐量,以及最大暂停时间不可兼得。
一般来说,堆内存越大,最大暂停时间就越长。想要减少最大暂停时间,就会降低吞吐量。
不同的垃圾回收算法,适用于不同的场景
1. 标记清除算法
标记清除算法的核心思想分为两个阶段
1)标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root
开始通过引用链遍历出所有存活对象。
2)清除阶段,从内存中删除没有被标记也就是非存活对象
优点:实现简单,只需要在第一阶段给每个对象维护标志位,第二阶段删除对象即可。
缺点:1)碎片化问题:由于内存是连续的,所以在对象被删除之后,内存中会出现很多细小的可用内存单元。如果我们需要的是一个比较大的空间,很有可能这些内存单元的大小过小无法进行分配。
2)分配速度慢:由于内存碎片的存在,需要维护一个空闲链表,极有可能发生每次需要遍历到链表的最后才能获得合适的内存空间。
2. 复制算法
复制算法的核心思想是:
1)准备两块空间From
空间和To
空间,每次在对象分配阶段,只能使用其中一块空间(From
空间)。
2)在垃圾回收GC阶段,将From
中存活对象复制到To
空间。
3)将两块空间的From
和To
名字互换。
完整的复制算法的例子:
1.将堆内存分割成两块From
空间To
空间,对象分配阶段,创建对象。
2.GC
阶段开始,将GC Root
搬运到To
空间
3.将GC Root
关联的对象,搬运到To
空间
4.清理From
空间,并把名称互换
优点:
1)吞吐量高:复制算法只需要遍历一次存活对象复制到To
空间即可,比标记-整理算法少了一次遍历的过程,因而性能较好,但是不如标记-清除算法,因为标记清除算法不需要进行对象的移动
2)不会发生碎片化:复制算法在复制之后就会将对象按顺序放入To
空间中,所以对象以外的区域都是可用空间,不存在碎片化内存空间。
缺点:内存使用效率低,每次只能让一半的内存空间来为创建对象使用
3. 标记整理算法
标记整理算法也叫标记压缩算法,是对标记清理算法中容易产生内存碎片问题的一种解决方案。
核心思想分为两个阶段:
1)标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root
开始通过引用链遍历出所有存活对象。
2)整理阶段,将存活对象移动到堆的一端。清理掉存活对象的内存空间。
优点:
1)整个堆内存都可以使用,不会像复制算法只能使用半个堆内存
2)不会发生碎片化,在整理阶段可以将对象往内存的一侧进行移动,剩下的空间都是可以分配对象的有效空间
缺点:整理阶段的效率不高。整理算法有很多种,比如Lisp2
整理算法需要对整个堆中的对象搜索3次,整体性能不佳。可以通过Two Finger
、表格算法
、ImmixGC
等高效的整理算法优化此阶段的性能
4. 分代垃圾回收算法
分代垃圾回收将整个内存区域划分为年轻代和老年代:年轻代(新生代) Young区存放存活时间比较短的对象,Old区老年代存放存活时间比较长的对象.
1)分代回收时,创建出来的对象,首先会被放入Eden
伊甸园区。随着对象在Eden
区越来越多,如果Eden
区满,新创建的对象已经无法放入,就会触发年轻代的GC,称为Minor GC
或者Young GC
。Minor GC
会把eden
区和From
区(S0
)中需要回收的对象回收,把没有回收的对象放入To
区(S1
)。
2)接下来,S0
会变成To
区,S1变成From区。当eden
区满时再往里放入对象,依然会发生Minor GC
。此时会回收eden
区和S1(from)
中的对象,并把eden
和from
区中剩余的对象放入S0
。每次Minor GC
中都会为对象记录他的年龄,初始值为0,每次GC完加1。
3)如果Minor GC
后对象的年龄达到阈值(最大15,默认值和垃圾回收器有关),对象就会被晋升至老年代。当老年代中空间不足,无法放入新的对象时,先尝试minor gc
如果还是不足,就会触发Full GC
,Full GC
会对整个堆进行垃圾回收。如果Full GC
依然无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory
异常。
下图中的程序为什么会出现OutOfMemory?
从上图可以看到,Full GC
无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory
异常。
arthas查看分代之后的内存情况:
在JDK8
中,添加-XX:+UseSerialGC
参数使用分代回收的垃圾回收器,运行程序。
在arthas
中使用memory
命令查看内存,显示出三个区域的内存情况。 图2
调整内存区域的大小:通过添加jvm启动参数修改各个区域大小和比例。注意加上-XX:+UseSerialGC
为什么分代GC算法要把堆分成年轻代和老年代?
- 系统中的大部分对象,都是创建出来之后很快就不再使用可以被回收,比如用户获取订单数据,订单数据返回给用户之后就可以释放了。
- 老年代中会存放长期存活的对象,比如
Spring
的大部分bean
对象,在程序启动之后就不会被回收了。- 在虚拟机的默认设置中,新生代大小要远小于老年代的大小。
答:分代GC算法将堆分成年轻代和老年代主要原因有:
1.可以通过调整年轻代和老年代的比例来适应不同类型的应用程序,提高内存的利用率和性能。
2)新生代和老年代使用不同的垃圾回收算法,新生代一般选择“复制算法”,老年代可以选择“标记-清除”和“标记-整理”算法,由程序员来选择灵活度较高。
3)分代的设计中允许只回收新生代(minor gc
),如果能满足对象分配的要求就不需要对整个堆进行回收(full gc
),STW
时间就会减少。