深入学习JVM —— GC垃圾回收机制

前言

        前面荔枝已经梳理了有关JVM的体系结构和类加载机制,也详细地介绍了JVM在类加载时的双亲委派模型,而在这篇文章中荔枝将会比较详细地梳理有关JVM学习的另一大重点——GC垃圾回收机制的相关知识,重点了解的比如对象可达性的判断、四种回收算法、分代回收机制的流程和区域划分。希望对有需要的小伙伴有帮助~~~~


文章目录

前言

一、基本概念

1.1 Java中的引用类型 

1.2 垃圾回收区域

1.3 判断对象可回收的方法

1.3.1 引用计数法

1.3.2 可达性分析法

二、JVM中的垃圾回收算法

2.1 标记——清除算法

2.2 标记——复制算法

2.3 标记——整理算法

三、分代回收机制

3.1 垃圾回收的类型

3.2 空间结构与区域划分

3.3 跨代引用

总结


一、基本概念

        GC(Carbage Collection)又称为垃圾回收器,我们知道一个对象在其生命周期结束的时候是会被销毁掉的,在Java中对象的销毁时不需要开发者去显示调用的,而是交给Java虚拟机中的垃圾回收器来回收。Java中提供了多种垃圾回收器,而在JVM中会一直维护一个垃圾回收线程,通常该线程只有在堆内存不足或者是JVM空闲的时候才会触发执行,将他们添加到要回收的集合中并进行回收。

GC监控时机 

        对于GC来说,当程序员创建对象时,GC就开始监控这个对象的地址、大小以及使用情况。通常,GC采用有向图的方式记录和管理堆(heap)中的所有对象。通过这种方式确定哪些对象是"可达的",哪些对象是"不可达的"。当GC确定一些对象为"不可达"时,GC就有责任回收这些内存空间。

1.1 Java中的引用类型 

Java中的引用类型有四种,分别是:强引用、弱引用、软引用和虚引用。Java中的默认声明其实就是强引用。

//强引用
//强引用所关联的对象始终不会被垃圾回收机制回收
String str
Object obj = new Object();

//软引用
//内存不足的时候才会回收软引用所关联的对象
//软引用是通过java.lang.ref.SoftReference
buff = new byte[1024 * 1024];
SoftReference<byte[]> sr = new SoftReference<>(buff);

//弱引用
//无论内存是否足够,只要 JVM 开始进行垃圾回收,那些被弱引用关联的对象都会被回收
//java.lang.ref.WeakReference 来表示弱引用
byte[] buff = new byte[1024 * 1024];
WeakReference<byte[]> sr = new WeakReference<>(buff);

//虚引用
//虚引用是最弱的一种引用关系,如果一个对象仅持有虚引用,那么它就和没有任何引用一样,它随时可能会被回收
//用 PhantomReference 类来表示
  • 强引用:发生 gc 的时候不会被回收,即使内存不足也不会回收而是抛出异常,如果想中断强引用于对象之间的联系,可以给引用赋值为null,这样对象就可以被回收了。
  • 软引用:有用但不是必须的对象,在发生内存溢出之前会被回收。
  • 弱引用:有用但不是必须的对象,在下一次GC时会被回收。
  • 虚引用:无法通过虚引用获得对象,用 PhantomReference 实现虚引用,虚引用的用途是在 gc 时返回一个通知。

1.2 垃圾回收区域

         在上一篇文章JVM的体系架构中我们了解了JVM的内存结构,其中讲到了JVM内存结构中的栈区中的基本类型数据是不会被垃圾回收机制给回收的,而是在超出其作用范围自动销毁滴。其实JVM中的GC机制主要是回收堆区和方法区内的基本数据和对象。

1.3 判断对象可回收的方法

在GC垃圾回收机制中,当对象没有引用了或者方法不可达就可以判断该对象可以回收,即垃圾回收线程可以将该对象加入回收集合了,具体的判断对象可达性的方法如下: 

1.3.1 引用计数法

为每个对象创建一个引用计数,有对象引用时计数器 +1,引用被释放时计数 -1,当计数器为 0 时就可以被回收,这种方法实现起来比较简单。

缺点:无法回收相互引用的对象。

1.3.2 可达性分析法

        可达性分析法又被称为根搜索法,用来判断对象是否存活。从GC机制的某一个根节点触发开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。

可作为根节点的对象:

  • 在虚拟机栈帧中引用的对象,例如线程调用方法时,使用或产生的参数、局部变量、临时变量等。
  • 在方法区中,类的引用类型静态变量或常量;
  • 在本地方法栈中的JNI引用的对象;
  • 在JVM内部的对象,例如基本数据类型的Class对象,一些常驻的异常对象(NullPointExcepiton),系统类加载器等;
  • 所有synchronized同步锁的持有对象;
  • 反映JVM内部情况的JMXBean、JVMTI注册的回调、本地代码缓存等。

二、JVM中的垃圾回收算法

JVM中的垃圾回收算法主要有四种,其中按回收策略来说应该分为两类:分代回收和局部回收。我们先来梳理局部回收的三种回收算法:

2.1 标记——清除算法

        简单描述该方法就是标记出所有的存活对象,再扫描整个空间中未被标记的对象进行垃圾清除(回收)。标记 - 清除算法由于回收后没有进行整理的操作,所以会存在内存空间碎片化的问题,可能会导致后续产生的对象不能找到可利用的空间这个问题。

2.2 标记——复制算法

        常规的复制算法就是将内存分为两块大小相同的空间,但其中的一块内存用完后就会将存活的对象拷贝到另一块内存中,之后再将原空间进行一次性清理,这个方法虽然效率高但却是以牺牲内存空间为代价的。标记-复制算法在这个基础之上对其进行了优化,不再是通过1:1的比例来分配内存空间,而是按照8:1:1来分配内存空间的,即将内存空间的80%作为Eden空间,剩下的20%分成两个10%的Survivor空间。把Eden和其中一块Survivor空间中存活的对象,复制到另一块空闲的Survivor空间,然后直接把Eden和使用过的那块Survivor空间清理掉。

需要注意的是:

        目前主流的使用分代回收机制的Java虚拟机,都是使用标记-复制算法来作为新生代的回收算法。它非常适合用在新生代这种回收率极高的场景,这样的场景下,复制算法浪费的空间几乎可以忽略不计。效率高,且内存不会有碎片化的问题。 

分配担保机制

        极端情况下可能会出现超过10%的对象存活,分配担保机制就是为了保证当出现这种情况时,有其他内存空间来存放存活的对象。通常这个“担保人”是老年代,当存活的对象超过Survivor空间大小时,这些存活的对象会忽略年龄,直接进入老年代里。  

2.3 标记——整理算法

        在前面我们了解到标记-清除算法的缺点就是会产生内存碎片,不适合哪些需要大量连续内存空间的场景,而标记-整理算法就是在其基础之上,增加了整理这个操作来解决内存空间碎片化的问题

算法流程

        首先标记出所有的存活对象,但在清除之前会先进行整理,把所有存活的对象往内存空间的左边移动,然后清理掉存活对象边界以外的内存,即完成了清除的操作。标记-整理 算法是在 标记-清除 算法之上,又进行了对象的移动排序整理,因此成本更高,但却解决了内存碎片的问题。上面的几种算法比较适合于老年代中的对象回收。


三、分代回收机制

接着我们来看看分代回收算法,在介绍分代回收机制之前,我们需要明确两个分代假说,或者说是常识也行:

  • 弱分代假说:绝大多数对象都是朝生夕改的
  • 强分代假说:熬过越多次垃圾回收的对象就越难消亡

根据分代假说,既然绝大多数对象容易被垃圾回收,而留下的对象不易被回收,就可以对GC区域内对象进行分类,分为新生代和老年代。相比两个区域内的对象的特性,GC就不用每次都对老年代进行搜索标记,而仅需要搜索标记新生代所存放的内存空间即可。

3.1 垃圾回收的类型

  • Minor GC:只回收新生代对象存放的内存空间
  • Major GC:只回收老年代对象存放的内存空间,只有CMS收集器实现了Major GC
  • Full GC:回收整个堆区和方法区,相当于全盘扫描标记,效率低
  • Mixed GC:回收整个新生代和部分老年代。G1收集器实现了这个类型 

需要注意的是:在老年代里,触发GC,除了CMS和G1之外的其他收集器,大多数触发的其实是 Full GC。

3.2 空间结构与区域划分

我们知道在GC中一般将对象分为新生代(年轻代)和老年代(年老代),下面我们详细认识一下整个二者以及堆区和方法区的具体空间结构。

新生代:

绝大多数新创建的对象会被分配到新生代里,仅在该区域进行垃圾回收被称之为Minor GC。

老年代:

        对象在新生代周期中存活了下来的,会被拷贝到这里。通常情况下这个区域分配的空间要比新生代多。正是由于对象经历的GC次数越多越难回收,加上相对大的空间,一般发生在老年代的GC次数要比新生代少得多。这个区域触发的垃圾回收称之为:Major GC 或者 Full GC。

永久代

        是hotspot虚拟机的特有的概念,他不属于堆内存,是方法区的一种实现,各大厂商对方法区其实都有各自的实现。永久代一般存放jvm运行时需要的类,包含java库的类和方法,在触发full gc的情况下,永久代也会被进行垃圾回收。在JDK1.8之后,JVM使用元空间metaspace来取代永久代,最大区别是元空间中的数据是储存在本地内存的。

空间结构

        一般来说呢,新生代的空间会被按照 8:1:1 的方式来进行划分为一个Eden空间和两个Survivor空间,这种设计是为了更好的适配新生代对象容易被回收的特点,同时也比较适合使用标记——复制算法来GC。那些经历了多次GC的对象一般都是从新生代的Eden到Survive空间,重复N次达到设定的阈值后才会到老年代空间里面,当然也有一些比较大的对象是直接到老年代空间里面的。

 

老年代区域GC耗时更长的原因:

  • 老年代中会有更比较大的对象,并且老年代的内存占比一般更大;
  • 老年代使用的是标记-整理算法,清理内存前会把存活的对象重新排序整理成连续的空间,成本更高

3.3 跨代引用

场景:新生代中的对象很有可能会被老年代里的对象所引用,当新生代触发GC的时候,只搜索新生代的区域明显是不够的,还得搜索老年代的对象是否引用了新生代中非 GC Roots 引用链上的对象,来确保正确性。 

解决方法 

        Java定义了一种名为记忆集的抽象的数据结构,用于记录存在跨区域引用的对象指针集合。大多数的虚拟机,都采用一种名为卡表(Card Table)的方式去实现记忆集,卡表由一个数组构成,每一个元素都对应着一块特定大小的内存区域,这块内存区域被称之为卡页(Card Page),每一个卡页,可能会包含N个存在跨区域引用的对象,只要存在跨区域引用的对象,这个卡页就会被标识为1。当GC发生的时候,就不需要扫描整个区域了,只需要把这些被标识为1的卡页加入对应区域的 GC Roots 里一起扫描即可。


总结

        这篇文章结束,荔枝有关JVM的初步学习就要告一段落啦,这篇文章主要还是大体上了解了JVM的垃圾回收机制中的一些空间结构和区域划分,以及不同时期的对象在堆空间中存储的区域和相关的回收算法。总的来说通过这几篇文章应该就答题了解的差不多了,接下来荔枝就要开始看项目和继续学习一些中间件了哈哈哈,大家一起加油啦~~~

今朝已然成为过去,明日依然向往未来!我是小荔枝,在技术成长的路上与你相伴,码文不易,麻烦举起小爪爪点个赞吧哈哈哈~~~ 比心心♥~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/65642.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Prometheus技术文档--基本安装-docker安装并挂载数据卷-《十分钟搭建》

一、查看可安装的版本 docker search prom/prometheus 二、拉取镜像 docker pull prom/prometheus 三、查看镜像 docker images 四、书写配置文件-以及创建挂载目录 宿主机挂载目录位置&#xff1a; 以及准备对应的挂载目录&#xff1a; /usr/local/docker/promethues/se…

linux之find命令

概览 Linux下find命令在目录结构中搜索文件&#xff0c;并执行指定的操作。Linux下find命令提供了相当多的查找条件&#xff0c;功能很强大。由于find具有强大的功能&#xff0c;所以它的选项也很多&#xff0c;其中大部分选项都值得我们花时间来了解一下。即使系统中含有网络…

ffplay数据结构分析(一)

本文为相关课程的学习记录&#xff0c;相关分析均来源于课程的讲解&#xff0c;主要学习音视频相关的操作&#xff0c;对字幕的处理不做分析 下面我们对ffplay的相关数据结构进行分析&#xff0c;本章主要是对PacketQueue的讲解 struct MyAVPacketList和PacketQueue队列 ffp…

常量池-JVM(十九)

上篇文章说gc日志以及arthas。 Arthas & GC日志-JVM&#xff08;十八&#xff09; 一、常量池 常量池主要放两大类&#xff1a;字面量和符号引用。 字面量就是由字母、数字等构成的字符串或者数值常量。 符号引用主要包含三类常量。 类和接口的全限定名。字段的名称和…

【毕业项目】自主设计HTTP

博客介绍&#xff1a;运用之前学过的各种知识 自己独立做出一个HTTP服务器 自主设计WEB服务器 背景目标描述技术特点项目定位开发环境WWW介绍 网络协议栈介绍网络协议栈整体网络协议栈细节与http相关的重要协议 HTTP背景知识补充特点uri & url & urn网址url HTTP请求和…

python的virtualenv虚拟环境无法激活activate

目录 问题描述&#xff1a; 解决办法&#xff1a; 解决结果&#xff1a; 问题描述&#xff1a; PS D:\pythonProject\pythonProject\DisplayToolLibs\venv\Scripts> .\activate .\activate : 无法加载文件 D:\pythonProject\pythonProject\DisplayToolLibs\venv\Scripts\…

form-create-designer整合element-plus使用方法

最近在使用form-create-designer生成表单的时候遇到了很多问题和各种报错&#xff0c;按照官方文档的方法一步步来做&#xff0c;发现行不通&#xff0c;后来经过不断尝试&#xff0c;终于找到了使用方法&#xff0c;这里做一下总结。 1、安装所需的依赖包 npm install eleme…

Redhat Linux 安装MySQL安装手册

Redhat安装MySQL安装手册 1 下载2 上传服务器、解压并安装3 安装安装过程1&#xff1a;MySQL-shared-5.6.51-1.el7.x86_64.rpm安装过程2&#xff1a;MySQL-shared-compat-5.6.51-1.el7.x86_64.rpm安装过程3&#xff1a;MySQL-server-5.6.51-1.el7.x86_64.rpm安装过程4&#xff…

AWS-自定义ami的S3存取使用

需要提前配置好aws-cli哈 对应的区域 要统一 示例&#xff1a;即AWS-CLI 和 EC2、AMI、S3以上资源均要使用同已区域&#xff0c;以下拿新加坡举例 1.新建自定义AMI 2.查看ami状态 确认是可用状态&#xff0c;才能开始操作 3.aws-cli 开始存入s3 只能使用桶的根目录 开始上…

【golang】工作区与GOPATH

在学习go语言时&#xff0c;我们会从官网下载go语言的二进制包&#xff0c;然后解压并安装到某个目录&#xff0c;最后会配置环境变量&#xff0c;通过输入命令go version来验证是否安装成功。 配置了path环境后&#xff0c;我们还需要再配置3个环境变量&#xff0c;GOROOT、G…

XML(eXtensible Markup Language)

目录 为什么需要XML? 一 XML语法 1.文档声明 2.元素 语法: 3.属性 4.注释 5.CDATA节 二 树结构 三 转义字符 四 DOM4J 1.XML解析技术 2.dom4j介绍 3.dom4j基本使用 XML 指可扩展标记语言&#xff08;eXtensible Markup Language&#xff09;。 XML 被设计用来传…

【新】通达OA前台反序列化漏洞分析

0x01 前言 注&#xff1a;本文仅以安全研究为目的&#xff0c;分享对该漏洞的挖掘过程&#xff0c;文中涉及的所有漏洞均已报送给国家单位&#xff0c;请勿用做非法用途。 通达OA作为历史上出现漏洞较多的OA&#xff0c;在经过多轮的迭代之后已经很少前台的RCE漏洞了。一般来说…

Redis实战案例27-UV统计

1. Redis的HyperLogLog的统计功能 示例&#xff1a; 表明HyperLogLog不管加入重复元素多少次都不会让count&#xff0c;不会计数重复元素&#xff0c;所以适合做UV计数 2. 简单实现UV测试 通过单元测试&#xff0c;向 HyperLogLog 中添加 100 万条数据&#xff0c;看看内存占…

RocketMQ使用

说明&#xff1a;本文介绍RocketMQ的消费模式&消息类型&#xff0c;RocketMQ的安装参考及简单使用&#xff0c;参考&#xff1a;http://t.csdn.cn/BKFPj 消费模式 RocketMQ与RabbitMQ最大的区别在于&#xff0c;RocketMQ是根据消息的Topic锁定消费者的&#xff0c;Topic属…

黑马机器学习day1

1.sklearn数据集 sklearn.datasets datasets.load_*() 获取小规模的数据集 datasets.fetch_*(data_homeNone) 获取大规模数据集 函数的第一个参数是data_home,标识数据集下载目录&#xff0c;默认/scikit_learn_data/ 1.1sklearn小数据集 sklearn.da…

【JAVA】类和对象

作者主页&#xff1a;paper jie的博客 本文作者&#xff1a;大家好&#xff0c;我是paper jie&#xff0c;感谢你阅读本文&#xff0c;欢迎一建三连哦。 本文录入于《JAVASE语法系列》专栏&#xff0c;本专栏是针对于大学生&#xff0c;编程小白精心打造的。笔者用重金(时间和精…

使用eXosip+ffmpeg、ffplay命令行实现sip客户端

文章目录 前言一、关键实现1、主要流程2、解决端口冲突&#xff08;1&#xff09;、出现原因&#xff08;2&#xff09;、解决方法 3、解析sdp&#xff08;1&#xff09;、定义实体&#xff08;2&#xff09;、解析视频&#xff08;3&#xff09;、解析音频 4、命令行推拉流&am…

Python中搭建IP代理池的妙招

在Python的爬虫世界里&#xff0c;你是否也想搭建一个功能强大的IP代理池&#xff0c;让你的爬虫无忧无虑地畅游各大网站&#xff1f;今天&#xff0c;我就来教你使用Scrapy框架搭建IP代理池&#xff0c;让你的爬虫更加智能、高效&#xff01;跟着我一步一步来&#xff0c;轻松…

(力扣)用两个队列实现栈---C语言

分享一首歌曲吧&#xff0c;希望在枯燥的刷题生活中带给你希望和勇气&#xff0c;加油&#xff01; 题目&#xff1a; 请你仅使用两个队列实现一个后入先出&#xff08;LIFO&#xff09;的栈&#xff0c;并支持普通栈的全部四种操作&#xff08;push、top、pop 和 empty&#…

【单片机】51单片机,TLC2543,驱动程序,读取adc

TLC2543 是一款 12 位精密模数转换器 (ADC)。 1~9、11、12——AIN0&#xff5e;AIN10为模拟输入端&#xff1b; 15——CS 为片选端&#xff1b; 17——DIN 为串行数据输入端&#xff1b;&#xff08;控制字输入端&#xff0c;用于选择转换及输出数据格式&#xff09; 16——…