1、JVM(Java虚拟机):我们java编译时候,下通过把avac把.java文件转换成.class文件(字节码文件),之后我们通过jvm把字节码文件转换成对应的cpu能识别的机器指令(翻译官角色),我们发布一个Java程序,我们只需要发布.class文件即可,不同平台上的jvm是有差异的,对java提供的内容是一致的,但是对不同的操作系统来说是可能不一致的
一、JVM中的内存区域划分
1、jvm其实也是一个进程(任务管理器中看到的java进程),进程运行过程中要从操作系统这里申请一些资源(内存就是其中典型的资源),JVM从系统中申请了一大块内存,这一大块内存给Java程序使用的时候,又根据实际的使用用途划分出不同的空间
(1)堆:代码中new出来的对象,都是在堆里,对象中持有的非静态成员变量,也就是在堆里
(2)栈:本地方法栈(jvm内部的调用关系和局部变量)/虚拟机栈(java代码的调用关系和局部变量)包含了方法的调用关系和局部变量(一般不会关注本地方法栈,默认只得是虚拟机栈)此处中的堆和栈和数据结构中的堆和栈是不一样的
(3)程序计数器:这个区域比较小的空间,专门用来存储下一条要执行的java指令地址
(4)元数据区(以前叫方法区):往往只的是一些辅助性质的,描述性质的属性(例如:文件大小,文件的位置等,这些信息成为元数据)最主要的是保存类的信息,方法的信息,一个程序有哪些类,每个类里有哪些方法,每个方法里面要包含哪些指令,我们写的Java代码if,while,for各种逻辑运算都会被转换成字节码,最后将这些字节码存储到元数据区中,接下来就会按照上述元数据区里记录的字节码依次执行了,带有static变量的就是在类对象中,就存储在元数据区中
(5)堆只有一份,元数据区只有一份,栈和程序计数器可能由N份(每个线程都有自己的栈和程序计数器)
2、JVM的类加载机制
1、类加载指的是Java进程运行的时候,需要把.class文件从硬盘读到内存,并进行一系列的校验和解析的过程(从.class文件到类对象,从硬盘到内存)类加载分5步
(1)加载:把硬盘上的.class文件找到打开文件,读取到文件内容(认为读到的是二进制数据)
(2)验证:确保读到的文件内容是合法的.class文件(字节码文件)格式
(3)准备:给类对象申请内存空间(空间内什么都没有,是默认值全是零)
(4)解析:主要是针对类中的字符串常量进行处理,字符引用转换成直接引用:比如要存储字符串s=“hello”
因为文件中不存在地址这样的概念,地址是内存的地址但是我们这里是硬盘,所以我们需要用偏移量(这就叫符号引用)来找到文件中的hello,之后我们转换到内存上是此时就有地址(直接引用)了就不需要再用偏移量了
(5)初始化:针对类对象完成后续的初始化(还需要执行讲台代码的逻辑,还可能出发父类的加载)
3、双亲委派模型(描述了如何查找.class文件的策略)
1、JVM中进行类加载操作,是有一个专门的模块,称为“类加载器”,类加载器的作用,给他一个全限定类名,java.lang.String给定全限定类名之后找到对应的.class文件,下面是三类加载器,实际上类加载器只是一个父亲,也可以叫单亲
如果最后ApplicationClassLoader没有找到,因为ApplicationClassLoader没有孩子最后就会抛出ClassNotFoundException异常
(1)这样的操作也避免了我们自己写了类与标准类名重复,导致标准库类的功能失效
(2)我们也可以自己写类加载器,此时就不会涉及到双亲委派了
4、垃圾回收机制(GC)(避免内存泄漏问题)
(1)垃圾回收中有一个很重要的问题:STW问题,出发垃圾回收的时候,很可能会是当前程序和其他业务暂停,JAVA现在已经可以把STW的时间控制在1ms之内,影响就很小了
(2)垃圾回收是回收内存,程序计数器和栈不需要GC他们可以自行释放内存,元数据区一般不需要GC一般涉及到类加载,很少涉及到类卸载,堆是主要的GC区域(主要的就是回收对象)
4.1、垃圾回收我们要分两部展开:
(1)识别出垃圾(1.1-1.4)
(2)把标记为垃圾的对象的内存空间进行释放(2.1-)
识别出垃圾:
(1.1)在Java中,适用对象都需要通过引用的方式来使用(匿名对象是例外)
如果一个对象没有任何引用指向他,就是为无法被代码使用,就可以作为垃圾了
简单情况:
(1.2)
当我们局部变量t执行完,也就没有引用指向new Test()了此时new Test()就被认定成垃圾了
较复杂的情况(1.3)(1.4):
(1.3)引用计数:这种思想方法,并没有在JVM中使用,但是他的思想我们需要了解(给对象安排一个额外的空间,空间里要保存当前这个对象有多少个引用)
垃圾回收的时候,如果发现他的引用计数器为0了就定义为垃圾
引用计数器存在两个关键问题:
1)消耗额外的内存空间
2)引用计数可能产生循环引用问题,此时引用计数就无法工作了,这个问题就是可能会两个对象在内部分别对对方进行引用,导致计数器一直不为零
(1.4)可达性分析:本质上使用时间换空间,相比于引用计数,需要消耗额外的时间,是可控的,不会长生循环引用的问题,例如二叉树那样遍历访问,访问不到的就是垃圾
(2.1)把标记为垃圾的对象进行内存空间的释放
(2.2)标记-清除
(2.3)复制算法
将左边不是垃圾的对象复制到内存的另一边(内存碎片问题没了,但是使用的空间小了,而且如果数据很多复制两会很大,会增加很多开销)
(2.4)标记-整理,也能解决内存碎片问题
将后面的元素往前移将释放的垃圾覆盖掉,能解决内存碎片问题,但是移动复制成本依然很大
(2.5)分代回收(取长补短,非常好的回收方式,现在应用的 )
引入对象的年龄,JVM中有专门负责周期想扫面的线程,一个对象扫描一次,能扫描到就不是垃圾,年龄加1,不能扫描到就直接释放掉
第一轮扫描在伊甸区会有很多对象被消灭掉,剩下的线程年龄加1,转移到生存区,第二轮扫描伊甸区和上一轮一样,生存区左边扫描去掉大部分剩下的年龄加1转移到生存区的右边,如果经过若干轮的对象仍然健在,之后我们就转移到老年区,老年区不是不扫描,老年区的扫描频率会降低很多,如果扫描到为引用的对象直接也消灭掉掉