一、为什么要学习 JVM ?
1. “ ⾯试造⽕箭,⼯作拧螺丝” , JVM 属于⾯试官特别喜欢提问的知识点;
2. 未来在⼯作场景中,也许你会遇到以下场景:
- 线上系统突然宕机,系统⽆法访问,甚⾄直接OOM
- 线上系统响应速度太慢,优化系统性能过程中发现 CPU占用过高,原因也许是因为 JVM GC 次数过于频繁;
- 新项⽬上线,需要设置 JVM 的各种参数;
二、JDK\JRE\JVM
- JDK:全称“Java Development Kit ” Java 开发⼯具包,提供 javac 编译器、 jconsole,jheap 等监控⼯具;
- JRE:全称“ Java Runtime Environment ” Java 运⾏环境,提供 Class Library 核心类库+JVM;
- JVM:全称“ Java Virtual Machine ” Java 虚拟机,⽤于运⾏ Java 应⽤程序;
三、Java程序执⾏过程
- 编译:通过 件。 javac 命令,调⽤ JDK 编译器,将
- 执⾏:通过 *.java 源⽂件编译成 *.class 字节码⽂ java 命令,调⽤ JVM 虚拟机,执⾏ *.class 字节码⽂件。
四、Java程序的跨平台
计算机平台是什么?
我们通常把 CPU 处理器与操作系统构成的系统架构,称为计算机平台。
现代的电⼦计算机是基于⼆进制设计实现,所以 CPU 仅能识别 0 与 1 这样的⼆进制信号。⽽ 计算机程序的本质就是 0 与 1 之间的不同组合产⽣的机器指令,交给 CPU 去执⾏。CPU为了能识 别执⾏机器指令,就需要不同 CPU 架构和指令集来⽀持。不同的⼚商,设计⽣产 的 CPU , CPU 架构和指令集也是不同的。
常⻅的指令集主要分为:精简指令集( RISC )和复杂指令集( CISC )。
- 复杂指令集( CISC ): X86 和 X64 两种 CPU 架构基于 CISC 复杂指令集,⽐如: Intel 、 AMD 等⼚商的 CPU 。
- 精简指令集( RISC ): ARM 架构的CPU基于 RISC 精简指令集,⽐如: Compaq 的 Alpha 、 HP 的 PA-RISC 、 IBM 的 Power PC 、 Apple 的 M1 。 在底层硬件及指令集之上,需要搭载不同的操作系统,⽤于⽀持不同的 CPU 指令集。
例如:早 期的 MacOS 操作系统只⽀持 Power 系列的 CPU 。最新的 MacOS 系统只能安装在 M1 芯⽚的 CPU 。
Java 是⼀种跨平台的编程语⾔,主要是为了让相同的 Java 应⽤程序代码,不⽤做任何修 改,可以在不同计算机系统平台上正常运⾏,兼容各种主流操作系统+ CPU 指令集。
跨平台的原因
实现跨平台的原因,主要有两个
- 不同的平台,相同的源代码,编译的字节码是相同的,所以字节码⽂件可以在不同平台“ 通⽤” ;
- 不同的平台,执⾏字节码时,都需要各⾃的 JVM 虚拟机版本,⽤于将字节码翻译成当前平台可 以执⾏的机器码指令;
五、静态编译器
通过 JDK 提供的静态编译器,将Java 源⽂件编译成字节码⽂件。
编译过程包括:
- 词法分析:通过空格分隔出源代码中的单词、操作符、控制符等信息,将其形成 流,传递给语法解析器。
- 语法分析:将 token 信息流按照 Java 语法规则,组装成⼀颗语法树
- 语义分析:对语法树进⾏关键字使⽤、类型匹配、作⽤域等语法检查。
- 字节码:当语义分析完成后,可以⽣成字节码
六、字节码
当1个 Java 源文件被编译后,就会按照 JVM 规范和字节码定义,产生 1个 class 字节
码文件,文件内容由 10 个固定部分组成。前 4 个字节非常特殊,红色框的 cafe babe 是詹姆斯定义的魔法数,它的作用是标志当前文件是一个字节码文件。当 JVM 在进行类加载的 Load 阶段时,如果没有识别到该标志,就说明文件不是字节码文件或已损坏,则无法进行加载。绿色框代表当前版本号,0x34 的十进制为 52 ,是JDK8 的内部版本号,代表这个字节码文件基于 JDK8 编译。
剩余部分中的每个字节均代表一个字节码指令,由于每个指令的长度按照 1 个字节存储,所以每个指令被称为字节码(Bytecode ),Java 所有的字节码指令有 200 多个。
由于纯数字的字节码指令阅读⽐较困难,所以 JVM 在字节码指令的基础上设计了⼀套操作码助 记符,使⽤特殊单词来代替对应的数字指令。
例如:
- 0x15 ILOAD :读取 int 类型的局部变量
- 0x36 ISTORE :保存int类型的局部变量
- 0x60 IADD :执⾏两个 int 类型的数值加法运算
- 0xbb NEW :创建对象
- 0xbc NEWARRAY :创建数组
- 0xac IRETURN :返回 int 类型结果
七、JVM执⾏⽅式
JVM执⾏⽅式
JVM 以解释+编译混合模式,执⾏字节码⽂件。
- JVM 的执⾏⽅式以解释执⾏为主。执⾏过程中, JVM 将每个字节码⽂件中的每个指令,通过 解释器转换成当前平台可以识别的机器码,然后交给CPU 执⾏。
- 为了提⾼执⾏效率, JVM 还会在运⾏期间, JVM 通过热点代码的统计分析,识别⾼频的⽅法 调⽤,循环体、公共模块等,当超过阈值时, JVM 会基于 JIT 即时编译器( me compiler )将热点代码转换成机器码,直接交给 just-in-ti CPU 执⾏,提⾼执⾏效率。
a. Client 模式下默认阈值是 1500 次, Server 模式下是 10000 次。
- ● JVM 解释器:程序执⾏的时候,解释器⾸先发挥作⽤,省去了编译器编译时间,加快程序的执 ⾏效率。
- ● JIT 编译器:在程序运⾏过程中,随着时间的推移, JIT 开始慢慢发挥了作⽤,把热点代码 编译成本地代码后,以后执⾏相同的代码,即可直接交给 CPU 执⾏,带来更⾼的执⾏效率。
机器在热机状态可以承受的负载要⼤于冷机状态(刚启动时 ),如果以热机状态时的流量进⾏切 换,可能使处于冷机状态的服务器因⽆法承载流量⽽假死。所以,在⽣产环境中发布应⽤,应该以分 批的⽅进⾏发布,根据机器数量划分成多个批次,每个批次的机器数⼤概占到整个集群的 15% 。
故障案例:某应⽤在线发布新版本,采⽤进⾏分批发布,发布总批数误填写成分为两批发布。如 果是热机状态,正常情况下,集群中的⼀半的机器可以勉强⽀撑负载流量,但由于刚启动的 JVM 均 是解释执⾏,还没有进⾏热点代码统计和JIT动态编译,导致机器启动之后,当前 1/2 发布成功的 服务器⻢上全部宕机。
八、类加载器
字节码必须通过类加载器,通过加载、验证、解析等校验步骤,将字节码⽂件中的类,加载⾄ JVM 的中运⾏时数据区,才可以执⾏字节码。
类加载器的加载过程
当一个类被使用的时候,才会加载到内存中,类加载的过程有:加载、验证、准备、解析、初始化。其中中间三步合并称为链接。
- - 加载:通过包名+类名,获取这个类,准备用流进行传输,将这个类加载到内存中,并创建一个class对象
- - 验证:验证class文件中的信息是否符合虚拟机规范,有没有安全隐患
- - 准备:负责为类的类变量(static修饰的变量)分配内存,并设置默认的初始化值
- - 解析:将类的二级制数据流中的符号引用替换为直接引用。(本类中如果用到了其他类,此时就需要找到对应的类)
- - 初始化:静态变量赋值以及初始化其他资源
九、垃圾收集器
JVM 在运⾏期间,通过 Garbage Collctor 垃圾收集器,定期对运⾏时数据区进⾏垃圾对 象的回收,从⽽实现了内存⾃动管理。
十、JVM组成结构
JVM 由类加载器、运⾏时数据区、 JVM 解释器、 JIT 即时编译器、垃圾回收器、本地⽅法库等部分组成。
由类加载器完成字节码⽂件的加载验证和解析,存储⾄运⾏时数据区,并由执⾏引擎中的解释 器,完成字节码到机器码的解释执⾏。同时进⾏热点代码的统计分析,调⽤ JIT 即时编译器将字节 码直接编译成机器码,提⾼执⾏效率。JVM运⾏期间的⽅法调、数据对象统⼀存放⾄运⾏时数据区。