目录
(一)执行引擎概述
(二)Java代码编译和执行过程
(三)机器码,指令,汇编语言,字节码
1、机器码
2、指令
3、指令集
4、汇编
5、字节码
(四)解释器
(五)JIT编译器
(六)为什么两条腿走路
(七)概念解释
(八)什么时候选择JIT
(九)hotspot可以设置程序执行的方式
(十)hotspot中JIT分类
(一)执行引擎概述
执行引擎是Java虚拟机核心的组成部分之一。虚拟机的执行引擎由软件自行实现,物理机的执行引擎是操作系统层面上。执行引擎能够执行不被硬件直接支持的指令格式
执行引擎的工作过程
1、执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于PC寄存器。
2、每当执行完一项指令操作后,PC寄存器就会更新下一条需要被执行的指令地址
3、当然方法在执行的过程中,执行引擎有可能会通过存储在局部变量表中的对象引用准确定位到存储在Java堆区中的对象实例信息,以及通过对象头中的元数据指针定位到目标对象的类型信息
(二)Java代码编译和执行过程
大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前,都需要经过下图中的各个步骤
为什么说Java是半编译半解释型语言
因为JVM既有解释器也有编译器。JVM在执行Java代码的时候,通常会将解释执行与编译执行二者结合起来进行
(三)机器码,指令,汇编语言,字节码
1、机器码
各种采用二进制编码方式表示的指令,叫做机器指令码。机器语言。机器指令与CPU紧密相关,不同种类的CPU所对应的机器指令也就不同
2、指令
由于机器码由01组成,可读性太差。于是人们发明了指令
指令就是把机器码特定的0和1序列,简化成对应的指令,一般为英文编写如mov,inc等,可读性稍好
由于不同的硬件平台,执行同一个操作,对应的机器码可能不同。所以不同的硬件平台的同一种指令,对应的机器码也可能不同
3、指令集
不同硬件平台,各自支持的指令,是有差别的。因此每个平台所支持的指令,称之为对应平台的指令集
x86指令集,对应的x86架构的平台
ARM指令集,对应的是ARM架构的平台
4、汇编
由于指令的可读性太差,于是又有了汇编语言
汇编语言用助记符代替机器指令的操作码,用地址符号或标号,代替指令或操作数的地址。
汇编语言要翻译成机器指令码,计算机才能识别和执行
5、字节码
字节码是一种中间状态的二进制代码(文件),它比机器码更抽象,需要直译器转译后才能成为机器码
字节码主要为了实现特定文件运行和软件环境,与硬件环境无关
字节码的实现方式是通过编译器和虚拟机器。编译器将源码编译成字节码。
特定平台上的虚拟机器将字节码转译为可以直接执行的指令
(四)解释器
当Java虚拟机启动时,会根据预定义的规范对字节码采用逐行解释的方式执行,将每条字节码文件中的内容翻译为平台的本地机器指令执行
解析器真正意义上所承担的角色就是一个运行时翻译者,将字节码文件中的内容翻译为对应的平台的本地机器指令执行
当一条字节码指令被解释执行完成后,接着在根据PC寄存器中的记录下一条需要被执行的字节码执行解释执行
现在普遍使用的模板解释器是将每一条字节码和一个模板函数相关联,模板函数直接产生这条字节码执行时的机器码,提高解释器的性能
HotSpot中
- Interpreter模块
- 实现了解释器的核心功能
- Code模块
- 用于管理HotSpot在运行时生成的本地机器指令
(五)JIT编译器
就是虚拟机将源代码直接编译成和本地机器平台相关的机器语言
JVM平台支持一种叫做即时编译的技术,目的是避免解释执行,而是将整个函数体编译成机器码,每次函数执行时,只执行编译后的机器码即可。使执行效率大幅提升
(六)为什么两条腿走路
即为什么hotspot即有解释器又有编译器?
首先程序启动后,解释器可以马上发挥作用,省去编译时间,立即执行
编译器要想发挥作用,把代码编译成本地代码,需要一定的执行时间。但编译为本地代码后执行效率更高
对于服务端应用,启动时间并非关注重点,但是对于看重启动时间的应用场景,就需要找到一个平衡点。
当Java虚拟机启动时,解释器可以首先发挥作用,而不是等待即时编译器全部编译完成后再执行,这样可以省去很多不必要的编译时间,随着时间的推移,编译器发挥作用,把越来越多的代码编译成本地代码,获得更高的执行效率
(七)概念解释
- 前端编译器
- 把.java文件转换为.class文件的过程
- sun的Javac,
- 把.java文件转换为.class文件的过程
- 后端运行期编译器
- 把字节码转为机器码的过程
- JIT编译器:hotSpot的C1,C2编译器
- 把字节码转为机器码的过程
- 静态提前编译器
- Ahead of Time Compliler AOT,直接把.java文件编译器本地机器代码的过程
- GNU Compiler for the Java(GCJ)
- Ahead of Time Compliler AOT,直接把.java文件编译器本地机器代码的过程
(八)什么时候选择JIT
需要根据代码被调用执行的频率而定,需要被编译为本地代码的字节码,也称之为热点代码。
JIT编译器会在运行时针对频繁调用的热点代码做出深度优化,将其直接编译为对应平台的本地机器指令。以此提升Java程序的执行性能
一个被多次调用的方法,或者方法体内部循环次数较多的循环体,都可以被称之为热点代码
因此可以通过JIT编译器编译为本地机器指令,由于这种编译方法发生在方法的执行过程中,因此也被称之为栈上替换,OSR On Statck Replacement
那么一个方法调用都少次才能达到标准?这个需要依靠热点探测功能
hotspot采用的基于计数器的热点探测。方法计数器和回边计数器
1、方法调用计数器
- 统计方法调用次数,当一个方法被调用时,如果不存在已被编译过的版本,则将此方法的调用计数器+1,然后判断方法调用计数器与回边计数器之和,是否超过方法调用计数器的阈值。如果已经超过,会向即时编译器提交一个该方法的代码编译请求。
- 默认阈值,Client模式下是1500次,Server模式下是10000次
- -XX:CompileThreshold
2、统计循环体执行的循环次数
3、热度衰减
当超过一定的时间限度,如果方法调用次数仍然不足以提交即时编译器编译,那么这个方法的调用计数器就会被减少一半。
-XX:UseCounterHalfLifeTime参数设置半衰周期的时间,单位是秒
(九)hotspot可以设置程序执行的方式
-Xint:完全采用解释器模式执行
-Xcomp完全采用即时编译器模式执行,如果即时编译器出现问题,解释器会介入执行
-Xmixed采用解释器+即时编译器的混合模式共同执行(默认)
(十)hotspot中JIT分类
hotspot中内置两个JIT编译器,分别是client 和 server
大多情况下简称C1,C2
- -client:指定Java虚拟机在Client模式下,并使用C1编译器
- C1编译器会对字节码进行简单和可靠的优化,耗时短,以达到更快的编译速度
- 方法内联:将引用的函数代码编译到引用点处,减少栈帧的生成,减少参数传递以及跳转过程
- 去虚拟化:对唯一的实现类进行内联
- 冗余消除:在运行期把一些不会执行的代码折叠掉
- C1编译器会对字节码进行简单和可靠的优化,耗时短,以达到更快的编译速度
- -server:指定虚拟机在server模式下,并使用C2编译器
- C2进行耗时较长的优化,以及激进优化,单优化后的代码执行效率更高
- 逃逸分析是优化的基础,基于逃逸分析在C2上有几种优化
- 标量替换:用标量值代替聚合对象的属性值
- 栈上分配:对于未逃逸的对象分配在栈而不是堆
- 同步消除:清除同步操作,通常指synchronized
- 逃逸分析是优化的基础,基于逃逸分析在C2上有几种优化
- C2进行耗时较长的优化,以及激进优化,单优化后的代码执行效率更高
总结:
一般来讲,JIT编译出来的机器码性能比解释器高;C2编译器启动时长比C1编译器慢,系统稳定执行以后,C2编译器执行速度远远快于C1编译器。