深入JVM:详解JIT即时编译器

文章目录

  • 深入JVM:详解JIT即时编译器
    • 一、序言
    • 二、基础概念
      • 1、何为JIT即时编译
      • 2、热点代码
    • 三、HotSpot内置的即时编译器
      • 1、C1编译器
      • 2、C2编译器
      • 3、分层编译
        • 3.1 协作流程
    • 四、常见JIT优化技术
      • 1、方法内联
      • 2、逃逸分析
        • (1)同步锁消除
        • (2)栈上分配
        • (3)标量替换
    • 五、后记


深入JVM:详解JIT即时编译器

一、序言

对于Java工程师而言,深入理解JVM(Java虚拟机)不仅是掌握Java程序运行机制的基础,也是提升系统性能、优化应用和解决复杂问题能力的重要一步,更是Java进阶之路的重中之重。

本文小豪将带大家认识JIT即时编译器,介绍主流HotSpot虚拟机内置的几款即时编译器,同时结合代码实例,着重讲解JIT优化手段,话不多说,我们直接进入正题。

二、基础概念

在之前,网上可能经常说Java语言的运行速度不如C或C++,Java运行速度慢主要是因为它是解释执行的,而C或C++是编译执行的,解释执行需要通过JVM虚拟机将字节码实时翻译成机器码(边翻译边执行),才能运行在操作系统上,这个过程会比编译执行慢。

但现在再说这个结论就不太对了,随着JIT即时编译技术的发展,性能差距正在逐步缩小,甚至在某些情况下,执行速度是优于C或C++的。

1、何为JIT即时编译

在Java程序执行过程中,主要依靠字节码指令来进行。这些字节码指令按照顺序逐行被实时翻译成机器码,以便于在操作系统上运行。当某些方法或代码块(它们都对应特定的字节码)被频繁调用时,这部分代码就被视为热点代码

JVM虚拟机会针对性的对这部分热点代码进行优化编译,将它们从字节码转换为本地机器码,然后将优化后的本地机器码缓存起来,后续再执行时可以直接从缓存中获取并运行,无需再次编译。

完成这个过程的编译器,就称为JIT即时编译器(Just In Time Compiler)。JIT即时编译器显著提升了Java的性能,缩小了与其它编译型语言运行速度的差距。

在这里插入图片描述

2、热点代码

热点代码是指在运行过程中被频繁执行的代码,被即时编译的热点代码有两种,分别是:

  • 被多次调用的方法
  • 被多次执行的循环体

而热点代码由热点探测进行发现,热点探测基于计数器,JVM虚拟机会为每个方法建立对应的计数器,统计方法的执行次数、方法内的循环次数等,如果计数器超过指定阈值,则标识其为热点代码。

方法调用计数器:统计方法被调用的次数

回边计数器:统计方法内循环体代码执行的次数

三、HotSpot内置的即时编译器

主流的HotSpot虚拟机内置了两个JIT编译器:C1(Client Compiler)编译器C2(Server Compiler)编译器,在常用的JDK 8版本中,C1和C2是相互协同工作的。

1、C1编译器

C1编译器注重启动时间和编译时间,编译速度较快,但优化程度相对较低。

C1的优化策略相对简单,也比较轻量级,比如方法内联、公共子表达式消除,C1编译器编译的代码的执行速度通常比C2编译器慢。

2、C2编译器

C2编译器侧重于深度优化,与C1正好相反,C2编译器的编译时间较长,但优化的程度较高。

C2的优化策略比较深度,会进行更高级的优化,比如逃逸分析等,C2编译器编译的代码的执行速度通常比C1编译器快。

C2编译器由于深度优化代码过于复杂,已经很难维护了,从JDK 10开始,Graal编译器已经代替了C2编译器,与C1编译器协同工作

3、分层编译

由于C1和C2编译器在优化方面有不同的侧重点:C1侧重编译速度,C2侧重深度优化。

从JDK 7开始,采用分层编译的方式,C1和C2相互协同,共同发挥作用,HotSpot虚拟机根据代码的运行性能动态的选择具体采用哪个编译器完成优化。

在分层编译中,整个优化过程分为五个层次,对应着不同的优化策略:

  • 第0层:解释器执行,开启Profiling性能监控功能
  • 第1层:C1编译器执行,不开启Profiling,执行不带Profiling功能的C1编译代码
  • 第2层:C1编译器执行,开启Profiling,仅执行带部分Profiling功能的C1编译代码(方法调用次数和循环次数)
  • 第3层:C1编译器执行,开启Profiling,执行带全部Profiling功能的C1编译代码
  • 第4层:C2编译器执行,执行C2编译代码

Profiling性能监控是指在程序执行过程中,收集程序执行的各项数据,包括方法调用次数、循环次数、类型转换等等,收集的数据越多,额外的性能开销越大。

第1层到第3层都是由C1编译器执行的,显然,第1层由于不开启Profiling,执行性能会高于第2层,同时第2层只收集少量数据,第2层的执行性能也会高于第3层(总体性能:第4层 > 第1层 > 第2层 > 第3层 > 第0层)

3.1 协作流程

在分层编译中,C1和C2编译器是相互协作的,它们都由各自独立的线程来处理编译任务,线程内部维护着任务队列,用来存放待编译的热点代码,具体协作流程如下:

  1. 默认情况下,热点方法首先会被第3层的C1编译器执行,当Profiling性能监控收集到的数值达到阈值,JVM会评估C1和C2的优化性能(字节码数较少等)
    • 若判定C1和C2的执行效率相当:交由第1层的C1编译器进行优化,停止Profiling监控,不再收集运行信息
    • 若判定C2执行效率相当优于C1:交由第4层的C2编译器进行深度优化
  2. C1线程忙碌时,会直接交由第4层的C2编译器进行深度优化
  3. C2线程忙碌时,会先交由第2层的C1编译器执行优化,进行信息的初步收集,待C2线程空闲时,再交由第3层的C1编译器执行

在这里插入图片描述

四、常见JIT优化技术

JIT即使编译器主要是通过方法内联逃逸分析两种技术来实现代码的优化。

1、方法内联

方法内联其实就是将被调用方法的字节码直接插入到调用该方法的地方,调用时减少了栈帧的创建销毁开销。

举个例子:

实际上JIT修改的是字节码指令,为便于理解,本文使用代码举例

// 方法内联
public double methodInlining() {
    double num1 = Math.random();
    double num2 = Math.random();
    // 等价于 -> double sum = num1 + num2
    double sum = add(num1, num2);
    return sum;
}

public double add(double num1, double num2) {
    return num1 + num1;
}

在代码中,方法内联会将其中的add(num1, num2)方法转换为实际的num1 + num1,直接进行计算操作,避免了方法调用。

这里我们简单测试一下:

public static void main(String[] args) {
    long startTime = System.currentTimeMillis();
    JitTest demo = new JitTest();
    for (int i = 0; i < 1000000; i++) {
        demo.methodInlining();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

测试代码也比较简单,循环调用百万次,统计总耗时。

首先我们测试不启用JIT优化下这段代码的执行耗时,禁用JIT优化只需要添加JVM参数-Xint即可,禁用后,控制台输出:

执行耗时:881

取消掉禁用参数-Xint,启用JIT优化,重新执行这段测试代码:

执行耗时:47

我们进一步验证一下add方法是否进行了方法内联优化,添加三个JVM参数-XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining,打印JVM优化内容:

  • -XX:+PrintCompilation:输出被JIT编译的方法信息
  • -XX:+UnlockDiagnosticVMOptions:解锁用于诊断JVM的选项,默认关闭
  • -XX:+PrintInlining:打印内联方法

在这里插入图片描述

如图,大量方法都被内联,其中也包括我们自己写的methodInliningadd方法,并且同时打印出了方法对应的字节大小,我们发现这些被内联的方法字节数都比较小。

其实这是由于方法内联也有一点的限制,即字节数过大的方法体不会进行内联,具体限制如下:

  • 非热点代码:默认限制字节数小于35,可通过参数调整限制

    // 非热点代码的内联字节大小最大阈值
    -XX:MaxInlineSize=n
    
  • 热点代码:默认限制字节数小于325,可通过参数调整限制

    // 热点代码的内联字节大小最大阈值
    -XX:FreqInlineSize=n
    
  • 接口实现限制:若接口的实现方法数量超过3个,则不会被内联

2、逃逸分析

逃逸分析核心思想是判断方法内创建的对象是否会被外部所引用,当JIT编译器判断到对象在方法外部不会被引用,即该对象的生命周期被限定在当前方法执行期间,编译器就能采取多种优化措施,比如锁消除、标量替换和栈上分配。

(1)同步锁消除

同步锁消除旨在消除代码中的同步操作,若某个对象不会逃逸出当前方法,只在方法内部使用,则不存在线程安全问题,因为每个方法的栈都是私有的,JIT编译器就会消除该同步锁操作,提高程序的执行效率。

举个例子:

public void syncLockEliminate() {
    // 等价于 -> 不执行该同步锁
    synchronized (JitTest.class) {
        // 业务代码逻辑
    }
}

public static void main(String[] args) {
    long startTime = System.currentTimeMillis();
    JitTest demo = new JitTest();
    for (int i = 0; i < 1000000; i++) {
        demo.syncLockEliminate();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

这里启用和禁用JIT锁消除(禁用锁消除参数:-XX:-EliminateLocks)对应控制台输出的执行耗时分别为:

// 启用锁消除
执行耗时:143

// 禁用锁消除
执行耗时:203
(2)栈上分配

栈上分配是将被创建的对象内存分配在栈上,而不是堆上,降低GC垃圾回收的频率。

举个例子:

static class UserInfo {
    // 姓名
    private String name;
    // 年龄
    private int age;

    public UserInfo() {
    }

    public UserInfo(String name, int age) {
        this.name = name;
        this.age = age;
    }
}

// 栈上分配,不赋值对象属性
public static void createUser() {
    UserInfo user = new UserInfo();
}

public static void main(String[] args) throws Exception {
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 1000000; i++) {
        createUser();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

这里我们验证一下这个结论,我们在JVM参数上添加-XX:+PrintGC,输出GC日志信息,同时将堆内存空间设小一些:

-Xms10m -Xmn10m -XX:+PrintGC

首先默认启用JIT逃逸分析优化,控制台输出:

执行耗时:72

接着禁用逃逸分析优化,添加参数-XX:-DoEscapeAnalysis关闭逃逸分析,控制台输出:

[GC (Allocation Failure)  7679K->1041K(9216K), 0.0010975 secs]
[GC (Allocation Failure)  8721K->904K(9216K), 0.0006550 secs]
[GC (Allocation Failure)  8584K->840K(9216K), 0.0007822 secs]
执行耗时:103

关闭逃逸分析优化后,JVM执行了几次的GC垃圾回收。

(3)标量替换

标量替换是将需要被创建的对象拆解成独立的标量(对象内部的基本数据类型),方法执行时不创建该对象实例,而是直接创建它的成员变量代替它,这些成员变量作为该方法的局部变量被分配在栈上。

标量替换是针对栈上分配更进一步的优化技术,栈上分配只是将对象从堆上分配到栈上,而标量替换是将对象进行拆解,作为方法的局部变量被分配在栈上。

举个例子:

// 标量替换,赋值对象属性
public static void createUser() {
    // 等价于 -> String name = user.name = xiaohao;
    //          int age = user.name = 24
    UserInfo user = new UserInfo("xiaohao", 24);
    String userInfo = user.name + ":" + user.age;
}

public static void main(String[] args) throws Exception {
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 1000000; i++) {
        createUser();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

若JIT判断到UserInfo对象不会逃逸出当前方法,则会将UserInfo对象的nameage属性替换为两个局部变量,不进行创建UserInfo对象,避免在堆上分配对象实例。

控制台输出的执行耗时分别为:

// 启用逃逸分析
执行耗时:162

// 禁用逃逸分析
执行耗时:203

五、后记

本文从JIT即时编译器基础概念开始介绍,着重讲解了常见的JIT优化技术,包括方法内联与逃逸分析,额外拓展了HotSpot虚拟机内置的C1、C2编译器及分层编译协作流程。

JIT即时编译器在运行时对Java字节码进行优化,极大地提升了Java程序的执行效率。不过也要求我们日常编写代码要注意一定的规范,让JIT发挥最大效果。比如控制方法的代码行数,避免写过长的代码方法,可以将复杂的逻辑拆分成多个小方法,提升方法内联的生效几率;另外也可以控制接口的实现数量,尽量不超过两个,降低方法内联的复杂度;以及注意在方法内创建对象时,尽量不让对象逃逸。

如果大家觉得内容有价值,不妨考虑点点赞,关注关注小豪,后续小豪将会继续更新其它Java相关文章,大家共同进步~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/743740.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

从零开始学习Linux(10)----动静态库

目录 1.制作静态库 1.编写源代码 2.编译 3.打包库 4.使用库 2.制作动态库 1.编译 2.打包库 3.总结 3.理解动态库加载 1.站在系统角度理解 2.谈谈编址&#xff0c;可执行程序 1.制作静态库 1.编写源代码 假设你编写了两个源代码文件mymath.c和myprintf.c以及它们对应…

vuex的actions返回结果类型是promise及actions方法互相调用

this.$store.dispatch(‘logout’)返回的结果是Promise类型的 调用成功的情况下&#xff0c;返回状态为fulfilled&#xff0c;值为undefined。 所以可以直接进行.then操作&#xff1a; this.$store.dispatch(logout).then((result) > {console.log(result); });因为 Vuex …

正则表达式;grep、sed、awk、soft、uniq、tr 详解

正则表达式 概念 正则表达式&#xff08;Regular Expression&#xff0c;常简写为regex、regexp或RE&#xff09;是一种强大的文本处理工具&#xff0c;它使用一种特殊的字符序列来帮助用户检查一个字符串是否与某种模式匹配。 标准正则表达式 首先安装正则表达式pcre库 创…

草莓不是莓,西瓜才是莓——解读 Kubernetes 中被驱逐的 Pod

每天都有成千上万的 Pod 从节点中被驱逐。它们无家可归、困惑不已&#xff0c;不得不放弃之前的生活方式。其中一些甚至变成无节点状态。 在 Kubernetes 中 Pod 被驱逐意味着什么&#xff1f;我们常常能看到 Pod 因为资源不足被终止。但为什么会发生这种情况呢&#xff1f; 驱…

ChatGPT API技术教程OpenAI APIKey在线对接-Chat Completion对象

表示模型根据提供的输入返回的聊天完成响应。 {"id": "chatcmpl-123","object": "chat.completion","created": 1677652288,"model": "gpt-3.5-turbo-0125","system_fingerprint": "fp…

ElementUI组件库,分页组件靠右显示

ElementUI组件库&#xff0c;分页组件靠右显示 分页组件 &#xff0c;el-pagination组件默认靠左显示&#xff0c;靠右显示的话只需给layout添加一个“->”属性值即可, 看图

AMEYA360代理品牌江苏润石:RS8661/2/4系列高压精密低噪声运算放大器

继RS8651/2/4系列高压精密低噪声运算放大器成功推向市场&#xff0c;润石科技再次成功量产RS8661/2/4系列高压精密低噪声运算放大器。 RS8661/2/4系列产品将工作电压提升到最高36V(18V)、失调电压进一步优化到5μV、在工业现场数据采集、各种仪器仪表测量设备\分析设备上有着广…

IDEA services模块无法启动springboot服务(添加了springboot但是为空白)

https://blog.csdn.net/m0_54042402/article/details/117918995 https://blog.csdn.net/qq_46550964/article/details/122235235 Alt8 显示services模块 发现有springboot启动模块&#xff0c;点一下springboot之后&#xff0c;这个模块就消失了 会自动在.idea文件夹下的work…

选专业填志愿,家庭经济条件是必须考虑因素

对比过去&#xff0c;大部分家庭的物质条件已经好很多了&#xff0c;但也有一部分家庭条件较为困难&#xff0c;对于家庭条件较为困难的高考学生而言&#xff0c;高考志愿填报需要考虑的因素更多&#xff0c;因为自己就读的专业&#xff0c;绝对不能是自己的家庭无法负担的专业…

数值分析笔记(三)函数逼近

最佳平方逼近 函数逼近是使用一种简单易算的函数来近似表示一个复杂函数。 该问题可转化为求解线性方程组 G n C F n ​ G_{n}CF_{n}​ Gn​CFn​​ 其中&#xff0c;系数 C ( c 0 , c 1 , ⋯ , c n ) T , F n ( ( f , φ 0 ) , ( f , φ 1 ) , ⋯ , ( f , φ n ) ) T C(c…

Java网络编程之UDP通信与TCP通信交互代码实现

​import java.net.InetAddress; import java.io.IOException; class Main {public static void main(String[] args) {try { InetAddress localAddress InetAddress.getLocalHost(); //获得本地主机 InetAddress remoteAddress InetAddress.getByName("www.itcast.cn&qu…

非强化学习的对齐方法

在文章《LLM对齐“3H原则”》和《深入理解RLHF技术》中&#xff0c;我们介绍了大语言模型与人类对齐的“3H原则”&#xff0c;以及基于人类反馈的强化学习方法&#xff08;RLHF&#xff09;&#xff0c;本文将继续介绍另外一种非强化学习的对齐方法&#xff1a;直接偏好优化&am…

【Java】解决Java报错:IllegalMonitorStateException in Synchronization

文章目录 引言一、IllegalMonitorStateException的定义与概述1. 什么是IllegalMonitorStateException&#xff1f;2. IllegalMonitorStateException的常见触发场景3. 示例代码 二、解决方案1. 确保在同步代码块或方法中调用wait()、notify()和notifyAll()2. 使用同步方法3. 使用…

鸿蒙开发系统基础能力:【@ohos.inputMethod (输入法框架)】

输入法框架 说明&#xff1a; 本模块首批接口从API version 6开始支持。后续版本的新增接口&#xff0c;采用上角标单独标记接口的起始版本。 导入模块 import inputMethod from ohos.inputMethod;inputMethod8 常量值。 系统能力&#xff1a;以下各项对应的系统能力均为Sy…

NetSuite Account Merge 科目合并功能分析

最近项目中&#xff0c;客户有提到过能否将不用的Account与新建的Account进行合并&#xff0c;即我们所说的Merge功能&#xff5e;可以&#xff0c;但是该功能有使用的限制&#xff0c;比如最直接的一点需要注意&#xff0c;不同类型的Account是不可以使用Merge功能的&#xff…

Linux系统学习——指令三

Linux系统学习——指令三 Linux系统学习——指令三chmod — 文件执行权限添加文件执行权限去除文件执行权限 查找文件中特定关键字使用vi编辑文件并查找特定关键字文本文件查找特定关键字1: 使用 grep 命令2: 使用 find 命令3: 使用 awk 命令4: 使用 sed 命令5: 使用 ag 命令&a…

一文2000字记录基于jmeter+perfmon的稳定性测试

01、任务情况 1、任务总览 本次平台稳定性测试的目的在于&#xff1a;在服务器压力处于较饱和&#xff08;达到80%系统最大TPS&#xff09;压力之下&#xff0c;在较长时间&#xff08;>8小时&#xff09;之内观测服务器稳定性问题&#xff0c;以及资源使用情况和异常。 …

uniapp或安卓对接扫码枪

背景介绍 最近老板又随便丢过来一个扫码枪让我研究快速上线&#xff0c;我心想着又是什么串口通信吗&#xff0c;结果发现是usb的&#xff0c;我想着是不是有什么协议&#xff0c;结果直接插上电脑或者手机 均可在输入框直接输入&#xff0c;不用任何的代码编写 但结合了一下…

MFC案例:自制工具条(Toolbar)按钮的小程序

程序目标&#xff1a;在基于对话框的MFC项目中&#xff0c;自制三个 Toolbar 按钮&#xff08;用颜色区分&#xff0c;分别为红、绿、蓝&#xff09;&#xff1b;程序运行时&#xff0c;单击红色按钮显示一个红色的填充椭圆&#xff1b;再单击绿色按钮则进行清屏&#xff1b;最…

基于AT89C52单片机的超声波测距设计—数码管显示

点击链接获取Keil源码与Project Backups仿真图: https://download.csdn.net/download/qq_64505944/89456475?spm=1001.2014.3001.5503 C 源码+仿真图+毕业设计+实物制作步骤+10 在这里插入图片描述 题 目: 基于52的超声波测距汽车防撞系统 学生姓名 [姓名] 学 号 [学号…