Java 堆外内存及调优

文章目录

  • 直接内存简介
    • 为什么DirectByteBuffer可以优化 IO 性能
  • 直接内存的分配
  • 直接内存的回收
  • 直接内存跟踪与诊断

直接内存简介

直接内存(Direct Memory) 并不是虚拟机运行时数据区的一部分,并非Java虚拟机规范中定义的内存区域。但是这部分内存的频繁使用,也可能导致 OutOfMemoryError 异常。

直接内存的分配不受Java堆大小的限制,但是受限于本机总内存大小和处理器寻址空间。一般服务器运维人员会根据实际内存设置-Xmx等参数,但经常忽略直接内存,使得动态扩展时出现 OutOfMemeoryError 异常。

JDK 1.4中加入了NIO类,引入一种基于通道(Channel)缓冲区(Buffer)的I/O方式,它可以使用 Native 函数库直接分配堆外内存。这样在一些场景中能显著提高性能,避免在 Java 堆中和 Native 堆中来回复制数据


为什么DirectByteBuffer可以优化 IO 性能

普通 IO 流读取磁盘中数据时,内核态需要将磁盘中的数据拷贝到系统缓冲区 Page Cache(内核地址空间),再从内核态拷贝到用户空间中,C 程序里操作的就是用户态的内存。

JVM 启动时在用户态申请一块内存,这块内存中包含了 Java 堆,几乎所有创建的对象和数组都分配在堆上,堆上的实例受 GC 管理。除了Java堆,其余内存称为 堆外内存,如果使用JNI直接调用 C 函数申请堆外内存(直接内存),这块堆外内存不会进行垃圾回收(例如:Direct Memory 由 malloc 分配)。

Java 程序中进行文件的读操作:

  1. 首先在内核态,将数据从磁盘中读取到系统缓存区中
  2. 再从系统缓冲区拷贝到用户态的堆外内存(JVM实现)
  3. 然后再从堆外拷贝到 Java 堆内的 byte 数组(用户地址空间)。

读操作示意图如下:


上述传统 Java IO方式,经历了两次内存拷贝,而NIO中使用 DirectByteBuffer,不需要将数据从堆外拷贝到堆内,Java程序可以直接访问堆外的 Direct Memory,减少了一次内存拷贝,也减轻了 GC 压力,降低了Java堆内存占用。示意图如下:


为什么数据不能直接从系统缓冲区拷贝到 Java 堆
笔者认为原因主要在于 GC 会改变堆内对象的内存地址,例如:Young GC 时Eden 区存活对象会被拷贝到 Survivor 区。而内核态向用户态的数据拷贝是由内核完成的,并不受 Java 程序控制

因此,需要先拷贝到堆外内存(这个区域不会发生 GC,地址不改变),再从堆外内存拷贝数据到Java堆中。Java 堆内存和堆外内存同属用户地址空间,拷贝可由 Java 虚拟机完成。


Java Direct Buffer用于执行很大数据量的IO密集操作时,存在很大的性能优势

  • Direct Buffer 是使用malloc进行的堆外分配,生命周期内内存地址都不会再发生更改,进而内核可以安全地对其进行访问,很多 IO 操作会很高效。
  • 减少了堆内对象存储的可能额外维护工作(例如:垃圾回收时位置的移动),所以访问效率可能有所提高。
  • Direct Buffer 的使用能提高网络和文件IO效率,因为省去了从本地堆到Java堆的拷贝,降低 Java 堆的内存占用从而减轻了GC压力。
    • Direct Buffer的创建和销毁比堆内Buffer增加部分开销,通常都建议用于长期使用、数据较大的场景

直接内存的分配

  1. 通过NIO中的DirectByteBuffer实例引用直接内存
public static void main(String[] args) {
    ByteBuffer buffer = ByteBuffer.allocateDirect(1024);
    // ...
}

allocateDircet 方法返回 DirectByteBuffer 实例:

public static ByteBuffer allocateDirect(int capacity) {
    return new DirectByteBuffer(capacity);
}
  1. DirectByteBuffer 类的构造函数中,通过Unsafe#allocateMemory分配直接内存空间,并且创建对应的 Cleaner 实例用于回收直接内存,Cleaner 实例是一个指向 DirectByteBuffer 实例的虚引用
DirectByteBuffer(int cap) {                   
    super(-1, 0, cap, cap);
    boolean pa = VM.isDirectMemoryPageAligned();
    int ps = Bits.pageSize();
    // 多配分一个内存页, 用于直接内存起始地址对齐
    long size = Math.max(1L, (long)cap + (pa ? ps : 0));
    // 尝试保留size大小的内存, 如果内存不够, 处理pending链表上的引用
    // 内存仍然不足,则显式GC, 将不可达的引用放入pending链表中, 再从pending回收内存
    // 内存不够, 则抛出OOM错误
    Bits.reserveMemory(size, cap);

    long base = 0;
    try {
        // base为直接内存的基址
        base = unsafe.allocateMemory(size);
    } catch (OutOfMemoryError x) {
        Bits.unreserveMemory(size, cap);
        throw x;
    }
    // 将分配到的直接内存每一个Byte设置为0
    unsafe.setMemory(base, size, (byte) 0);
    // 如果需要直接内存对齐, 且基址base不整除pageSize, 则调整起始地址为base+pageSize减去base%pageSize
    if (pa && (base % ps != 0)) {
        // address为ByteBuffer缓冲区可使用部分的起始地址
        address = base + ps - (base & (ps - 1));
    } else {
        address = base;
    }
    // CLeaner 持有 DirectByteBuffer 的幻影(虚)引用
    // Deallocator实现Runnable接口, 执行释放直接内存的操作
    cleaner = Cleaner.create(this, new Deallocator(base, size, cap));
    att = null;
}

直接内存的回收

Cleaner类继承虚引用 PhantomReference,虚引用的referent字段指向 DirectByteBuffer 实例。

虚引用:最弱的引用关系,一个对象是否有虚引用存在不对其生存时间构成影响,也无法通过虚引用获取对象实例,get 方法返回null

为一个对象设置虚引用关联的唯一目的是能在这个对象被收集器回收时收到系统通知。

public class Cleaner extends PhantomReference<Object> {
    ...
    // Cleaner.create: var1传入DirectByteBuffer引用, var2传入Deallocator实例
    private Cleaner(Object var1, Runnable var2) {
        super(var1, dummyQueue);// DirectByteBuffer作为虚引用
        this.thunk = var2; // 
    }
    public static Cleaner create(Object var0, Runnable var1) {
        return var1 == null ? null : add(new Cleaner(var0, var1));
    }
}

DirectByteBuffer 实例不存在强引用后,垃圾回收时它的 PhantomReference 实例会被放入 pending 链表,等待 ReferenceHandler 线程将它从 pending 链表中取出,加入到引用队列queue中。

ReferenceHandler 线程执行逻辑实现于 tryHandlePending 方法:

从 pending 链表中取出头部的 Reference 实例,如果引用实例为 Cleaner 类型,需要调用它的 clean 方法释放直接内存。随后,将 Reference 实例加入到引用队列 queue 中。

public void run() {
    while (true) {
        tryHandlePending(true);
    }
}

static boolean tryHandlePending(boolean waitForNotify) {
    Reference<Object> r;
    Cleaner c;
    try {
        synchronized (lock) {
            if (pending != null) {
                r = pending;
                // Cleaner继承了虚引用, 需要调用clean方法, 因此特判。
                c = r instanceof Cleaner ? (Cleaner) r : null;
                // pending头节点更新为r的下一个节点
                pending = r.discovered;
                r.discovered = null;
            } else {
                // pending链表中元素为空, wait-notify等待唤醒
                if (waitForNotify) {
                    lock.wait();
                }
                // retry if waited
                return waitForNotify;
            }
        }
    }// ...
    // 如果Reference类型为Cleaner, 需要调用clean方法, 直接内存此时会被回收
    if (c != null) {
        c.clean();
        return true;
    }
    // 将Reference实例加入到引用队列中
    ReferenceQueue<? super Object> q = r.queue;
    // 注册了引用队列, 则入队, 入队后修改r.queue = ReferenceQueue.ENQUEUED, next指向队列中的后继
    if (q != ReferenceQueue.NULL) q.enqueue(r);
    return true;
}

从 pending 链表取出时,会调用 Cleaner#clean方法,clean方法会调用运行 Unsafe#freeMemory 释放直接内存。

// Cleaner
public void clean() {
    if (remove(this)) {
        try {
            this.thunk.run(); // thunk为Deallocator实例
        } // catch
    }
}

// private static class Deallocator implements Runnable
public void run() {
    if (address == 0) {
        // Paranoia
        return;
    }
    // 释放直接内存, address为直接内存基址
    unsafe.freeMemory(address);
    address = 0;
    Bits.unreserveMemory(size, capacity);
}

Direct Buffer 性能优化方面的建议:

  • 应用程序中,System.gc() 触发Full GC,将 DirectByteBuffer 回收时调用 Cleaner#clean 方法释放直接内存。
    不要开启 -XX:+DisableExplicitGC 禁用显式GC,默认不禁用;
    使用 -XX:+ExplicitGCInvokesConcurrent 改变 Full GC 的行为(配合 CMS 使用)。添加该选项后,垃圾收集线程在可达性标记阶段与用户线程并发运行,减少了STW的时间

  • 另一种思路是,在大量使用Direct Buffer的部分框架中,框架会自己程序中显式地调用Unsafe#freeMemory方法,例如Netty。(使用反射获取 Unsafe 实例,再调用成员方法 freeMemory)

  • 重复利用 Direct Buffer,减少它的创建和销毁。

直接内存跟踪与诊断

直接内存的容量大小可通过 -XX:MaxDirectMemorySize 参数指定,默认与 Java堆最大值一致。
使用反射越过 DirectByteBuffer 类,直接通过反射获取 Unsafe 实例(theUnsafe静态属性),进行内存分配。

Field theUnsafe = Unsafe.class.getDeclaredField("theUnsafe");
theUnsafe.setAccessible(true);
// theUnsafe为static final字段
Unsafe unsafe = (Unsafe) theUnsafe.get(null);
// 分配直接内存
long address = unsafe.allocateMemory(1024);
unsafe.freeMemory(address);

由直接内存导致的内存溢出,在Heap Dump文件中不会看见明显的异常情况。如果发现内存溢出后,产生的Dump文件很小,而程序中直接或间接使用了Direct Memory(NIO),就可以考虑检查直接内存溢出


通常的垃圾收集日志等记录,并不包含 Direct Buffer 等信息。从JDK 1.8开始,可以使用 Native Memory Tracking(NMT) 特性来进行诊断,可以在程序启动时加上下面参数:

-XX:NativeMemoryTracking={summary|detail}

运行时,采用如下命令交互式对比:

// 打印NMT信息
jcmd <pid> VM.native_memory detail

// 进行baseline,以对比分配内存变化
jcmd <pid> VM.native_memory baseline

// 对比baseline, 显示出各个部分内存的变化
jcmd <pid> VM.native_memory detail.diff

下面案例中,先使用 VM.native_memory 的 baseline 命令,作为对比的参照;当打印出 Begin allocate 后,执行detail.diff,进行对比。

public class DirectMemory {
    public static void main(String[] args) {
        try {
            Thread.sleep(40000);// 进行baseline, 作为比对的参照
            System.out.println("Begin allocate: ...");
            ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 3);    
            Thread.sleep(40000);    
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

结果如下图所示,Internal部分的内存增加了3078KB,3MB = 3072KB

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/507905.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Vue.js高效前端开发(增删查)

效果图 代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head><body><div id"app"><span>ID</span><input type"text" name"…

javaWeb项目-家政服务管理系统功能介绍

项目关键技术 开发工具&#xff1a;IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架&#xff1a;ssm、Springboot 前端&#xff1a;Vue、ElementUI 关键技术&#xff1a;springboot、SSM、vue、MYSQL、MAVEN 数据库工具&#xff1a;Navicat、SQLyog 1、B/S结构简介 B/S…

unity学习(80)--disposed object

1.在正常运行的过程中&#xff0c;客户端崩溃&#xff0c;原因就是某个对象null或者被disposed了 2.找了找&#xff0c;发现socket确实调用过一次close 3.把close去掉修改为如下&#xff0c;客户端不再崩溃&#xff0c;虽然还有异常。

如何快速生成视频二维吗?视频用二维码播放的方法

视频的二维码如何制作会更加简单呢&#xff1f;通过扫码播放视频的方式现在越来越多&#xff0c;很多小伙伴也喜欢用这种方式来将视频分享给其他人。将视频储存到云端储存之后&#xff0c;通过扫描二维码在手机上浏览器视频&#xff0c;更加的方便快捷。 现在视频生成二维码可…

什么是ISP住宅IP?相比于普通IP它的优势是什么?

什么是ISP住宅IP&#xff1f; ISP住宅IP是指由互联网服务提供商&#xff08;ISP&#xff09;分配给住宅用户的IP地址。它是用户在家庭网络环境中连接互联网的标识符&#xff0c;通常用于上网浏览、数据传输等活动。ISP住宅IP可以是动态分配的&#xff0c;即每次连接时都可能会…

红酒:从新世界到旧世界,红酒产区的分类与发展

红酒产区的分类与发展是葡萄酒产业中一个重要的话题。从新世界到旧世界&#xff0c;各个产区的风格和特点都有所不同&#xff0c;也在不断发展和演变。 新世界产区包括美国、澳大利亚、新西兰、智利、阿根廷、南非等新兴葡萄酒生产国。这些国家在葡萄酒产业方面相对较新&#…

【前端】FreeMarker学习笔记

文章目录 1. 介绍2.FreeMarker环境搭建(maven版本)3. 语法3.1 freemarker的数据类型3.1.1 布尔类型3.1.2 日期类型 FreeMarker视频教程 1. 介绍 中文官网 英文官网 FreeMarker 是一款 模板引擎&#xff1a; 即一种基于模板和要改变的数据&#xff0c; 并用来生成输出文本(HTML…

嵌入式系统基础知识(一):嵌入式系统是什么?

一.定义 根据IEEE&#xff08;国际电气和电子工程师协会&#xff09;的定义&#xff0c;嵌入式系统是“控制、监视或者辅助设备、机器和车间运行的装置”。这主要是从应用上加以定义的&#xff0c;从中可看出嵌入式系统是软件和硬件的综合体&#xff0c;还可以涵盖机械等附属装…

测开——基础理论面试题整理

1. 测试流程 需求了解分析需求评审制定测试计划【包括测试人员、时间、每人负责的模块、测试的风险项以及预防】编写自动化测试用例 —— 测试评审【尽量丰富测试点】编写测试框架和脚本&#xff08;若是功能测试 可省去这步骤&#xff09;执行测试提交缺陷报告测试分析与评审…

【C++杂货铺】详解list容器

目录 &#x1f308;前言&#x1f308; &#x1f4c1; 介绍 &#x1f4c1; 使用 &#x1f4c2; 构造 &#x1f4c2; 迭代器iterator &#x1f4c2; capacity &#x1f4c2; modifiers &#x1f4c2; 迭代器失效 &#x1f4c1; 模拟实现 &#x1f4c2; 迭代器的实现 &#x…

neo4j使用详解(六、cypher即时时间函数语法——最全参考)

Neo4j系列导航&#xff1a; neo4j及简单实践 cypher语法基础 cypher插入语法 cypher插入语法 cypher查询语法 cypher通用语法 cypher函数语法 6.时间函数-即时类型 表示具体的时刻的时间类型函数 6.1.date函数 年-月-日时间函数&#xff1a; yyyy-mm-dd 6.1.1.获取date da…

注意力机制篇 | YOLOv8改进之在C2f模块添加级联群体注意力机制CGAttention | CVPR 2023

前言:Hello大家好,我是小哥谈。级联群体注意力机制(Cascading Group Attention)是一种注意力机制,它通过对输入序列进行逐级处理来捕捉不同层次的语义结构。该机制主要由两个关键部分组成:群体注意力和级联过程。在具体实现上,级联群体注意力机制通过构建一个层次结构,…

YOLOv9改进策略 :主干优化 | 极简的神经网络VanillaBlock 实现涨点 |华为诺亚 VanillaNet

💡💡💡本文改进内容: VanillaNet,是一种设计优雅的神经网络架构, 通过避免高深度、shortcuts和自注意力等复杂操作,VanillaNet 简洁明了但功能强大。 💡💡💡引入VanillaBlock GFLOPs从原始的238.9降低至 165.0 ,保持轻量级的同时在多个数据集验证能够高效涨点…

【Java核心能力】常用的设计模式了解吗?项目中用过哪些设计模式

欢迎关注公众号&#xff08;通过文章导读关注&#xff1a;【11来了】&#xff09;&#xff0c;及时收到 AI 前沿项目工具及新技术的推送&#xff01; 在我后台回复 「资料」 可领取编程高频电子书&#xff01; 在我后台回复「面试」可领取硬核面试笔记&#xff01; 文章导读地址…

linux:生产者消费者模型

个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数据结构》 《C语言》《C》《Linux》 文章目录 前言一、生产者消费者模型二、基于阻塞队列的生产者消费者模型代码实现 总结 前言 本文是对于生产者消费者模型的知识总结 一、生产者消费者模型 生产者消费者模型就是…

Vue小练习:记录任务所花费时间

文章目录 笔记遇到的问题&#xff08;有解决方案的&#xff09;如何使用按钮控制一个页面是否显示vue怎么向后端发送请求如何添加新功能&#xff1f;如何接收前端发送的数据&#xff1f;如何把一个类对象存储到数据库如何实现自动注入 未解决的问题无法将该差值表达式放到一个方…

chatglm.cpp编译与执行

ChatGLM3介绍 ChatGLM3是由智谱AI和清华大学KEG实验室联合发布的对话预训练模型。作为第三代大型语言模型&#xff0c;ChatGLM3不仅理解和生成人类语言&#xff0c;还能执行代码、调用工具&#xff0c;并以markdown格式进行响应。其目标是打造更智能、更安全的代码解释器和工具…

内存泄漏检查工具下载(vld)

前言&#xff1a;在我们向内存申请动态空间的时候&#xff0c;如果使用完之后不将申请的空间释放&#xff0c;就会造成内存泄漏的情况&#xff0c;但是一般情况下&#xff0c;我们是无法通过运行代码来知道是否造成了内存泄漏&#xff0c;所以vld就成为了检查内存是否泄漏的好帮…

ElasticSearch理论指导

引子 本文致力于ElasticSearch理论体系构建&#xff0c;从基本概念和术语讲起&#xff0c;具体阐述了倒排索引和TransLog&#xff0c;接着讲了ElasticSearch的增删改查的流程和原理&#xff0c;最后讲了讲集群的选举和脑裂问题。 前言 大碗宽面-Kafka一本道万事通&#xff0…

MySQL之存储引擎,详细总结

在介绍存储引擎之前我们先了解了解MySQL的体系结构&#xff1a; 连接层 最上层是一些客户端和链接服务&#xff0c;主要完成一些类似于连接处理、授权认证、及相关的安全方案。服务器也会为安全接入的每个客户端验证它所具有的操作权限 服务层 第二层架构主要完成大多数的核心…