ElasticSearch集群内存占用高?如何降低内存占用看这篇文章就够啦!(冻结索引)

ElasticSearch集群内存占用高?如果降低内存占用看这篇文章就够啦

一、冻结索引的介绍

经常搜索的索引被保留在内存中,因为重建索引和帮助高效搜索需要花费时间。另一方面,可能存在我们很少访问的索引。这些索引不需要占用内存,可以在需要时进行重建。这样的索引称为冻结索引
每当搜索分片时,Elasticsearch都会构建冻结索引的每个分片的即时数据结构,并在搜索完成后立即丢弃这些数据结构。因为Elasticsearch不会在内存中维护这些临时数据结构,所以冻结索引消耗的堆要比普通索引少得多。与其他方式相比,这允许更高的磁盘与堆的比率。
在这里插入图片描述
总结来说索引的冻结是Elasticsearch提供的一个用于减少内存开销的操作,这个功能在7.14版本中被标记为​​Deprecated​​,在Version 8以后,已经对堆内存的使用进行了改进,冻结和解冻的功能不再适用,但在Version 8以前的版本中不失为一个可行的优化方案。

二、索引冻结和解冻示例及注意事项

冻结和解冻示例
POST /index_name/_freeze  -- 冻结
POST /index_name/_unfreeze  -- 解冻

冻结索引示例

冻结索引

  1. 预期对冻结索引的搜索将缓慢执行。冻结索引不适用于较高的搜索负载。对未冻结的索引进行的搜索在几毫秒内完成,对冻结索引的搜索也可能需要数秒或数分钟才能完成。
  2. 索引冻结以后除了保存一些必要的元数据信息意外,将不再占用系统负载,索引将会变成只读,不再提供写入的能力,类似force
    merge等操作也将无法执行。
  3. 冻结特别注意:当前正在写的索引不能被冻结,并且执行了冻结操作以后,会将索引先进行close,然后再open,在这段时间内,可能导致主分片没有被分配,集群可能短暂出现red状态,open结束后恢复。
  4. 冻结索引是一个阻塞操作,意味着在冻结期间,该索引将无法进行任何写入和读取操作。因此,在使用冻结和解冻命令时,请确保在适当的时间进行操作,以避免对索引的可用性造成负面影响。
    解冻索引示例
    解冻索引
  5. 需求解冻的过程中,同样会将索引先进行close,然后再open,在这段时间内,索引不可查询,集群可能短暂出现red状态,open结束后恢复。
  6. 解冻特别注意:在再次冻结索引之前,一定要运行“force_merge”,以确保最佳性能。
  7. 解冻后,该索引将重新启用新的文档写入,并恢复正常的搜索和读取操作。

三、搜索冻结索引

  1. 索引被冻结后如果按照之前的查询语句请求数据是拿不到数据的,示例如下:

冻结索引
冻结索引后查询

  1. 每个节点的并发加载的冻结索引数受search_throttled线程池中的线程数限制,默认情况下为1。要包含冻结索引,必须使用查询参数?ignore_throttled = false来执行搜索请求。
    在这里插入图片描述

四、冻结索引在Java代码中的实现

  1. 首先需要引入ElasticSearch的依赖,这里我使用的是7.6.2,冻结索引的概念存在于7.X版本中,如果你的es版本低于7.X,请记得升级版本
<!-- 新增 elasticsearch相关依赖 -->
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch</artifactId>
            <version>7.6.2</version>
        </dependency>
        <!-- elasticsearch的客户端 -->
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-high-level-client</artifactId>
            <version>7.6.2</version>
        </dependency>

在 Elasticsearch 6.X 版本中,searchRequest.setIgnoreThrottled(false) 方法已经被废弃。取而代之的是使用 IndicesOptions 类来设置索引选项。要设置 ignoreThrottled 参数为 false,您可以使用 IndicesOptions.fromOptions() 方法并传递适当的参数。

  1. 以下是一个示例代码片段,展示如何通过其他方法将 ignoreThrottled 参数设置为 false:
import org.elasticsearch.action.search.SearchRequest;  
import org.elasticsearch.indices.options.IndicesOptions;  
  
// 创建 SearchRequest 对象  
SearchRequest searchRequest = new SearchRequest("index_name");  
  
// 设置 IndicesOptions 对象  
IndicesOptions options = IndicesOptions.fromOptions(false, false, false, false, false, false, false, false);  
searchRequest.indicesOptions(options);  
  
// 执行搜索请求  
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);  
  
// 处理搜索结果  
SearchHit[] hits = searchResponse.getHits().getHits();  
// 处理搜索结果...

在上述代码中,我们首先创建了一个 SearchRequest 对象,然后使用 IndicesOptions.fromOptions() 方法创建了一个 IndicesOptions 对象,并将参数设置为 false。接下来,我们通过调用 searchRequest.indicesOptions(options) 将该选项对象设置到搜索请求中。这样,搜索请求将遵循指定的索引选项,而不使用默认的 ignoreThrottled 参数值。

  1. 注意:请确保将 “index_name” 替换为您要搜索的实际索引名称,并根据您的需求调整其他参数。此外,由于 Elasticsearch
    的版本更新和 API 变化,建议查阅官方文档以获取最新和准确的信息。

五、解决Elasticsearch集群内存占用高的问题方法集锦:

Elasticsearch集群内存占用高的问题可能有多种原因,解决方法也会因情况而异。以下是一些可能的解决方法:

  1. 优化查询语句:确保查询语句简洁、高效,避免不必要的聚合和排序操作。这可以减少查询过程中的计算量和内存消耗。
  2. 分页查询:对于大量数据的查询,尽量使用分页查询,避免一次性查询大量数据。通过限制返回的文档数量,可以减少内存消耗。
  3. 调整索引设置:根据实际需求,调整索引的设置,如最大字段长度、分析器等。避免索引过多的数据,以降低内存消耗。
  4. 调整分片和副本:根据实际需求,调整分片和副本的数量。过多的分片和副本可能会导致内存占用增加。
  5. 监控内存使用情况:使用Elasticsearch提供的监控工具,如Elasticsearch
    Monitoring、Elasticsearch Head等,及时发现内存使用异常,采取相应措施。
  6. 调整JVM内存设置:根据实际情况,调整Elasticsearch
    JVM的内存设置。通过合理分配JVM堆大小和垃圾回收设置,可以优化内存使用效率。
  7. 定期清理数据:对于不再需要的旧数据,及时删除或归档,以释放内存空间。
  8. 使用更新的Elasticsearch版本:定期更新Elasticsearch版本,因为每个版本都会进行性能优化和改进。使用最新的稳定版可能有助于降低内存消耗。
  9. 分布式查询:如果单个节点的性能不足以满足查询需求,可以考虑使用分布式查询。将查询请求分散到多个节点上执行,可以加快查询速度并降低单节点内存消耗。
  10. 使用缓存:如果查询结果是可以缓存的,尽量利用缓存来提高查询性能。将经常使用的查询结果缓存起来,可以避免重复计算,提高查询效率。

综上所述,解决Elasticsearch集群内存占用高的问题需要从多个方面入手,包括优化查询语句、调整索引和分片设置、监控内存使用情况、调整JVM内存设置、定期清理数据、使用更新的Elasticsearch版本、分布式查询和使用缓存等。根据实际情况选择合适的解决方法可以有效地降低内存消耗并提高查询性能。

有关冻结索引的详细内容请参考:官方文档说明冻结索引

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/152297.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ref属性

Vue 中 可以给标签&#xff08;HTML元素标签、组件标签&#xff09;加上一个 ref 属性&#xff0c;作用就是给 标签加上一个标识&#xff0c;可以通过该标识获取当前需要的DOM元素或者组件实例对象。 通过原生js获取DOM 如果使用原生js来获取DOM元素时&#xff0c;我们最简单的…

Unity--互动组件(Toggle Group)||Unity--互动组件(Slider)

Toggle Group 属于同一组的切换开关受到限制&#xff0c;因此一次只能打开其中一个开关&#xff0c;按下其中一个开关时&#xff0c;其他的开关将会自动关闭&#xff1b; Allow Switch Off&#xff1a;&#xff08;允许关闭&#xff09; 如果禁用此设置&#xff0c;则按下当前…

2024年度“阳江市惠民保”正式发布!

11月14日&#xff0c;2024年度“阳江市惠民保”暨百场义诊活动发布会在阳江市华邑酒店顺利举行。2024年度“阳江市惠民保”一年保费最低只要59元&#xff0c;最高可获得400万元的医疗保障。 阳江市人民政府、阳江市医疗保障局、阳江市农业农村局、阳江市金融工作局、国家金融监…

【linux】htop 命令行工具使用

htop是一个跨平台的交互式流程查看器。 htop允许垂直和水平滚动进程列表&#xff0c;以查看它们的完整命令行和相关信息&#xff0c;如内存和CPU消耗。还显示了系统范围的信息&#xff0c;如负载平均值或交换使用情况。 显示的信息可以通过图形设置进行配置&#xff0c;并且可…

力扣160:相交链表

力扣160&#xff1a;相交链表 题目描述&#xff1a; 给你两个单链表的头节点 headA 和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点&#xff0c;返回 null 。 图示两个链表在节点 c1 开始相交&#xff1a; 题目数据 保证 整个链式…

避免defer陷阱:拆解延迟语句,掌握正确使用方法

基本概念 Go语言的延迟语句defer有哪些特点&#xff1f;通常在什么情况下使用&#xff1f; Go语言的延迟语句&#xff08;defer statement&#xff09;具有以下特点&#xff1a; 延迟执行&#xff1a;延迟语句会在包含它的函数执行结束前执行&#xff0c;无论函数是正常返回还是…

2023年数维杯国际赛赛题思路浅析(快速选题)

2023年数维杯国际赛作为今年下半年第一场数模英文论文竞赛如期开赛。本次赛题的题设&#xff0c;难度开始向2020年之前的国赛看齐。比赛仿照美赛设置了MCM两道&#xff0c;ICM两道。需要注意的是与其他常规数模竞赛不同的是该竞赛支持各参赛队不区分组别&#xff0c;可从4套题中…

医疗软件制造商如何实施静态分析,满足 FDA 医疗器械网络安全验证

随着 FDA 对网络安全验证和标准提出更多要求&#xff0c;医疗软件制造商需要采用静态分析来确保其软件满足这些新的安全标准。继续阅读以了解如何实施静态分析来满足这些安全要求。 随着 FDA 在其软件验证指南中添加更多网络安全要求&#xff0c;医疗设备制造商可以转向静态分…

WorkPlus即时通讯app支持多种信创环境组合运行

在信息技术领域&#xff0c;国产信创技术的快速发展为企业带来了更多的选择和机会。在此背景下&#xff0c;WorkPlus作为一款全方位的移动数字化平台&#xff0c;全面支持国产信创操作系统、芯片和数据库&#xff0c;并且全面兼容鸿蒙操作系统。这一优势使得WorkPlus成为了企业…

如何使用ArcGIS Pro制作粉饰效果

在地图上&#xff0c;如果某个部分比较重要&#xff0c;直接的制图不能将其凸显出来&#xff0c;如果想要突出显示重要部分&#xff0c;可以通过粉饰效果来实现&#xff0c;这里为大家介绍一下方法&#xff0c;希望能对你有所帮助。 数据来源 本教程所使用的数据是从水经微图…

【C++&数据结构】二叉树(结合C++)的经典oj例题 [ 盘点&全面解析 ](24)

前言 大家好吖&#xff0c;欢迎来到 YY 滴数据结构系列 &#xff0c;热烈欢迎&#xff01; 本章主要内容面向接触过C的老铁 主要内容含&#xff1a; 欢迎订阅 YY滴 数据结构 专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; 目录 一.二叉树创建字符串1…

用封面预测书的价格【图像回归】

今天&#xff0c;我将介绍计算机视觉的深度学习应用&#xff0c;用封面简单地估算一本书的价格。 我没有看到很多关于图像回归的文章&#xff0c;所以我为你们写这篇文章。 距离我上一篇文章已经过去很长时间了&#xff0c;我不得不承认&#xff0c;作为一名数据科学家&#x…

Flowable 定时器事件

# 注意数据库时区的配置&#xff0c;如果差8小时配置成Asia/Shanghai spring.datasource.urljdbc:mysql://localhost:3306/flowable660?serverTimezoneAsia/Shanghai&nullCatalogMeansCurrenttrue# 开启定时任务功能 flowable.async-executor-activate: true一&#xff1a…

android studio编译SDL so库

一、下载源码 SDL官网 二、解压&#xff0c;拷贝android项目&#xff0c;并重新命名 2.1、解压 2.2&#xff0c;重命名项目名称&#xff08;androidSDL&#xff09;AndroidSDL Github 三、导入头文件和源文件&#xff0c;修改android.mk文件 3.1、在jni目录下创建SDL2文件…

腾讯云服务器可用区是什么意思?

腾讯云服务器可用区是什么意思&#xff1f;云服务器可用区如何选择&#xff1f;可用区是指在同一个地域内电力和网络相互独立的区域&#xff0c;可用区可以做到故障隔离&#xff0c;所以可用区存在的意义在于构建高可用、高容灾应用&#xff0c;将应用部署在不同可用区内&#…

爬虫基础之爬虫的基本介绍

一、爬虫概述 爬虫又称网络蜘蛛、网络机器人&#xff0c;网络爬虫按照系统结构和实现技术&#xff0c;大致可以分为以下几种类型&#xff1a; 通用网络爬虫&#xff08;Scalable Web Crawler&#xff09;&#xff1a;抓取互联网上所有数据&#xff0c;爬取对象从一些种子 URL…

腾讯云服务器可用区是什么意思?可用区选择方法

腾讯云服务器可用区是什么意思&#xff1f;云服务器可用区如何选择&#xff1f;可用区是指在同一个地域内电力和网络相互独立的区域&#xff0c;可用区可以做到故障隔离&#xff0c;所以可用区存在的意义在于构建高可用、高容灾应用&#xff0c;将应用部署在不同可用区内&#…

【2024全新版】程序员必会英语词汇表

“我英语不好可以学编程吗&#xff1f;” 相信这个问题&#xff0c;困扰着太多想学习编程&#xff0c;但英文不好的同学。 学习编程&#xff0c;常用的单词就那么多&#xff0c;只要把常见的单词学会&#xff0c;你的代码就能写的很6&#xff0c;英 语和编程的关系就是这么纯…

市场研究报告:量子计算将颠覆银行业!

&#xff08;图片来源&#xff1a;网络&#xff09; 量子银行将对金融体系产生重大影响&#xff0c;它在量子计算和区块链的基础上建立了一个更快的支付机制&#xff0c;并且通过消除传统点对点支付中常见的中间人&#xff0c;降低了运营成本。 量子计算及其运作机制 中东地区…

利用ffmpeg实现rtmp和rtsp推流

环境说明 windows11 : ffmpeg VLC Linux Unbuntu20.04 : SRS MediaMTX 可选&#xff1a;GStreamer win11下载ffmpeg和ffplay ffmpeg官网 添加环境变量&#xff1a;添加ffmpeg/bin所在的路径。 D:\ffmpeg\ffmpeg-master-latest-win64-lgpl-shared\bin win11查看本机电脑的设备…