CPU 使用率过高问题排查

文章目录

  • CPU 使用率过高问题排查
    • 1. CPU使用率过高常见问题
    • 2. 压力测试
      • 2.1 stress
        • 安装
        • 参数说明
        • 测试示例
      • 2.2 stress-ng
        • 安装
        • 参数说明
        • 测试示例
    • 3. 问题排查
      • 3.1 使用 top 命令
      • 3.2 使用 ps 命令
      • 3.3 使用 perf top
      • 3.4 vmstat 命令
        • 常用信息
        • 内存信息
        • 磁盘信息

CPU 使用率过高问题排查

1. CPU使用率过高常见问题

  1. 无法SSH连接

  2. 操作卡顿

  3. 用户访问服务响应失败,超时

2. 压力测试

2.1 stress

stress 是一款简单但功能强大的工具,可对 Linux 系统施加可配置的 CPU、内存、I/O 或磁盘压力。通过模拟繁重的工作负载,系统管理员可以观察系统在压力下的表现反应。

这一工具的价值在于找出系统潜在的薄弱环节,确保系统能够在不影响性能的情况下处理繁重的任务。

stress-ng:

stress-ngstress 的扩展版本,它超越了前者的基本功能,提供的压力测试范围更广,不仅包括 CPU、内存、I/O 和磁盘压力,还包括对进程间通信、套接字和各种文件操作的额外测试。

stressstress-ngLinux 系统的前瞻性管理都有很大帮助,使管理员和程序员能够优化系统配置、识别潜在问题并提高系统的整体可靠性

安装

使用 stress 命令进行压力测试,这个命令需要单例安装

可参考文档:https://blog.csdn.net/cronaldo91/article/details/131214903

  • 使用 yum 安装
yum install -y epel-release.noarch && yum -y update
yum install -y stress stress-ng
  • 源码安装

源码地址:https://fossies.org/linux/privat/stress-ng-0.17.08.tar.gz/

在这里插入图片描述

参数说明

参考:https://blog.csdn.net/qq_34777982/article/details/137334439

[root@105 ~]# stress --help
`stress' imposes certain types of compute stress on your system

Usage: stress [OPTION [ARG]] ...
 -?, --help         show this help statement
     --version      show version statement
 -v, --verbose      be verbose
 -q, --quiet        be quiet
 -n, --dry-run      show what would have been done
 -t, --timeout N    timeout after N seconds
     --backoff N    wait factor of N microseconds before work starts
 -c, --cpu N        spawn N workers spinning on sqrt()
 -i, --io N         spawn N workers spinning on sync()
 -m, --vm N         spawn N workers spinning on malloc()/free()
     --vm-bytes B   malloc B bytes per vm worker (default is 256MB)
     --vm-stride B  touch a byte every B bytes (default is 4096)
     --vm-hang N    sleep N secs before free (default none, 0 is inf)
     --vm-keep      redirty memory instead of freeing and reallocating
 -d, --hdd N        spawn N workers spinning on write()/unlink()
     --hdd-bytes B  write B bytes per hdd worker (default is 1GB)

Example: stress --cpu 8 --io 4 --vm 2 --vm-bytes 128M --timeout 10s

Note: Numbers may be suffixed with s,m,h,d,y (time) or B,K,M,G (size).
参数说明
-c–cpu N: 产生 N 个进程,每个进程都反复不停的计算随机数的平方根;
-i–io N: 产生 N 个进程,每个进程反复调用 sync() 将内存上的内容写到硬盘上;
-m–vm N: 产生 N 个进程,每个进程不断分配和释放内存;
–vm-bytes B指定分配内存的大小;
–vm-stride B不断的给部分内存赋值,让 COW(Copy On Write)发生;
–vm-hang N指示每个消耗内存的进程在分配到内存后转入睡眠状态 N 秒,然后释放内存,一直重复执行这个过程;
–vm-keep一直占用内存,区别于不断的释放和重新分配(默认是不断释放并重新分配内存);
-d–hadd N: 产生 N 个不断执行 write 和 unlink 函数的进程(创建文件,写入内容,删除文件);
–hadd-bytes B指定文件大小;
-t–timeout N: 在 N 秒后结束程序;
–backoff N等待N微妙后开始运行;
-q–quiet: 程序在运行的过程中不输出信息;
-n–dry-run: 输出程序会做什么而并不实际执行相关的操作;
–version显示版本号
-v–verbose: 显示详细的信息
测试示例
  • CPU压测
# stress 消耗 CPU 资源是通过调用 sqrt() 函数(计算由 rand() 函数产生的随机数的平方根)实现。命令会产生 8 个这样的子进程不断计算,超时时间为20秒,结束后再次运行 uptime 比较平均负载
stress --cpu 8 --timeout 20

# 启动 8 个 sqrt() 子进程,超时时间 30s,同时显示有关操作的详细信息
stress --cpu 8 -v --timeout 30s
  • 内存测试
# 产生 8 个子进程,超时时间 20s,每个进程不断分配和释放内存
stress --vm 8 --timeout 20s

# 产生 2 个子进程,每个进程分配 2048M 内存
stress --vm 2 --vm-bytes 2048M --vm-keep --timeout 20s
  • IO测试
# 产生 8 个进程,每个进程都反复调用 sync() 函数将内存上的内容写到硬盘上
stress -i 8 --timeout 20s

# 产生 1 个进程不断的在磁盘上创建 10M 大小的文件并写入内容
# 使用 top 命令查看 CPU 的状态(此时的 CPU 主要消耗在内核态),iostat 2 输出,高 iowait,瓶颈是写磁盘
stress -d 1 --hdd-bytes 10M --timeout 20s

# 执行多个类型的任务,比如产生 4 个 CPU 进程、3 个 IO 进程、2 个 256M 的 vm 进程,并且每个 vm 进程中循环分配释放内存:
stress --cpu 4 --io 3 --vm 2 --vm-bytes 256M --vm-keep --timeout 20s

2.2 stress-ng

stress-ng 完全兼容 stress, 并且在此基础上通过几百个参数,可以产生各种复杂的压力

安装
yum install stress-ng
参数说明
-h,--help:显示帮助信息;
 
--version:显示版本信息;
 
-t,–timeout:指定程序运行结束的时间,后面直接跟数字,单位为秒;
 
-c,–-cpu:后面空格跟一个整数,表示测试CPU的进程数,--cpu 4 :表示生成4个worker循环调用sqrt()产生cpu压力;
 
-i,--io:后面空格跟一个整数,表示测试磁盘I/O的进程数, --io 4 :表示生成4个worker循环调用sync()产生io压力;
 
-m,--vm:后面空格跟一个整数,表示测试内存的进程数,--vm 4 :表示生成4个worker循环调用malloc()/free()产生内存压力;
 
-d,--hdd:后面空格直接跟数字,表示产生执行write和unlink函数的进程数,用于磁盘负载测试;
 
--cpu-method:指定CPU的测试方法,后面空格直接跟方法名;
 
--metrics:输出命令执行指标;
 
--vm-bytes:指定在内存测试时malloc的字节数,默认256M;
 
--class:指定测试类别,后面空格跟类别名;
 
--matrix:启用矩阵测试模式,后面空格跟矩阵模式名;
 
--random-seed:指定测试随机种子,后面空格跟种子名;
 
--sequential:启用顺序测试模式;
 
--hdd-bytes:指定写的字节数;
 
--cpu-load:CPU负载占比,后面空格直接跟数字,单位为百分比;
测试示例
  • CPU测试
# 使用 4 个 CPU 进程数,进行矩阵乘法计算以进行压力测试,持续时间为20秒
stress-ng --cpu 4 --cpu-method matrixprod --timeout 20s

# 产生 2 个 worker 做圆周率算法压力
stress-ng -c 2 --cpu-method pi --timeout 20s

# 产生 2 个 worker 迭代使用 30 多种不同的压力算法,包括pi, crc16, fft等等
stress-ng -c 2 --cpu-method all --timeout 20s

# 产生 2 个 worker 调用 socket 相关函数产生压力
stress-ng --sock 2 --timeout 20s

# 产生 2 个 worker 读取 tsc 产生压力
stress-ng --tsc 2 --timeout 20s

# 将压力指定到特定的cpu 0上
stress-ng --tsc 2 --taskset 0 --timeout 20s
  • 内存测试
# 用 4 个内存分配进程, 每次分配大小512M,分配后不释放,保持测试20秒
stress-ng --vm 4 --vm-bytes 512M --timeout 20s
  • IO测试
# 使用 4 个 IO 进程 ,保持测试20秒
stress-ng --io 4 --timeout 20s
  • 磁盘IO压测
# 使用 4 个I/O进程, 1 个写进程,每次写1G 文件块,测试20秒
stress-ng --io 4 --hdd 1 --hdd-bytes 1G --timeout 20s

3. 问题排查

3.1 使用 top 命令

  • top 命令简介
  1. 命令选项
参数说明
-b以批处理模式操作
-c显示完整的治命令
-d屏幕刷新间隔时间
-I忽略失效过程
-s保密模式
-S累积模式
-i<时间>设置刷新间隔时间
-u<用户名>指定用户名
-p<进程号>指定进程
-n<次数>循环显示的次数
  1. 在该命令中常用快捷键
参数说明
h显示快捷键帮助
k终止一个进程
i开/关忽略闲置和僵死进程
q退出程序
r重新安排一个进程的优先级别
S切换到累计模式
s更改刷新间隔时间,单位秒
f,F从当前显示中添加或者删除项目
o,O改变显示项目的顺序
l切换显示平均负载和启动时间信息
m切换显示内存信息
t切换显示进程和CPU状态信息
c切换显示命令名称和完整命令行
M根据内存使用大小排序
P根据CPU使用率进行排序 (默认排序)
T根据时间/累计时间进行排序
w将当前设置写入~/.toprc文件中
1展开多核cpu显示
  1. 说明

在这里插入图片描述

参数说明
top -系统当前时间
up系统已开机多长时间
user当前用户数
load averagecpu平均负载,三个数值分别为,1分钟,5分钟,15分钟
Tasks系统当前进程数,total:总进程数,running:正在运行的进程数,sleeping:睡眠的进程数,stopped:停止的进程数,zombie:僵尸进程数
%Cpu(s)cpu使用率 us:(user)用户使用cpu百分百,sy:(system)系统内核使用cpu百分百,ni:(niced)运行已调整优先级的用户进程的CPU时间,id:剩余的cpu百分百,wa:(IO wait)用于等待IO完成的CPU时间,hi:处理硬件中断的CPU时间,si: 处理软件中断的CPU时间,st:这个虚拟机被hypervisor偷去的CPU时间(译注:如果当前处于一个hypervisor下的vm,实际上hypervisor也是要消耗一部分CPU处理时间的)
Mem内存使用信息,total:总内存大小,free:空闲的内存,used:已使用的内存,buff/cache:缓存的内存大小
Swap虚拟内存信息
PID进程id
USER进程所有者
PR优先级
NInice值,负值表示高优先级,正值表示低优先级
VIRT进程使用的虚拟内存总量
RES进程使用的物理内存大小
SHR共享内存大小
S进程状态,D:不可中断的睡眠状态,R:运行,S:睡眠,T:跟踪/停止,Z:僵尸进程
%CPU进程使用的CPU占用百分比
%MEM进程使用的物理内存百分比
TIME+进程使用的CPU时间总计
COMMAND命令名

在这里插入图片描述

3.2 使用 ps 命令

ps aux --sort=-%cpu | head -n 10

参数说明:
	ps aux			可以用来查看进程的 CPU 内存使用情况
	--sort=-%CPU	以参数%CPU进行降序排列,升序排列可使用 --sort=+%CPU,同理也可以使用 %MEM 参数进行排序
	head -n 10		取前10行

在这里插入图片描述

3.3 使用 perf top

它能够实时显示占用 CPU 时钟最多的函数或者指令,因此可以用来查找热点函数

在这里插入图片描述

第一行包含三个数据,分别是采样数(Samples)、事件类型(event)和事件总数量(Event count)

第一列 Overhead ,是该符号的性能事件在所有采样中的比例,用百分比来表示。

第二列 Shared ,是该函数或指令所在的动态共享对象(Dynamic Shared Object),如内核、进程名、动态链接库名、内核模块名等。

第三列 Object ,是动态共享对象的类型。比如 [.] 表示用户空间的可执行程序、或者动态链接库,而 [k] 则表示内核空间。

最后一列 Symbol 是符号名,也就是函数名。当函数名未知时,用十六进制的地址来表示

3.4 vmstat 命令

是一个常用的系统性能分析工具,主要用来分析系统的内存使用情况,也常用来分析 CPU 上下文切换和中断的次数

CPU 上下文切换,就是先把前一个任务的 CPU 上下文(也就是 CPU 寄存器和程序计数器)保存起来,然后加载新任务的上下文到这些寄存器和程序计数器,最后再跳转到程序计数器所指的新位置,运行新任务。

而这些保存下来的上下文,会存储在系统内核中,并在任务重新调度执行时再次加载进来。这样就能保证任务原来的状态不受影响,让任务看起来还是连续运行。

常用信息
# 每隔5秒输出一组数据,一共输出5组
[root@105 ~]# vmstat 5 5
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
10  0     64 388948   4172 1305068    0    0    23    44   35   18  1  0 99  0  0
 8  0     64 388932   4172 1305068    0    0     0     0 1837  211 100  0  0  0  0
 8  0     64 388932   4172 1305068    0    0     0     0 1777  206 100  0  0  0  0
 8  0     64 388932   4172 1305068    0    0     0     0 1772  206 100  0  0  0  0
 8  0     64 388932   4172 1305068    0    0     0     1 1775  207 100  0  0  0  0
  • 参数说明
参数说明
r运行队列中进程数量
b等待IO的进程数量
swpd使用虚拟内存大小
free可用内存大小
buff用作缓冲的内存大小(是内核缓冲区用到的内存,对应的是 /proc/meminfo 中的 Buffers 值)
cache用作缓存的内存大小(是内核页缓存和 Slab 用到的内存,对应的是 /proc/meminfo 中的 Cached 与 SReclaimable 之和。(有遇到过些系统是Cached 与 Slab之和,具体还以自己系统为准))
si每秒从交换区写到内存的大小
so每秒写入交换区的内存大小
bi每秒读取的块数(现在的Linux版本块的大小为1024bytes)
bo每秒写入的块数(现在的Linux版本块的大小为1024bytes)
in每秒中断数,包括时钟中断。【interrupt】
cs每秒上下文切换数。 【count/second】
us用户进程执行时间(user time)
sy系统进程执行时间(system time)
id空闲时间(包括IO等待时间),中央处理器的空闲时间 。以百分比表示。
wa等待IO时间

注:

  1. 如果 r 经常大于 4,id 经常少于 40,表示 cpu 的负荷很重。
  2. 如果 bi,bo长期不等于 0,表示内存不足。
  3. 如果 disk 经常不等于 0 ,且在 b 中的队列大于 3 ,表示 io 性能不好。
  4. Linux在具有高稳定性、可靠性的同时,具有很好的可伸缩性和扩展性,能够针对不同的应用和硬件环境调整,优化出满足当前应用需要的最佳性能。因此企业在维护Linux系统、进行系统调优时,了解系统性能分析工具是至关重要的。

在这里插入图片描述

内存信息
[root@105 ~]# vmstat -s
      1867044 K total memory
       168700 K used memory
       623160 K active memory
       639964 K inactive memory
       389004 K free memory
         4172 K buffer memory
      1305168 K swap cache
      1048572 K total swap
           64 K used swap
      1048508 K free swap
       871742 non-nice user cpu ticks
          190 nice user cpu ticks
        46726 system cpu ticks
     57724331 idle cpu ticks
         3661 IO-wait cpu ticks
            0 IRQ cpu ticks
         3668 softirq cpu ticks
            0 stolen cpu ticks
     13153817 pages paged in
     25607239 pages paged out
           11 pages swapped in
           20 pages swapped out
     21641981 interrupts
     10865763 CPU context switches
   1716926093 boot time
        64048 forks

注:这些信息的分别来自于 /proc/meminfo,/proc/stat/proc/vmstat

在这里插入图片描述

磁盘信息
[root@105 ~]# vmstat -d
disk- ------------reads------------ ------------writes----------- -----IO------
       total merged sectors      ms  total merged sectors      ms    cur    sec
sr0       18      0    2056     316      0      0       0       0      0      0
sda    44509     22 26305578  419857 116587  12097 51219286 2593733      0     89
dm-0   43003      0 26218018  416346 128402      0 51040550 2808927      0     87
dm-1     145      0    6616     112     20      0     160      61      0      0

注:这些信息主要来自于 /proc/diskstats

在这里插入图片描述

显示指定磁盘分区统计信息

[root@105 ~]# vmstat -p /dev/sda1
sda1          reads   read sectors  writes    requested writes
                1182      73488        252     178576

注:这些信息主要来自于 /proc/diskstats

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/675919.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Plotting World Map in Python

1. 方法一 pygal Plotting World Map Using Pygal in Python import pygal # create a world map worldmap pygal.maps.world.SupranationalWorld() # set the title of map worldmap.title Continents# adding the continents worldmap.add(Africa, [(africa)]) worl…

【微信小程序】小锦哥小程序工具 v2.3.8.0

# 简介 小锦哥小程序工具是一款可以对微信小程序进行解密或者反编译的工具&#xff0c;通过这款工具&#xff0c;可以对别人已经发布的小程序进行解密或者是反编译&#xff0c;然后查看源代码。对于网络安全人员来说&#xff0c;可以使用该工具进行安全审计&#xff0c;发现其…

四川汇聚荣聚荣科技有限公司评价怎么样?

四川汇聚荣聚荣科技有限公司评价如何?在科技日新月异的今天&#xff0c;四川汇聚荣聚荣科技有限公司作为业界的一员&#xff0c;其表现自然引起了广泛关注。那么&#xff0c;这家公司究竟如何呢?接下来&#xff0c;我们将从四个不同方面对其进行深入剖析。 一、技术实力 四川…

3DGS语义分割之LangSplat

LangSplat是CVPR2024的paper. 实现3DGS的语义分割&#xff08;可文本检索语义&#xff09; github: https://github.com/minghanqin/LangSplat?tabreadme-ov-file 主要思想是在3DGS中加入了CLIP的降维语义特征&#xff0c;可用文本检索目标&#xff0c;实现分割。 配置环境&…

三十四、openlayers官网示例Dynamic clusters解析——动态的聚合图层

官网demo地址&#xff1a; https://openlayers.org/en/latest/examples/clusters-dynamic.html 这篇绘制了多个聚合图层。 先初始化地图 &#xff0c;设置了地图视角的边界extent&#xff0c;限制了地图缩放的范围 initMap() {const raster new TileLayer({source: new XYZ…

导入和使用标准模块

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 在Python中&#xff0c;自带了很多实用的模块&#xff0c;称为标准模块&#xff08;也可以称为标准库&#xff09;&#xff0c;对于标准模块&#xf…

韩顺平0基础学java——第15天

p303-326 重写override 和重载做个对比 注&#xff1a;但子类可以扩大范围&#xff0c;比如父类是protected&#xff0c;子类可以是public 多态 方法或对象具有多种形态&#xff0c;是面向对象的第三大特征&#xff0c;多态是建立在封装和继承基础之上的。 多态的具体体现…

Ubuntu server 24 (Linux) 安装部署smartdns 搭建智能DNS服务器

SmartDNS是推荐本地运行的DNS服务器&#xff0c;SmartDNS接受本地客户端的DNS查询请求&#xff0c;从多个上游DNS服务器获取DNS查询结果&#xff0c;并将访问速度最快的结果返回给客户端&#xff0c;提高网络访问速度和准确性。 支持指定域名IP地址&#xff0c;达到禁止过滤的效…

【YOLOv5/v7改进系列】引入ODConv——即插即用的卷积块

一、导言 提出了一种称为全维度动态卷积(ODConv)的新颖设计&#xff0c;旨在克服当前动态卷积方法的局限性并提升卷积神经网络(CNN)的性能。以下是该论文提出的全维度动态卷积设计的优点和存在的缺点分析&#xff1a; 优点&#xff1a; 增强特征学习能力&#xff1a; ODConv通…

第十五届蓝桥杯物联网试题(省赛)

这个省赛题不算难&#xff0c;中规中矩&#xff0c;记得看清A板B板&#xff0c;还有ADC的获取要配合定时器

如何查看本地sql server数据库的ip地址

程序连线SQL数据库&#xff0c;需要SQL Server实例的名称或网络地址。 1.查询语句 DECLARE ipAddress VARCHAR(100) SELECT ipAddress local_net_address FROM sys.dm_exec_connections WHERE SESSION_ID SPID SELECT ipAddress As [IP Address]SELECT CONNECTIONPROPERTY(…

p10,idea开发工具

1 什么是ide 有编写&#xff0c;编译&#xff0c;运行三个功能合一的集成开发工具。

创建模拟器

修改模拟器默认路径 由于模拟器文件比较大&#xff0c;默认路径在C:\Users\用户名.android\avd&#xff0c;可修改默认路径 创建修改后的路径文件 D:\A-software\Android\AVD添加系统变量ANDROID_SDK_HOME&#xff1a;D:\A-software\Android\AVD重启Android Studio 创建模拟…

云端数据提取:安全、高效地利用无限资源

在当今的大数据时代&#xff0c;企业和组织越来越依赖于云平台存储和处理海量数据。然而&#xff0c;随着数据的指数级增长&#xff0c;数据的安全性和高效的数据处理成为了企业最为关心的议题之一。本文将探讨云端数据安全的重要性&#xff0c;并提出一套既高效又安全的数据提…

24年西藏事业单位报名详细流程

✨各位姐妹们注意啦&#xff01;24西藏事业单位公告已出&#xff0c;本次计划公开招聘8⃣9⃣9⃣人即日起开始报名&#xff0c;想要上岸的姐妹们要抓紧了哦✊趁着还有时间赶紧开卷&#xff01;&#xff01;&#xff01; &#x1f308;24西藏事业单位招聘考试&#xff1a; &…

Linux 内核之 mmap 内存映射触发的缺页异常 Page Fault

文章目录 前言一、简介1. MMU 内存管理2. 缺页中断3. 页表4. 小节 二、mmap 提前分配物理内存1. mm_populate 函数2. __mm_populate 函数3. populate_vma_page_range 函数4. __get_user_pages 函数5. find_extend_vma 函数6. find_vma 函数7. follow_page_mask 函数8. follow_p…

微信小程序-wx.showToast超长文字展示不全

wx.showToast超长文字展示不全 问题解决方法1 问题 根据官方文档&#xff0c;iconnone&#xff0c;最多显示两行文字。所以如果提示信息较多&#xff0c;超过两行&#xff0c;就需要用其他方式解决。 解决方法1 使用vant组件里面的tost 根据官方例子使用&#xff1a; 1、在…

Java进阶学习笔记36——算法

什么是算法&#xff1f; 解决某个实际问题的过程和方法。 1&#xff09;导航&#xff1b; 2&#xff09;滴滴打车&#xff1b; 3&#xff09;抖音&#xff1b; 不同的算法&#xff0c;效率高、性能好&#xff01; 在Java中&#xff0c;代码已经帮我们写好了&#xff0c;但为…

端午佳节到,礼轻情意重,闪侠惠递帮你高效便宜寄快递

马上就是端午佳节了&#xff0c;我们通常会吃粽子&#xff0c;赛龙舟&#xff0c;但是这些礼物我们该怎么快速的送到我们亲朋好友的手中呢&#xff1f;小编这里非常推荐大家使用闪侠惠递来寄快递。不仅能高效便捷的把礼物送到你的手中&#xff0c;而且还能以非常便宜的价格呢&a…

GIS之arcgis系列06:线划图缓冲区分析

缓冲区工具将在输入要素周围指定距离内创建缓冲区面。 缓冲区例程将遍历输入要素的每个折点并创建缓冲区偏移。 通过这些偏移创建输出缓冲区要素 原理&#xff1a; 01.打开文件 02.确定单位&#xff0c;在文件属性里。 03.工具箱-->分析工具-->邻域分析-->缓冲区。 …