一、背景说明
如果线上启动的Java服务占用过高的CPU,我们通过top命令是可以查看到的。
那么问题来了,如果通过top命令查看到是因为java服务引起的占用过高的CPU时间,该如何进行详细的排查呢?换句话说就是如何定位问题发生在代码的哪一行呢?
二、问题复现
1. 运行一个Java程序,如下图:
2. 使用top命令查看,如下图所示,发现java对应的一个进程25999占用了全部的CPU时间
三、排查思路
1. 先用top命令定位哪个进程对cpu的占用过高(可以查到进程号),如上图所示;
2. 然后使用 ps H -eo pid,tid,%cpu | grep 进程号 命令进一步定位是当前这个进程的哪个线程引起的cpu占用过高,如下图:
3. 然后使用jdk提供的工具,jstack查看这个线程的问题。 jstack 进程id
注意:通过 < jstack 进程id > 命令查看的信息中,线程号是16进制的,所以要把第3步中找到的线程id(此时是十进制的)转换成十六进制的,然后在 jstack 命令的输出中找对应的线程信息,找到了对应的线程信息后,此线程信息中会显示有问题的代码的行号,这样就可以到代码中进行排查问题了。
4. 查看代码,如下图: