【小白进阶】Linux 调试大法——gdb

初衷

        gdb调试是每一个后端开发工程师所必备的技能,我们工作总是会用gdb协助我们去分析和调试问题。但是大部分同学的技能仅停留在最基础的查看问题。即gdb program -->r --> 问题复现 --> bt 查看源码中的哪一行出现了错误。再稍微熟练点的,可能就是p var查看一下变量的值,进一步协助排查。

        我想说的是,这点能力是完全不够的,身边一些同事稍微遇到一点问题,就不知道如何进行调试了。比如:

  • 目标平台没有gdb 工具
  • 程序及动态库符号被strip了,bt 查看不到详细信息
  • 问题不是必现,一直等待会耗费人力

        一旦遇到这些问题,大部分肯定都会一脸懵逼,不知道该怎么办了。但是我认为:作为后端开发工程师,gdb 调试是必备技能,这个技能应该是一个能力集,不仅仅是会几个gdb 调试指令即可,而是在这个过程中,遇到任何问题,都应该能够独立分析解决。这也是我写本篇文章的初心。

目标平台没有gdb怎么办

        嵌入式平台的资源有限,很多厂家并不会将gdb 等工具集成到设备中。这就导致很多新手同学,不知道该怎么办了。犹记得刚毕业,我天马行空的居然尝试将虚拟机中的gdb copy 到目标设备中,期待能够正常使用(现在想想,真心觉得傻得可爱。【申明一下哈,有可能会成功哦,前提是你的开发设备和目标设备都是相同的架构】)。

        遇到这种情况,我们一般都需要重新编译gdb 工具。有兴趣的同学可以参考这篇文章,应该算是较为详细。工作中如何编译开源工具(gdb)_gdb编译_谢艺华的博客-CSDN博客。

coredump

        我们在开发调试过程中,若一直使用gdb进行调试,这对于测试和开发而言会不太方便,影响效率。特别是在压力测试的场景中。如何解决这一难题呢?我们可以使用linux自带的coredump机制。

        Coredump叫做核心转储,它是进程运行时在突然崩溃的那一刻的一个内存快照。操作系统在程序发生异常而异常在进程内部又没有被捕获的情况下,会把进程此刻内存、寄存器状态、运行堆栈等信息转储保存在一个文件里

        但是这个机制默认可能是没有开启的,因为一旦开启后,会对系统赞成较大的压力。开启方式有两种:

系统设置

一、开启 coredump

执行ulimit -c查看coredump 是否开启,若结果为0,则认为没有启动coredump文件生成。需要进行打开。

1. 临时启用:ulimit -c 1024ulimit -c unlimited

前一种是限制core dump的文件大小不超过1024K,后一种是不限制core dump文件的大小。建议根据实际情况进行设置大小,因为coredump是将程序崩溃的那一刻的内存进行快照,因此越占用内存的进程,其生成的core文件,也就会越大。因此动辄几个G的core文件,也就不再稀奇。很有可能把磁盘占满了,导致程序异常。

2. 永久有效:打开/etc/profile文件, 增加如下以下并生使其生效:ulimit -S -c unlimited > /dev/null 2>&1

二、设置coredump文件名

        设备里面可能同时运行多个应用,不同的应用可能都会发生crash,若core文件名不做特殊识别,可能无法在多个core文件中,找到我们需要的那一个。因此对core文件进行文件名设置,就显得很有必要。

echo '/corefiles/core-%e-%p-%t' > /proc/sys/kernel/core_pattern,其中:

  • /corefiles是core文件的保存路径。
  • core-%e-%p-%t是core 文件名,以core-开头。
  • %p 所dump进程的进程ID
  • %u 所dump进程的实际用户ID
  • %g 所dump进程的实际组ID
  • %s 导致本次core dump的信号
  • %t core dump的时间 (由1970年1月1日计起的秒数)
  • %h 主机名
  • %e 程序文件名

一般默认就设置为core-%e-%p-%t

三、设置coredump文件保存位置

        我们知道嵌入式平台的磁盘空间一般也是有限的,但是它会通过挂载不同的磁盘分区,实现扩容。比如:

        如上图,我的环境中,默认core文件保存的路径是/usr/share/apport/apport/,若/usr所挂载的分区磁盘空间不足怎么办,那么此时就可以通过修改core文件保存路径实现。

        同理,同样通过修改/proc/sys/kernel/core_pattern

代码设置

        有时候,我们也可以通过程序开启coredump,这样测试人员就不用在意系统环境的设置了。但是前提是程序必须以root权限运行。代码示例如下:

#include <stdio.h>
#include<stdlib.h>
#include <sys/prctl.h>
#include <sys/resource.h>
#include <string.h>
#include<fcntl.h>
#include <time.h>

#define CORE_FILE_SIZE 1024*1024*5    /** core文件大小,可根据实际情况设置*/
#define KERNEL_PATTERN_FILE  "/proc/sys/kernel/core_pattern"
void coredump_file_set(char *name)
{
        struct rlimit rlim;
        getrlimit(RLIMIT_CORE, &rlim);
        rlim.rlim_cur = rlim.rlim_max = CORE_FILE_SIZE;
        int32_t ret = setrlimit(RLIMIT_CORE, &rlim);
        if(ret < 0){
                perror("setrlimit");
                return;
        }
        
        char path[256] = {'0'};
        sprintf(path, "/ota_master_data/%sCore_%t", name);

        int32_t core_pattern_fd = open(KERNEL_PATTERN_FILE, O_RDWR|O_NDELAY|O_TRUNC, 0666);
        if(core_pattern_fd < 0){
                perror("open");
                free(localtime);
                return;
        }

        ret = write(core_pattern_fd, path, strlen(path));
        if(ret < 0){
                perror("write");
        }
                free(localtime);
        close(core_pattern_fd);
}

int32_t main(int32_t argc, char* argv[])
{
    coredump_file_set("App");      
    return 0;
}

调试

        程序异常之后,我们就可以在设置的路径下生成对应的coredump文件,通过对应编译链中的gdb工具可分析coredump文件。为什么要用工具链中的gdb工具呢?这个可以思考一下,可以在评论区回答哦~~~。

调试程序步骤:

1. 启动gdb,进入core文件。命令格式:gdb [exec file] [core file]。如下:

yihua@ubuntu:~/coredump/core$ /opt/corbos-linux/2.30.0/sysroots/x86_64-pokysdk-linux/usr/bin/aarch64-poky-linux/aarch64-poky-linux-gdb otamaster  otaMasterCore_1699106821.8
GNU gdb (GDB) 9.2
Copyright (C) 2020 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
Type "show copying" and "show warranty" for details.
This GDB was configured as "--host=x86_64-pokysdk-linux --target=aarch64-poky-linux".
Type "show configuration" for configuration details.
For bug reporting instructions, please see:
<http://www.gnu.org/software/gdb/bugs/>.
Find the GDB manual and other documentation resources online at:
    <http://www.gnu.org/software/gdb/documentation/>.

For help, type "help".
Type "apropos word" to search for commands related to "word"...
Reading symbols from otamaster...
.....

warning: Could not load shared library symbols for 43 libraries, e.g. /usr/library/libvdi_main.so.
Use the "info sharedlibrary" command to see the complete listing.
Do you need "set solib-search-path" or "set sysroot"?
--Type <RET> for more, q to quit, c to continue without paging--
Core was generated by `otamaster -c ../etc/otamasterConfig.json'.
Program terminated with signal SIGSEGV, Segmentation fault.
#0  0x0000007f9b14ef90 in ?? ()
[Current thread is 1 (LWP 25)]
(gdb)

2. 设置库的加载路径。可执行程序运行时会加载很多动态库,core文件中的一些代码段很有可能就是在这些库中,若不加载这些依赖库,就无法观察相应的符号及堆栈信息。

3. 将设备中程序依赖的库拷贝出来。lddobjdump -x programe | grep NEEDED查看依赖库。

4. 在GDB中设置动态库寻找路径。set solib-search-path如:

(gdb) info sharedlibrary
From                To                  Syms Read   Shared Object Library
                                        No          /usr/library/libvdi_main.so
                                        No          /usr/library/libabupFoundation.so
                                        No          /adaptive/usr/lib/libdlt.so.2
                                        No          /usr/library/libjson-c.so.5
                                        No          /usr/lib/libcrypto.so.1.1
                                        No          /usr/library/libota.so
                                        No          /hostLibrary/lib/libMI_VCCD_MISESDK.so
                                        No          /usr/library/libdiagSecurityAccess.so
                                        No          /usr/library/libOTAMasterService.so
                                        No          /usr/library/libOTAMasterVehCloudApi.so
                                        No          /usr/library/libotamaster_api_vehicle_info.so
                                        No          /xmiLibrary/usr/lib/libotaapi_shared.so
                                        No          /usr/library/libota_delta.so
                                        No          /xmiLibrary/usr/lib/libHostSecurityLog.so
                                        No          /adaptive/lib/libpthread.so.0
                                        No          /adaptive/usr/lib/libstdc++.so.6
                                        No          /adaptive/lib/libgcc_s.so.1
                                        No          /adaptive/lib/libc.so.6
                                        No          /lib/ld-linux-aarch64.so.1
                                        No          /adaptive/lib/libdl.so.2
                                        No          /usr/library/libvdi_convert.so
                                        No          /xmiLibrary/usr/lib/libdoipequip.so
                                        No          /hostLibrary/lib/libcn_x509_proxy.so
                                        No          /usr/lib/libssl.so.1.1
                                        No          /adaptive/lib/librt.so.1
                                        No          /adaptive/lib/libm.so.6
                                        No          /hostLibrary/lib/libhse_wrapper.so
                                        No          /hostLibrary/lib/libcert.so
                                        No          /hostLibrary/lib/libnddscpp2.so
                                        No          /hostLibrary/lib/libnddsc.so
                                        No          /hostLibrary/lib/libnddscore.so
                                        No          /hostLibrary/lib/librticonnextmsgcpp2.so
                                        No          /xmiLibrary/usr/lib/libdoipcommon.so
                                        No          /adaptive/usr/lib/libz.so.1
                                        No          /hostLibrary/lib/libcn_x509_crypto.so
                                        No          /hostLibrary/lib/libcn_x509_common.so
                                        No          /usr/lib/libhse-libclient.so
                                        No          /xmiLibrary/usr/lib/libPersistencyCommon.so
--Type <RET> for more, q to quit, c to continue without paging--

刚开始,exec file 依赖这些动态库,但是都没有加载到。执行set solib-search-path后。

(gdb) set solib-search-path .
Reading symbols from /home/yihua/coredump/core/libvdi_main.so...
Reading symbols from /home/yihua/coredump/core/libabupFoundation.so...
Reading symbols from /home/yihua/coredump/core/libjson-c.so.5...
Reading symbols from /home/yihua/coredump/core/libota.so...
Reading symbols from /home/yihua/coredump/core/libdiagSecurityAccess.so...
Reading symbols from /home/yihua/coredump/core/libOTAMasterService.so...
(No debugging symbols found in /home/yihua/coredump/core/libOTAMasterService.so)
Reading symbols from /home/yihua/coredump/core/libOTAMasterVehCloudApi.so...
Reading symbols from /home/yihua/coredump/core/libotamaster_api_vehicle_info.so...
Reading symbols from /home/yihua/coredump/core/libota_delta.so...
Reading symbols from /home/yihua/coredump/core/libvdi_convert.so...
(gdb) info sharedlibrary
From                To                  Syms Read   Shared Object Library
0x0000007f9d32cbe0  0x0000007f9d34a87c  Yes         /home/yihua/coredump/core/libvdi_main.so
0x0000007f9c5d2230  0x0000007f9c8154e0  Yes         /home/yihua/coredump/core/libabupFoundation.so
                                        No          /adaptive/usr/lib/libdlt.so.2
0x0000007f9c443b60  0x0000007f9c44c2e4  Yes         /home/yihua/coredump/core/libjson-c.so.5
                                        No          /usr/lib/libcrypto.so.1.1
0x0000007f9c198600  0x0000007f9c199e04  Yes         /home/yihua/coredump/core/libota.so
                                        No          /hostLibrary/lib/libMI_VCCD_MISESDK.so
0x0000007f9c163950  0x0000007f9c1649f0  Yes         /home/yihua/coredump/core/libdiagSecurityAccess.so
0x0000007f9be0db20  0x0000007f9bff69b0  Yes (*)     /home/yihua/coredump/core/libOTAMasterService.so
0x0000007f9b539fc0  0x0000007f9b56132c  Yes         /home/yihua/coredump/core/libOTAMasterVehCloudApi.so
0x0000007f9b5136b0  0x0000007f9b51e568  Yes         /home/yihua/coredump/core/libotamaster_api_vehicle_info.so
                                        No          /xmiLibrary/usr/lib/libotaapi_shared.so
0x0000007f9b477cd0  0x0000007f9b47fbf8  Yes         /home/yihua/coredump/core/libota_delta.so
                                        No          /xmiLibrary/usr/lib/libHostSecurityLog.so
                                        No          /adaptive/lib/libpthread.so.0
                                        No          /adaptive/usr/lib/libstdc++.so.6
                                        No          /adaptive/lib/libgcc_s.so.1
                                        No          /adaptive/lib/libc.so.6
                                        No          /lib/ld-linux-aarch64.so.1
                                        No          /adaptive/lib/libdl.so.2
0x0000007f9b05bd40  0x0000007f9b08c42c  Yes         /home/yihua/coredump/core/libvdi_convert.so

如上,设置动态库寻找路径后,就可以正常加载动态库了。

5. 在进入gdb后,查找段错误位置:where或者bt。

gdb 常用调试命令

        通过上面流程,我们已经能够正式进入gdb调试阶段了。在这里我分享一下,我常用的一些命令。

  • backtrace 与 frame

backtrace 可简写成 bt,用于查看当前所在线程的调用堆栈。如果我们想切换到其他堆栈处,则可以使用frame命令。frame命令可被简写成f,f 堆栈编号

  • info 用于查看一些信息,我经常的搭配是
  • info locals 查看当前栈中的局部变量。
  • info threads 查看当前线程信息。
  • info b 查看当前断点信息。
  • info registers 查看当前寄存器值,比如常见栈顶寄存器,PC寄存器
  • print 打印或修改变量,寄存器的值。
  • x 打印内存值 x /nfu <address>
  • n:是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址(units)的内容。
  • f: 表示显示的格式(format)

                x (hexadecimal)按十六进制格式显示变量。
                d (signed decimal)按十进制格式显示变量。
                u (unsigned decimal)按十进制格式显示无符号整型。
                o (octal)按八进制格式显示变量。
                t (binary)按二进制格式显示变量。
                a (address)按十六进制格式显示地址,并显示距离前继符号的偏移量(offset)。常用于定位未知地址(变量)。
                c (character)按字符格式显示变量。
                f (floating)按浮点数格式显示变量。

  • u   表示(the unit size)从当前地址往后请求的位宽大小。如果不指定的话,GDB默认是4个bytes。u参数可以用下面的字符来代替,b表示单字节h表示双字节w表示四字 节g表示八字节

例如,打印当前栈顶地址开始,4字节为单位,以16进制输出,共输出16个。即输出栈顶64字节内容。

  • info  proc  mappings 。查看当前进程的maps,即动态库和可执行程序,加载到虚拟地址的maps。在某些场景下,作用非常大。可参考

案例实践

        关于gdb的实际案例分析,可参考我的gdb调试专栏。后续也会持续更新案例。

linux gdb 调试_谢艺华的博客-CSDN博客

技巧

一、 如何修改正在运行的程序的标准输出

场景:有些情况下,我们需要查看一个程序的日志输出,但苦于这个程序并不是我们开发的。默认情况下,该程序的输出默认是到/dev/null中的。如何查看它的输出呢?

  1. 获取正在运行的进程pid。ps -ef | grep MCM_atcop_svr
  2. 运行gdb命令。gdb -p pid
  3. 通过close系统调用关闭标准输出(STDOUT)或者标准错音误(STDERR): call close(1)
  4. 通过create系统调用打开一个文件并将其文件描述符通过dup2系统调用复制给标准输出或者标准错误:call dup2(creat("/tmp/log",0600),1)
  5. 退出调试器:quit

总结

        上述便是本文的分享,如果能给各位看客带来一点帮助,还请三连支持一下。您的支持就是我的动力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/197218.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Node.js 事件循环:定时任务、延迟任务和 I/O 事件的艺术

&#x1f90d; 前端开发工程师&#xff08;主业&#xff09;、技术博主&#xff08;副业&#xff09;、已过CET6 &#x1f368; 阿珊和她的猫_CSDN个人主页 &#x1f560; 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 &#x1f35a; 蓝桥云课签约作者、已在蓝桥云…

python多线程和多进程

1.多线程 线程是程序执行的最小单位&#xff0c;一个进程至少有一个线程。 提高并发性。通过线程可方便有效地实现并发性。进程可创建多个线程来执行同一程序的不同部分。 进程之间不能共享内存&#xff0c;但线程之间共享内存非常容易。 Python 常用的多线程库有threading 和…

微信小程序Vue+nodejs教室自习室座位预约系统68u2m

本文从管理员、用户的功能要求出发&#xff0c;教室预约系统小程序中的功能模块主要是实现管理端&#xff1b;首页、个人中心、教室信息管理、教室设备管理、用户管理、教室预约管理、管理员管理、系统管理&#xff0c;微信端&#xff1b;首页、教室信息、教室设备、教室预约、…

【吞噬星空】弧刀盘价值180亿,购买1016名强者,保卫地球

Hello,小伙伴们&#xff0c;我是拾荒君。 国漫《吞噬星空》的第95集更新了&#xff0c;一更新&#xff0c;我和我的小伙伴们就迫不及待地去观看了。在这个集剧中&#xff0c;罗峰在一个奴隶拍卖场中深切地感受到了宇宙中弱肉强食的残酷现实。他看到&#xff0c;在宇宙中&#…

goweb入门教程

本文是作者自己学习goweb时写的笔记&#xff0c;分享给大家&#xff0c;希望能有些帮助 前言&#xff1a; 关于web&#xff1a;本质 ​ ​ web中最重要的就是浏览器和服务器的request(请求)和response(响应)&#xff1b; ​ 一个请求对应一个响应。 一个请求对应一个响应&…

鸿蒙开发ArkUI -常用布局

线性布局(Row/Column) 间距/主轴排列方式/交叉轴对齐方式 Column({}) {Column() {}.width(80%).height(50).backgroundColor(0xF5DEB3)Column() {}.width(80%).height(50).backgroundColor(0xD2B48C)Column() {}.width(80%).height(50).backgroundColor(0xF5DEB3) } .width(1…

vue3通过v-model实现父子组件通信

单一值传递 父组件 <template><div ><h1>v-model实现父子组件通讯</h1><hr><child1 v-model"num"></child1><!-- 上下两个是等价的 --><child1 :modelValue"num" update:modelValue"handle&quo…

软件测试项目经验简历包装怎么写?

软件测试是使用人工或者自动的手段来运行或者测定某个软件系统的过程&#xff0c;其目的在于检验它是否满足规定的需求或弄清预期结果与实际结果之间的差别。 在软件投入使用前&#xff0c;要经过一系列的严格测试&#xff0c;才能保证交付质量。 一、引言 1.编写目的 本文档…

有趣的代码——猜数字游戏的实现

前面介绍过很多的C语言常识&#xff0c;但是我们都知道“兴趣是最好的老师”&#xff0c;所以&#xff0c;今天我们用之前讲过的一些知识&#xff0c;加上部分新补充的知识点&#xff0c;写一个“猜数字”的小游戏&#xff0c;来丰富我们的编程学习生活&#xff0c;感受来自C语…

【小布_ORACLE】Part11-1--RMAN Backups笔记

Oracle的数据备份于恢复RMAN Backups 学习第11章需要掌握&#xff1a; 一.RMAN的备份类型 二.使用backup命令创建备份集 三.创建备份文件 四.备份归档日志文件 五.使用RMAN的copy命令创建镜像拷贝 文章目录 Oracle的数据备份于恢复RMAN Backups1.RMAN Backup Concepts&#x…

云原生系列Go语言篇-编写测试Part 1

本文来自正在规划的​​Go语言&云原生自我提升系列​​&#xff0c;欢迎关注后续文章。 2000年以来&#xff0c;自动化测试的广泛应用可能比任何其他软件工程技术都更能提高代码质量。Go是一种专注于提高软件质量的语言和生态系统&#xff0c;很自然的在其标准库中包含了测…

《2023全球隐私计算报告》正式发布!

2023全球隐私计算报告 1、2023全球隐私计算图谱2、国内外隐私计算相关政策3、隐私计算技术的最新发展4、隐私计算技术的合规挑战5、隐私计算的应用市场动态6、隐私计算开源整体趋势7、隐私计算的未来趋势 11月23日&#xff0c;由浙江省人民政府、商务部共同主办&#xff0c;杭州…

Appium自动化如果出现报错怎么办?这么做确实解决问题

解决通过appium的inspector功能无法启动app的原因 在打开appium-desktop程序&#xff0c;点击inspector功能&#xff0c;填写app的配置信息&#xff0c;启动服务提示如下&#xff1a; 报错信息&#xff1a; An unknown server-side error occurred while processing the com…

牛客 算法题 记负均正II golang实现

题目 HJ105 记负均正II golang 实现 package mainimport ("bufio""fmt""io""os""strconv""strings" )func main() {scanner : bufio.NewScanner(os.Stdin)nums:make([]int,0)sum:0minus:0for scanner.Scan() {l…

java开发需要掌握的maven相关知识和Junit单元测试

maven简介 什么是maven&#xff1a; maven是一款管理和构建java项目的工具&#xff0c;是apache旗下的一个开源项目。 maven的作用&#xff1a; 依赖管理&#xff1a; 方便快捷的管理项目依赖的资源&#xff08;jar包&#xff09;。 项目构建&#xff1a; 标准化的跨平台&#…

20 章 多线程

20.1线程简介. 20.2创建线程 2.1继承Thread类 Thread 类是java.lang包中的一个类&#xff0c;从这个类中实例化的对象代表线程&#xff0c;程序员启动一个新线程需要建立Thread 实例。Thread类中常用的两个构造方法如下: public Thread():创建一个新的线程对象。 public Thre…

【LeetCode】128. 最长连续序列——哈希的应用(3)

文章目录 1、思路2、解题方法3、复杂度时间复杂度:空间复杂度: 4、Code Problem: 128. 最长连续序列 1、思路 我会用一种做题者的思路来去看待这道题。 我们在乍一看到这道题的时候&#xff0c;看到它的时间复杂度要求为O(N)&#xff0c;然后又要求去找序列(就是让你判断这个…

stm32 TIM

一、TIM简介 TIM&#xff08;Timer&#xff09;定时器定时器可以对输入的时钟进行计数&#xff0c;并在计数值达到设定值时触发中断。16位计数器、预分频器、自动重装寄存器的时基单元&#xff0c;在72MHz计数时钟下可以实现最大59.65s的定时定时器不仅具备基本的定时中断功能&…

前端 | iframe框架标签应用

文章目录 &#x1f4da;嵌入方式&#x1f4da;图表加载显示&#x1f4da;100%嵌入及滑动条问题&#x1f4da;加载动画保留 前情提要&#xff1a; 计划用iframe把画好的home1.html&#xff08;echarts各种图表组成的html数据大屏&#xff09;嵌入整合到index.html&#xff08;搭…

只需十分钟快速入门Python,快速了解基础内容学习。零基础小白入门适用。

文章目录 简介特点搭建开发环境版本hello world注释文件类型变量常量数据类型运算符和表达式控制语句数组相关函数相关字符串相关文件处理对象和类连接mysql关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源…