服务器 
首页 > 服务器 > 浏览文章

浅析Linux下利用coredump技术追查进程崩溃原因

(编辑:jimmy 日期: 2024/11/19 浏览:3 次 )

最近项目中出现了一个问题,服务器端程序会突然崩溃退出,我们采取了coredump技术以找到崩溃原因,即确定进程退出时正在执行的函数是哪个,其状态如何。

如果系统开启了coredump,准确的说如果当前的shell环境开启了coredump,当前shell环境下的程序崩溃退出时,会把当时进程的栈的内存状态写入core文件。使用gdb可以查看这个core文件中保存的栈的状态,gdb a.out core。(关于coredump的开启和对shell的理解,请参考本人另一篇博客《使用dotnet-dump 查找 .net core 3.0 占用CPU 100%的原因解析》,关于gdb请参考《gdb调试命令的使用及总结》)

core文件生成的位置默认是可执行文件所在的位置,名称默认为core,其位置和名称是可以设置的,我的设置为:

mkdir /home/corefile 
echo “/home/corefile/core-%e-%p-%t” > /proc/sys/kernel/core_pattern 

这样,生成的core文件会放在/home/corefile目录下,core文件名会以core-%e-%p-%t的形式出现,其中%e表示可执行文件的名称,%p表示进程,%t表示生成core文件的时间(注意是unix时间)。

下面是一个可以导致coredump的例程:

浅析Linux下利用coredump技术追查进程崩溃原因

划线处是会导致coredump处。执行后会在/home/corefile目录下产生以下文件:

[root@localhostwin7]# ls /home/corefile/

浅析Linux下利用coredump技术追查进程崩溃原因

a.out是可执行文件名,5082是PID,1490760381是产生该文件的unix时间。把a.out 和core文件放在一个目录下,使用命令:

gdb a.out core-a.out-5082-1490760381

进入gdb,然后使用backtrace命令,即可看进程退出时的栈的内存状态,如下所示:

浅析Linux下利用coredump技术追查进程崩溃原因

可见,进程退出时,执行的最后一个函数是square函数。 ————————————————

总结

以上所述是小编给大家介绍的Linux下利用coredump技术追查进程崩溃原因,希望对大家有所帮助,如果大家有任何疑问欢迎给我留言,小编会及时回复大家的!

上一篇:概述Linux TTY/PTS的区别
下一篇:Linux 添加开机启动方法(服务/脚本)
一句话新闻
一文看懂荣耀MagicBook Pro 16
荣耀猎人回归!七大亮点看懂不只是轻薄本,更是游戏本的MagicBook Pro 16.
人们对于笔记本电脑有一个固有印象:要么轻薄但性能一般,要么性能强劲但笨重臃肿。然而,今年荣耀新推出的MagicBook Pro 16刷新了人们的认知——发布会上,荣耀宣布猎人游戏本正式回归,称其继承了荣耀 HUNTER 基因,并自信地为其打出“轻薄本,更是游戏本”的口号。
众所周知,寻求轻薄本的用户普遍更看重便携性、外观造型、静谧性和打字办公等用机体验,而寻求游戏本的用户则普遍更看重硬件配置、性能释放等硬核指标。把两个看似难以相干的产品融合到一起,我们不禁对它产生了强烈的好奇:作为代表荣耀猎人游戏本的跨界新物种,它究竟做了哪些平衡以兼顾不同人群的各类需求呢?