在做性能profile的时候,直观上感觉应该在profile的时候只记录基本数据,在最终记录完成后一次性进行符号解析,防止对系统性能造成影响。
所以写的probe脚本是这样的:
systemtap script:
global bts; // backtraces
probe timer.profile {
if (pid() == target()) {
bts[ubacktrace()] ++; // record every tick when in specific process
}
}
probe timer.s(5) {
exit(); // exit after 5 seconds
}
probe end {
foreach (count = bt in bts-) {
print_usyms(bt);
printf("\t%d\n", count);
}
}
但实际使用过程中,print_usyms()总是无法将符号解析出来。
怀疑stap命令行参数出错,将stap manual看了一遍又一遍,将-d/-ldd/--skip-badvars/--all-modules这些只要看着相关的参数一个个都加上了,还是不行。
怀疑stap版本太低,编译了最新版本也不行。
怀疑probe end时符号信息已经不存在了,在probe timer.profile中进行输出:
global bts;
global requestquit;
global quit;
probe begin {
requestquit = 0;
quit = 0;
}
probe timer.profile {
if (!requestquit) {
if (pid() == target()) {
bts[ubacktrace()] ++
}
} else {
if (!quit) {
quit = 1;
foreach (count = bt in bts-) {
print_usyms(bt);
printf("\t%d\n", count);
}
exit();
}
}
probe timer.s(5) {
requestquit = 1;
}
满怀信心去尝试,沮丧地发现还是不行。
最终忽然想到,timer类打点都是异步的,大部分timer.profile打点时(也就是每一个jiffy时钟中断发生时),当前cpu很可能没有执行到target()进程,这样print_usyms/print_ustack很可能拿不到当前进程的符号信息。print_usyms应该在pid()==target()时执行才能展示该进程的符号信息!再改:
global bts
global requestquit
global quit
probe begin {
requestquit = 0
quit = 0
}
probe timer.profile {
if (pid() == target()) {
if (!requestquit) {
bts[ubacktrace()] ++
} else {
if (!quit) {
quit = 1;
foreach (count = bt in bts-) {
print_syms(bt);
printf("\t%d\n", count);
}
exit();
}
}
}
}
probe timer.s(5) {
requestquit = 1
}
哈哈,搞定。
总结两点经验教训:
1. timer类异步事件发生时,cpu很可能没有在执行你希望观测的进程。实际上对于被监测的把单核占满的测试程序,在6核机器上,timer.profile只有1/4~1/3的打点是在target进程中的。
2. 当解析用户态符号时,如果当前上下文不是被观测的进程,则无法解析。
相关推荐
总之,Ubuntu加上SystemTap提供了一套完整的环境,可以让开发者和系统管理员在Linux内核和用户空间开发测试过程中,更加高效地进行问题定位和性能优化。通过熟练掌握SystemTap的使用,能够提升对Linux系统深层次问题...
它能够追踪内核和用户空间应用程序的行为,包括但不限于进程活动、文件系统操作、网络通信等,从而帮助用户识别性能瓶颈、调试问题和优化系统配置。 ### 二、使用SystemTap #### 2.1 安装与设置 - **安装...
systemTap是一款强大的Linux系统诊断工具,它允许用户以脚本方式收集、分析系统运行时的信息,主要用于解决性能问题和功能故障。这个压缩包文件“systemTap英文文档集合.7z”包含了多份关于systemTap的重要参考资料...
SystemTap是一种用于Linux内核调试和性能分析的工具,它允许用户编写脚本来检查运行中的内核。SystemTap脚本使用一种专门...通过上述介绍的知识点,用户可以编写出符合需求的SystemTap脚本,进而深入地分析和解决问题。
在实际使用SystemTap进行问题诊断之前,用户应该确保自己熟悉系统操作和调试流程,避免在运行时引发系统错误或不稳定。 SystemTap的初学者在使用之前最好先了解一些基本概念,例如进程、线程、内存管理等,并且需要...
SystemTap提供了飞行记录器模式(Flight Recorder Mode),它可以记录系统信息到内存中或保存到文件中,方便后续分析。 SystemTap的优势在于它的灵活性和强大功能,但它也有局限性,例如,它可能无法完全兼容所有...
2. **动态插入探针**:SystemTap可以在运行时安全地插入探针到内核函数、模块、用户空间程序,甚至特定的指令上。 3. **数据收集与分析**:它可以收集系统调用、内存使用、CPU活动等各种数据,并进行分析,帮助定位...
systemtap是什么?如何通过systemtap对应用程序内核程序进行调试?如何编写运行systemtap脚本?
1. 权限问题:在Android上运行SystemTap通常需要root权限,因为涉及到内核级别的操作。 2. 兼容性:不是所有版本的Android内核都支持SystemTap,需要确认设备的内核版本和特性。 3. 性能影响:SystemTap的运行会占用...
SystemTap是Linux操作系统中的一款强大的动态诊断工具,它允许用户以脚本语言的方式对系统进行监控和调试。在CentOS 7.4.1708这个特定的环境中,SystemTap通过RPM(Red Hat Package Manager)包的形式提供,使得用户...
SystemTap的引入使得开发者能够在不影响系统运行的情况下,获取详尽的运行数据,这对系统性能的提升和问题排查提供了有力的支持。设计出这样一个高效、灵活且直观的性能分析系统,对于满足用户需求、推动Linux服务器...
systemtap script examples , cross compile from x86 to arm.
systemtap_tutorial