`
spartan1
  • 浏览: 365103 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

systemtap用户态堆栈符号解析不到的问题

 
阅读更多


在做性能profile的时候,直观上感觉应该在profile的时候只记录基本数据,在最终记录完成后一次性进行符号解析,防止对系统性能造成影响。
所以写的probe脚本是这样的:

systemtap script:


global bts; // backtraces
probe timer.profile {
    ​if (pid() == target()) {
    ​    ​bts[ubacktrace()] ++; // record every tick when in specific process
    ​}
}

probe timer.s(5) {
    ​exit(); // exit after 5 seconds
}

probe end {
    ​foreach (count = bt in bts-) {
    ​    ​print_usyms(bt);
    ​    ​printf("\t%d\n", count);
    ​}
}



但实际使用过程中,print_usyms()总是无法将符号解析出来。

怀疑stap命令行参数出错,将stap manual看了一遍又一遍,将-d/-ldd/--skip-badvars/--all-modules这些只要看着相关的参数一个个都加上了,还是不行。

怀疑stap版本太低,编译了最新版本也不行。

怀疑probe end时符号信息已经不存在了,在probe timer.profile中进行输出:


global bts;
global requestquit;
global quit;

probe begin {
    ​requestquit = 0;
    ​quit = 0;

}

probe timer.profile {
    if (!requestquit) {
    ​    ​if (pid() == target()) {
    ​    ​    ​bts[ubacktrace()] ++
    ​    ​}
    ​} else {
    ​    ​if (!quit) {
    ​    ​    ​quit = 1;
    ​    ​    ​foreach (count = bt in bts-) {
    ​    ​    ​    ​print_usyms(bt);
    ​    ​    ​    ​printf("\t%d\n", count);
    ​    ​    ​}
    ​    ​    ​exit();
    ​}
}

probe timer.s(5) {
    ​requestquit = 1;
}



满怀信心去尝试,沮丧地发现还是不行。

最终忽然想到,timer类打点都是异步的,大部分timer.profile打点时(也就是每一个jiffy时钟中断发生时),当前cpu很可能没有执行到target()进程,这样print_usyms/print_ustack很可能拿不到当前进程的符号信息。print_usyms应该在pid()==target()时执行才能展示该进程的符号信息!再改:


global bts
global requestquit
global quit

probe begin {
    ​requestquit = 0
    ​quit = 0
}

probe timer.profile {
    ​if (pid() == target()) {
    ​    ​if (!requestquit) {
    ​    ​    ​bts[ubacktrace()] ++
    ​    ​} else {
    ​    ​    ​if (!quit) {
    ​    ​    ​    ​quit = 1;
    ​    ​    ​    ​foreach (count = bt in bts-) {
    ​    ​    ​    ​    ​print_syms(bt);
    ​    ​    ​    ​    ​printf("\t%d\n", count);
    ​    ​    ​    ​}
    ​    ​    ​    ​exit();
    ​    ​    ​}
    ​    ​}
    ​}
}

probe timer.s(5) {
    ​requestquit = 1
}


哈哈,搞定。

总结两点经验教训:
1. timer类异步事件发生时,cpu很可能没有在执行你希望观测的进程。实际上对于被监测的把单核占满的测试程序,在6核机器上,timer.profile只有1/4~1/3的打点是在target进程中的。

2. 当解析用户态符号时,如果当前上下文不是被观测的进程,则无法解析。

分享到:
评论

相关推荐

    Ubuntu+Systemtap进行Linux内核和用户空间开发测试

    总之,Ubuntu加上SystemTap提供了一套完整的环境,可以让开发者和系统管理员在Linux内核和用户空间开发测试过程中,更加高效地进行问题定位和性能优化。通过熟练掌握SystemTap的使用,能够提升对Linux系统深层次问题...

    systemTap英文文档集合.7z

    systemTap是一款强大的Linux系统诊断工具,它允许用户以脚本方式收集、分析系统运行时的信息,主要用于解决性能问题和功能故障。这个压缩包文件“systemTap英文文档集合.7z”包含了多份关于systemTap的重要参考资料...

    systemtap脚本编写基础很详细

    SystemTap是一种用于Linux内核调试和性能分析的工具,它允许用户编写脚本来检查运行中的内核。SystemTap脚本使用一种专门...通过上述介绍的知识点,用户可以编写出符合需求的SystemTap脚本,进而深入地分析和解决问题。

    systemtap tutorial

    在实际使用SystemTap进行问题诊断之前,用户应该确保自己熟悉系统操作和调试流程,避免在运行时引发系统错误或不稳定。 SystemTap的初学者在使用之前最好先了解一些基本概念,例如进程、线程、内存管理等,并且需要...

    systemtap beginner

    SystemTap提供了飞行记录器模式(Flight Recorder Mode),它可以记录系统信息到内存中或保存到文件中,方便后续分析。 SystemTap的优势在于它的灵活性和强大功能,但它也有局限性,例如,它可能无法完全兼容所有...

    systemtap elfutils

    2. **动态插入探针**:SystemTap可以在运行时安全地插入探针到内核函数、模块、用户空间程序,甚至特定的指令上。 3. **数据收集与分析**:它可以收集系统调用、内存使用、CPU活动等各种数据,并进行分析,帮助定位...

    使用systemtap进行调试介绍

    systemtap是什么?如何通过systemtap对应用程序内核程序进行调试?如何编写运行systemtap脚本?

    cpp-一系列脚本工具和源代码用于在Android上构建安装和运行SystemTap

    1. 权限问题:在Android上运行SystemTap通常需要root权限,因为涉及到内核级别的操作。 2. 兼容性:不是所有版本的Android内核都支持SystemTap,需要确认设备的内核版本和特性。 3. 性能影响:SystemTap的运行会占用...

    centos7.4.1708 的systemtap的rpm包及其依赖

    SystemTap是Linux操作系统中的一款强大的动态诊断工具,它允许用户以脚本语言的方式对系统进行监控和调试。在CentOS 7.4.1708这个特定的环境中,SystemTap通过RPM(Red Hat Package Manager)包的形式提供,使得用户...

    基于SystemTap的Linux服务器性能分析系统的设计与实现.pdf

    SystemTap的引入使得开发者能够在不影响系统运行的情况下,获取详尽的运行数据,这对系统性能的提升和问题排查提供了有力的支持。设计出这样一个高效、灵活且直观的性能分析系统,对于满足用户需求、推动Linux服务器...

    systemtap-testsuite

    systemtap script examples , cross compile from x86 to arm.

    systemtap_tutorial

    systemtap_tutorial

Global site tag (gtag.js) - Google Analytics