`
netcome
  • 浏览: 482725 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

在 Linux 平台中调试 C/C++ 内存泄漏方法

阅读更多

由于 C 和 C++ 程序中完全由程序员自主申请和释放内存,稍不注意,就会在系统中导入内存错误。同时,内存错误往往非常严重,一般会带来诸如系统崩溃,内存耗尽这样严重的后果。从历史上看,来自计算机应急响应小组和供应商的许多最严重的安全公告都是由简单的内存错误造成的。自从 70 年代末期以来,C/C++ 程序员就一直讨论此类错误,但其影响在 2007 年仍然很大。与许多其他类型的常见错误不同,内存错误通常具有隐蔽性,即它们很难再现,症状通常不能在相应的源代码中找到。例如,无论何时何地发生内存泄漏,都可能表现为应用程序完全无法接受,同时内存泄漏不是显而易见[1]。存在内存错误的 C 和 C++ 程序会导致各种问题。如果它们泄漏内存,则运行速度会逐渐变慢,并最终停止运行;如果覆盖内存,则会变得非常脆弱,很容易受到恶意用户的攻击。

因此,出于这些原因,需要特别关注 C 和 C++ 编程的内存问题,特别是内存泄漏。本文先从如何发现内存泄漏,然后是用不同的方法和工具定位内存泄漏,最后对这些工具进行了比较,另外还简单介绍了资源泄漏的处理(以句柄泄漏为例)。本文使用的测试平台是:Linux (Redhat AS4)。但是这些方法和工具许多都不只是局限于 C/C++ 语言以及 linux 操作系统。

内存泄漏一般指的是堆内存的泄漏。堆内存是指程序从堆中分配的、大小任意的(内存块的大小可以在程序运行期决定)、使用完后必须显示的释放的内存。应用程序一般使用malloc、realloc、new 等函数从堆中分配到一块内存,使用完后,程序必须负责相应的调用 free 或 delete 释放该内存块。否则,这块内存就不能被再次使用,我们就说这块内存泄漏了。

1. 如何发现内存泄漏

有些简单的内存泄漏问题可以从在代码的检查阶段确定。还有些泄漏比较严重的,即在很短的时间内导致程序或系统崩溃,或者系统报告没有足够内存,也比较容易发现。最困难的就是泄漏比较缓慢,需要观测几天、几周甚至几个月才能看到明显异常现象。那么如何在比较短的时间内检测出有没有潜在的内存泄漏问题呢?实际上不同的系统都带有内存监视工具,我们可以从监视工具收集一段时间内的堆栈内存信息,观测增长趋势,来确定是否有内存泄漏。在 Linux 平台可以用 ps 命令,来监视内存的使用,比如下面的命令 (观测指定进程的VSZ值):

ps -aux





回页首


2. 静态分析

包括手动检测和静态工具分析,这是代价最小的调试方法。

2.1 手动检测

当使用 C/C++ 进行开发时,采用良好的一致的编程规范是防止内存问题第一道也是最重要的措施。检测是编码标准的补充。二者各有裨益,但结合使用效果特别好。专业的 C 或 C++ 专业人员甚至可以浏览不熟悉的源代码,并以极低的成本检测内存问题。通过少量的实践和适当的文本搜索,您能够快速验证平衡的 *alloc() 和 free() 或者 new 和 delete 的源主体。人工查看此类内容通常会出现像清单 1 中一样的问题,可以定位出在函数 LeakTest 中的堆变量 Logmsg 没有释放。


清单1. 简单的内存泄漏
                
#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int LeakTest(char * Para)
{
        if(NULL==Para){
                //local_log("LeakTest Func: empty parameter\n");
                return -1;
        }
        char * Logmsg = new char[128];
        if(NULL == Logmsg){
                //local_log("memeory allocation failed\n");
                return -2;
        }
        sprintf(Logmsg,"LeakTest routine exit: '%s'.\n", Para);
        //local_log(Logmsg);
        return 0;
}
int   main(int argc,char **argv )
{
        char szInit [] = "testcase1";
        LeakTest(szInit);
        return 0;
}

2.2 静态代码分析工具

代码静态扫描和分析的工具比较多,比如 splint, PC-LINT, BEAM 等。因为 BEAM 支持的平台比较多,这以 BEAM 为例,做个简单介绍,其它有类似的处理过程。

BEAM 可以检测四类问题: 没有初始化的变量;废弃的空指针;内存泄漏;冗余计算。而且支持的平台比较多。

BEAM 支持以下平台:

  • Linux x86 (glibc 2.2.4)
  • Linux s390/s390x (glibc 2.3.3 or higher)
  • Linux (PowerPC, USS) (glibc 2.3.2 or higher)
  • AIX (4.3.2+)
  • Window2000 以上

清单2. 用作 Beam 分析的代码
                
#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int *p;

void
foo(int a)
{
  int b, c;

  b = 0;
  if(!p) 
    c = 1;

  if(c > a)
    c += p[1];
}

int LeakTest(char * Para)
{
        char * Logmsg = new char[128];
        if((Para==NULL)||(Logmsg == NULL))
                return -1;        
        sprintf(Logmsg,"LeakTest routine exit: '%s'.\n", Para);        
        return 0;
}

int   main(int argc,char **argv )
{
        char szInit [] = "testcase1";
        LeakTest(szInit);
        return 0;
}

下面以 X86 Linux 为例,代码如清单 2,具体的环境如下:

OS: Red Hat Enterprise Linux AS release 4 (Nahant Update 2)

GCC: gcc version 3.4.4

BEAM: 3.4.2; https://w3.eda.ibm.com/beam/

可以把 BEAM 看作一个 C/C++ 编译器,按下面的命令进行编译 (前面两个命令是设置编译器环境变量):

./beam-3.4.2/bin/beam_configure  --c gcc
./beam-3.4.2/bin/beam_configure  --cpp g++
./beam-3.4.2/bin/beam_compile  --beam::compiler=compiler_cpp_config.tcl  -cpp code2.cpp

从下面的编译报告中,我们可以看到这段程序中有三个错误:”内存泄漏”;“变量未初始化”;“ 空指针操作”

"code2.cpp", line 10: warning: variable "b" was set but never used
    int b, c;
        ^

BEAM_VERSION=3.4.2
BEAM_ROOT=/home/hanzb/memdetect
BEAM_DIRECTORY_WRITE_INNOCENTS=
BEAM_DIRECTORY_WRITE_ERRORS=

-- ERROR23(heap_memory)     /*memory leak*/     >>>ERROR23_LeakTest_7b00071dc5cbb458
"code2.cpp", line 24: memory leak
ONE POSSIBLE PATH LEADING TO THE ERROR:
 "code2.cpp", line 22: allocating using `operator new[]' (this memory will not be freed)
 "code2.cpp", line 22: assigning into `Logmsg'
 "code2.cpp", line 24: deallocating `Logmsg' because exiting its scope 
                       (losing last pointer to the memory)

-- ERROR1     /*uninitialized*/     >>>ERROR1_foo_60c7889b2b608
"code2.cpp", line 16: uninitialized `c'
ONE POSSIBLE PATH LEADING TO THE ERROR:
 "code2.cpp", line 10: allocating `c'
 "code2.cpp", line 13: the if-condition is false
 "code2.cpp", line 16: getting the value of `c'

 VALUES AT THE END OF THE PATH:
  p != 0 


-- ERROR2     /*operating on NULL*/     >>>ERROR2_foo_af57809a2b615
"code2.cpp", line 17: invalid operation involving NULL pointer
ONE POSSIBLE PATH LEADING TO THE ERROR:
 "code2.cpp", line 13: the if-condition is true (used as evidence that error is possible)
 "code2.cpp", line 16: the if-condition is true
 "code2.cpp", line 17: invalid operation `[]' involving NULL pointer `p'

 VALUES AT THE END OF THE PATH:
  c = 1 
  p = 0 
  a <= 0

2.3 内嵌程序

可以重载内存分配和释放函数 new 和 delete,然后编写程序定期统计内存的分配和释放,从中找出可能的内存泄漏。或者调用系统函数定期监视程序堆的大小,关键要确定堆的增长是泄漏而不是合理的内存使用。这类方法比较复杂,在这就不给出详细例子了。





回页首


3. 动态运行检测

实时检测工具主要有 valgrind, Rational purify 等。

3.1 Valgrind

valgrind 是帮助程序员寻找程序里的 bug 和改进程序性能的工具。程序通过 valgrind 运行时,valgrind 收集各种有用的信息,通过这些信息可以找到程序中潜在的 bug 和性能瓶颈。

Valgrind 现在提供多个工具,其中最重要的是 Memcheck,Cachegrind,Massif 和 Callgrind。Valgrind 是在 Linux 系统下开发应用程序时用于调试内存问题的工具。它尤其擅长发现内存管理的问题,它可以检查程序运行时的内存泄漏问题。其中的 memecheck 工具可以用来寻找 c、c++ 程序中内存管理的错误。可以检查出下列几种内存操作上的错误:

  • 读写已经释放的内存
  • 读写内存块越界(从前或者从后)
  • 使用还未初始化的变量
  • 将无意义的参数传递给系统调用
  • 内存泄漏

3.2 Rational purify

Rational Purify 主要针对软件开发过程中难于发现的内存错误、运行时错误。在软件开发过程中自动地发现错误,准确地定位错误,提供完备的错误信息,从而减少了调试时间。同时也是市场上唯一支持多种平台的类似工具,并且可以和很多主流开发工具集成。Purify 可以检查应用的每一个模块,甚至可以查出复杂的多线程或进程应用中的错误。另外不仅可以检查 C/C++,还可以对 Java 或 .NET 中的内存泄漏问题给出报告。

在 Linux 系统中,使用 Purify 需要重新编译程序。通常的做法是修改 Makefile 中的编译器变量。下面是用来编译本文中程序的 Makefile:

CC=purify gcc

首先运行 Purify 安装目录下的 purifyplus_setup.sh 来设置环境变量,然后运行 make 重新编译程序。

./purifyplus_setup.sh

下面给出编译一个代码文件的示例,源代码文件命名为 test3.cpp. 用 purify 和 g++ 的编译命令如下,‘-g’是编译时加上调试信息。

purify g++ -g test3.cpp –o test

运行编译生成的可执行文件 test,就可以得到图1,可以定位出内存泄漏的具体位置。

./test


清单3. Purify 分析的代码
                
#include <unistd.h> 
 char * Logmsg;

int LeakTest(char * Para)
{
        if(NULL==Para){
                //local_log("LeakTest Func: empty parameter\n");
                return -1;
        }
        Logmsg = new char[128];
		for (int i = 0 ; i < 128; i++)
			Logmsg[i] = i%64;

        if(NULL == Logmsg){
                //local_log("memeory allocation failed\n");
                return -2;
        }
        sprintf(Logmsg,"LeakTest routine exit: '%s'.\n", Para);
        //local_log(Logmsg);
        return 0;
}

int   main(int argc,char **argv )
{
        char szInit [] = "testcase1";
		int i;
         LeakTest(szInit);
		for (i=0; i < 2; i++){
			if(i%200 == 0)
				LeakTest(szInit);
			sleep(1);
		}        
        return 0;
}

需要指出的是,程序必须编译成调试版本才可以定位到具体哪行代码发生了内存泄漏。即在 gcc 或者 g++ 中,必须使用 "-g" 选项。


图 1 purify 的输出结果
 




回页首


结论

本文介绍了多种内存泄漏,定位方法(包括静态分析,动态实时检测)。涉及到了多个工具,详细描述的它们的用法、用途以及优缺点。对处理其它产品或项目内存泄漏相关的问题有很好的借鉴意义。



参考资料

学习

获得产品和技术
  • 订购 SEK for Linux,共包含两张 DVD,其中有用于 Linux 的最新 IBM 试用软件,包括 DB2®、 Lotus®、Rational®、Tivoli® 和 WebSphere®。 

  • 用可直接从 developerWorks 下载的 IBM 试用软件 构建您的下一个 Linux 开发项目。 


讨论


作者简介

 

韩兆兵,IBM 中国软件开发中心工程师,在 WVS and EVV 组工作,从事 Websphere VoiceServer 的技术支持工作。


 

刘盈,IBM 软件开发中心工程师,在 WVS and EVV 组工作,从事 WebSphere Voice Server 相关产品的软件测试和技术支持工作。


 

强晟,IBM 中国软件开发中心工程师,在 WVS and EVV 组工作,从事 WebSphere Voice Server 相关产品的软件测试和技术支持工作。


分享到:
评论

相关推荐

    Linux 平台中调试 C-C++ 内存泄漏方法

    在 Linux 平台中调试 C-C++ 内存泄漏方法

    C/C++程序内存泄漏检测

    在C/C++编程中,内存管理是至关重要的,因为这些语言不提供自动的垃圾回收机制。程序员必须手动分配和释放内存,如果不小心就会导致内存泄漏,即已经分配但未释放的内存。内存泄漏可能导致程序运行缓慢,占用过多...

    Linux环境下的C/C++小项目

    在Linux环境下进行C/C++编程可以提供一个强大的开发平台,特别是在服务器端应用、嵌入式系统和开源软件开发中。本项目"Linux环境下的C/C++小项目"旨在帮助开发者熟悉Linux下的编程环境,理解其核心概念,并通过实践...

    浅谈C_C++内存泄漏及其检测工具

    在C/C++中,内存泄漏尤其指的是堆内存泄漏,因为堆内存是需要程序员手动管理的,而栈内存会在函数调用结束时自动释放。 C/C++程序员通常使用new/delete运算符和malloc/free函数来分配和释放堆内存。如果程序在申请...

    linux C/C++超有用3

    在Linux系统中,C和C++是两种非常重要的编程语言,尤其对于系统级编程和高性能应用来说,它们是不可或缺的工具。"UNIX环境高级编程"这本书是学习Linux系统编程的经典之作,它深入讲解了如何利用C/C++在Unix/Linux...

    windows下c++内存泄露检测工具使用方

    这样配置之后,当程序在 Debug 模式下运行时,如果存在内存泄露,VLD 将会在 Visual Studio 的输出窗口中报告内存泄露信息。典型的输出示例为: ``` VisualLeakDetector is now exiting. No memory leaks detected....

    linux C/C++超有用4

    在Linux环境下进行C/C++编程是一项重要的技能,尤其对于系统级开发者和软件工程师而言。Linux提供了丰富的工具和库,使得C/C++程序员可以充分利用操作系统的能力。以下是一些关于"Linux C/C++超有用"的知识点: 1. ...

    linux 应用软件 c/c++ 面试题

    在Linux环境下进行C/C++应用软件的开发,面试时可能会涉及到多个方面的问题,这些知识点涵盖了操作系统原理、编程语言特性、软件工程以及系统级编程等多个领域。以下是一些可能的面试重点: 1. **C/C++语言基础**:...

    c/c++企业核心技术代码

    1. **跨平台编程**:C/C++语言的一大优势在于其可移植性,通过标准库和条件编译,代码可以在不同的操作系统(如Windows、Linux、macOS等)上运行。开发者需理解不同平台的API差异,如文件系统、线程管理、网络通信等...

    基于Linux系统下 的,C/C++实现考勤管理系统

    在开发“基于Linux系统的C/C++实现考勤管理系统”时,我们需要深入了解几个关键知识点,包括C/C++编程语言、Linux操作系统、嵌入式系统以及考勤管理系统的具体功能设计。 首先,C/C++是系统级编程的主要语言,它们...

    PHP调用C/C++生成的.so库的详细笔记

    在Linux系统中,.so文件是共享对象(Shared Objects),相当于Windows平台下的.DLL动态链接库。它们包含了可执行代码和数据,可供多个程序同时使用,减少了内存占用。 要将C/C++代码集成到PHP中,我们需要经历以下...

    C和C++嵌入式系统编程_C/C++嵌入式编程_嵌入式_

    3. 动态内存管理:虽然在资源受限的嵌入式环境中有挑战,但C++的智能指针可以帮助管理内存,减少内存泄漏问题。 三、C和C++在嵌入式系统编程的结合 1. C++对C语言的兼容性:C++可以无缝调用C语言编写的库,使得既有...

    Linux man pages C/C++ Reference

    2. 解决编程过程中遇到的问题,如内存泄漏、类型转换错误等。 3. 学习最佳实践,优化代码性能。 4. 了解不同函数间的交互,避免潜在的冲突和问题。 5. 掌握如何使用各种Linux命令和工具,提升系统级编程能力。 man ...

    嵌入式linux应用程序调试方法

    嵌入式 Linux 应用程序调试方法是一份详细的调试指南,涵盖了嵌入式 Linux 的 NFS 开发环境的建立、GDB 调试应用程序、内存工具、C/C++ 代码覆盖、性能 profiling 工具等方面的知识点。下面将对标题、描述、标签和...

    针对C/C++程序的内存测试

    内存泄漏是C/C++编程中一个严重的问题,它可能导致系统性能下降、资源耗尽,甚至系统崩溃。在C和C++中,程序员需要手动管理内存,通过`malloc`、`calloc`、`realloc`、`new`等函数申请内存,然后使用`free`或`delete...

    内存读写驱动的源码(C++)

    9. **调试与测试**:编写完成后,驱动需要经过严格的调试和测试,包括静态代码分析、内存泄漏检查、压力测试和兼容性测试等,以确保其在不同场景下的稳定性和可靠性。 10. **驱动安装与卸载**:驱动的安装通常涉及...

    高质量C/C++编程指南

    ### 高质量C/C++编程指南知识点概览 #### 一、引言 《高质量C/C++编程指南》是一份由林锐博士编写的详细指南,旨在帮助软件开发者提高其编程技能并提升软件质量。该指南最初起草于2001年,并在同年7月正式发布,...

    C/C++及汇编语言源程序调试工具

    在IT领域,编程和调试是开发过程中的关键环节。C/C++和汇编语言作为底层编程的常用工具,其源程序的调试对于优化代码、找出并修复错误至关重要。"Zeta Debugger v1.4_绿色英文特别版"是一款专为这类语言设计的调试...

    【技术点之一】使用 CRT 调试功能来检测内存泄漏.rar_C++检测内存泄露的方法_ROO_YGR_泄漏

    在C++编程中,内存管理是一项关键任务,尤其是在开发大型软件系统时,内存泄漏可能导致程序崩溃、性能下降或资源耗尽。"使用CRT调试功能来检测内存泄漏"是解决这一问题的重要技术点。CRT(C Run-Time Library)是C++...

Global site tag (gtag.js) - Google Analytics