`

linux 进程占用内存详解

 
阅读更多

想必在linux上写过程序的同学都有分析进程占用多少内存的经历,或者被问到这样的问题——你的程序在运行时占用了多少内存(物理内存)?通常我们可以通过top命令查看进程占用了多少内存。这里我们可以看到VIRT、RES和SHR三个重要的指标,他们分别代表什么意思呢?这是本文需要跟大家一起探讨的问题。当然如果更加深入一点,你可能会问进程所占用的那些物理内存都用在了哪些地方?这时候top命令可能不能给到你你所想要的答案了,不过我们可以分析proc文件系统提供的smaps文件,这个文件详尽地列出了当前进程所占用物理内存的使用情况。

这篇blog总共分为三个部分。第一部分简要阐述虚拟内存和驻留内存这两个重要的概念;第二部分解释top命令中VIRT、RES以及SHR三个参数的实际参考意义;最后一部分向大家介绍一下smaps文件的格式,通过分析smaps文件我们可以详细了解进程物理内存的使用情况,比如mmap文件占用了多少空间、动态内存开辟消耗了多少空间、函数调用栈消耗了多少空间等等。

关于内存的两个概念

要理解top命令关于内存使用情况的输出,我们必须首先搞清楚虚拟内存(Virtual Memory)和驻留内存(Resident Memory)两个概念。

【虚拟内存】

首先需要强调的是虚拟内存不同于物理内存,虽然两者都包含内存字眼但是它们属于两个不同层面的概念。进程占用虚拟内存空间大并非意味着程序的物理内存也一定占用很大。虚拟内存是操作系统内核为了对进程地址空间进行管理(process address space management)而精心设计的一个逻辑意义上的内存空间概念。我们程序中的指针其实都是这个虚拟内存空间中的地址。比如我们在写完一段C++程序之后都需要采用g++进行编译,这时候编译器采用的地址其实就是虚拟内存空间的地址。因为这时候程序还没有运行,何谈物理内存空间地址?凡是程序运行过程中可能需要用到的指令或者数据都必须在虚拟内存空间中。既然说虚拟内存是一个逻辑意义上(假象的)的内存空间,为了能够让程序在物理机器上运行,那么必须有一套机制可以让这些假象的虚拟内存空间映射到物理内存空间(实实在在的RAM内存条上的空间)。这其实就是操作系统中页映射表(page table)所做的事情了。内核会为系统中每一个进程维护一份相互独立的页映射表。。页映射表的基本原理是将程序运行过程中需要访问的一段虚拟内存空间通过页映射表映射到一段物理内存空间上,这样CPU访问对应虚拟内存地址的时候就可以通过这种查找页映射表的机制访问物理内存上的某个对应的地址。“页(page)”是虚拟内存空间向物理内存空间映射的基本单元。

      下图1演示了虚拟内存空间和物理内存空间的相互关系,它们通过Page Table关联起来。其中虚拟内存空间中着色的部分分别被映射到物理内存空间对应相同着色的部分。而虚拟内存空间中灰色的部分表示在物理内存空间中没有与之对应的部分,也就是说灰色部分没有被映射到物理内存空间中。这么做也是本着“按需映射”的指导思想,因为虚拟内存空间很大,可能其中很多部分在一次程序运行过程中根本不需要访问,所以也就没有必要将虚拟内存空间中的这些部分映射到物理内存空间上。
 
到这里为止已经基本阐述了什么是虚拟内存了。总结一下就是,虚拟内存是一个假象的内存空间,在程序运行过程中虚拟内存空间中需要被访问的部分会被映射到物理内存空间中。虚拟内存空间大只能表示程序运行过程中可访问的空间比较大,不代表物理内存空间占用也大。
 
t1
 
 

驻留内存】

驻留内存,顾名思义是指那些被映射到进程虚拟内存空间的物理内存。上图1中,在系统物理内存空间中被着色的部分都是驻留内存。比如,A1、A2、A3和A4是进程A的驻留内存;B1、B2和B3是进程B的驻留内存。进程的驻留内存就是进程实实在在占用的物理内存。一般我们所讲的进程占用了多少内存,其实就是说的占用了多少驻留内存而不是多少虚拟内存。因为虚拟内存大并不意味着占用的物理内存大。

关于虚拟内存和驻留内存这两个概念我们说到这里。下面一部分我们来看看top命令中VIRT、RES和SHR分别代表什么意思。

top命令中VIRT、RES和SHR的含义
      搞清楚了虚拟内存的概念之后解释VIRT的含义就很简单了。VIRT表示的是进程虚拟内存空间大小。对应到图1中的进程A来说就是A1、A2、A3、A4以及灰色部分所有空间的总和。也就是说VIRT包含了在已经映射到物理内存空间的部分和尚未映射到物理内存空间的部分总和。
RES的含义是指进程虚拟内存空间中已经映射到物理内存空间的那部分的大小。对应到图1中的进程A来说就是A1、A2、A3以及A4几个部分空间的总和。所以说,看进程在运行过程中占用了多少内存应该看RES的值而不是VIRT的值。
最后来看看SHR所表示的含义。SHR是share(共享)的缩写,它表示的是进程占用的共享内存大小。在上图1中我们看到进程A虚拟内存空间中的A4和进程B虚拟内存空间中的B3都映射到了物理内存空间的A4/B3部分。咋一看很奇怪。为什么会出现这样的情况呢?其实我们写的程序会依赖于很多外部的动态库(.so),比如libc.so、libld.so等等。这些动态库在内存中仅仅会保存/映射一份,如果某个进程运行时需要这个动态库,那么动态加载器会将这块内存映射到对应进程的虚拟内存空间中。多个进展之间通过共享内存的方式相互通信也会出现这样的情况。这么一来,就会出现不同进程的虚拟内存空间会映射到相同的物理内存空间。这部分物理内存空间其实是被多个进程所共享的,所以我们将他们称为共享内存,用SHR来表示。某个进程占用的内存除了和别的进程共享的内存之外就是自己的独占内存了。所以要计算进程独占内存的大小只要用RES的值减去SHR值即可。

进程的smaps文件

查看命令是:cat /proc/进程的pid/smaps

通过top命令我们已经能看出进程的虚拟空间大小(VIRT)、占用的物理内存(RES)以及和其他进程共享的内存(SHR)。但是仅此而已,如果我想知道如下问题:

  1. 进程的虚拟内存空间的分布情况,比如heap占用了多少空间、文件映射(mmap)占用了多少空间、stack占用了多少空间?
  2.  进程是否有被交换到swap空间的内存,如果有,被交换出去的大小?
  3. mmap方式打开的数据文件有多少页在内存中是脏页(dirty page)没有被写回到磁盘的?
  4. mmap方式打开的数据文件当前有多少页面已经在内存中,有多少页面还在磁盘中没有加载到page cahe中?
  5. 等等

以上这些问题都无法通过top命令给出答案,但是有时候这些问题正是我们在对程序进行性能瓶颈分析和优化时所需要回答的问题。所幸的是,世界上解决问题的方法总比问题本身要多得多。linux通过proc文件系统为每个进程都提供了一个smaps文件,通过分析该文件我们就可以一一回答以上提出的问题。

在smaps文件中,每一条记录(如下图2所示)表示进程虚拟内存空间中一块连续的区域。其中第一行从左到右依次表示地址范围、权限标识、映射文件偏移、设备号、inode、文件路径。详细解释可以参见understanding-linux-proc-id-maps

接下来8个字段的含义分别如下:

  1. Size:表示该映射区域在虚拟内存空间中的大小。
  2. Rss:表示该映射区域当前在物理内存中占用了多少空间。
  3. Shared_Clean:和其他进程共享的未被改写的page的大小。
  4. Shared_Dirty: 和其他进程共享的被改写的page的大小。
  5. Private_Clean:未被改写的私有页面的大小。
  6. Swap:表示非mmap内存(也叫anonymous memory,比如malloc动态分配出来的内存)由于物理内存不足被swap到交换空间的大小。
  7. Pss:该虚拟内存区域平摊计算后使用的物理内存大小(有些内存会和其他进程共享,例如mmap进来的)。比如该区域所映射的物理内存部分同时也被另一个进程映射了,且该部分物理内存的大小为1000KB,那么该进程分摊其中一半的内存,即Pss=500KB。t_2

图2. smaps文件示例

有了smap如此详细关于虚拟内存空间到物理内存空间的映射信息,相信大家已经能够通过分析该文件回答上面提出的4个问题。

最后希望所有读者能够通过阅读本文对进程的虚拟内存和物理内存有一个更加清晰认识,并能更加准确理解top命令关于内存的输出,最后可以通过smaps文件更进一步分析进程使用内存的情况

 

转自:https://blog.csdn.net/petib_wangwei/article/details/38225843

分享到:
评论

相关推荐

    嵌入式Linux内存与性能详解-史子旺

    《嵌入式Linux内存与性能详解》一书由史子旺撰写,专注于深入解析Linux内存管理机制以及如何在嵌入式环境中优化系统性能。Linux内存管理是操作系统的核心部分,理解和掌握这一领域对于开发者来说至关重要,尤其是在...

    linux进程间通信详解

    本文将深入探讨Linux进程间通信的多种方法、原理以及实际应用。 一、管道(Pipe) 管道是一种半双工通信方式,允许数据在一个方向上流动。它由一个匿名的、临时的文件描述符实现,数据只能从一端写入,另一端读出。...

    linux进程的内存使用解析( 经典)

    ### Linux进程内存使用详解 #### 一、内存基础概念 在深入探讨Linux进程的内存使用之前,我们需要了解几个基本的概念: 1. **虚拟内存**:指的是由操作系统提供的一个抽象概念,使得每个进程都有一个独立的地址...

    嵌入式Linux内存与性能详解

    ### 嵌入式Linux内存与性能详解 #### 内存管理 **1. 系统当前可用内存** - **概述**:系统当前可用内存是指系统可以立即用于其他任务的空闲内存。对于嵌入式系统而言,由于硬件资源有限,有效管理可用内存至关...

    Linux下的进程间通信 详解

    ### Linux下的进程间通信详解 #### 一、引言 在多进程的环境中,进程间通信(IPC,Inter-Process Communication)是操作系统中一个至关重要的功能。Linux作为一款优秀的开源操作系统,提供了多种进程间通信机制,...

    linux 共享内存详解

    共享内存作为一种高效的进程间通信机制,在Linux系统中被广泛使用。通过合理配置参数和使用适当的同步机制,可以充分发挥共享内存的优势,提高系统的整体性能。掌握共享内存的使用方法,对于开发高性能的多进程应用...

    Linux内存管理详解.ppt

    首先,Linux对外提供的内存管理接口是通过一系列系统调用来实现的,如`sys_brk`用于扩展进程的堆空间,`kmalloc`用于分配小于一页的内存,`kmalloc`的大页版本用于分配大于一页的内存,`vmalloc`则用于非连续内存的...

    linux进程控制详解及演示代码

    接下来,我们将关注《Linux进程编程介绍.pdf》这份文档,它可能涵盖了以下内容:进程的创建与管理(`fork()`, `execve()`等),进程状态(运行、就绪、睡眠等),进程标识符(PID, TID等),以及如何使用`wait()`和`...

    Linux进程管理命令详解.pdf

    Linux进程管理命令详解 Linux进程管理命令详解是Linux操作系统中的一种重要概念。Linux系统可以同时启动多个进程,Linux进程管理命令是管理这些进程的命令。这些命令包括at、bg、&、fg、kill、crontab、jobs、ps、...

    Linux进程间通信详解

    本文将详细解析六种主要的Linux进程间通信方式,并通过实例进行阐述,帮助读者深入理解这些机制。 1. **管道(Pipe)** 管道是一种半双工的通信方式,数据只能单向流动。它利用内核中的环形缓冲区实现,两个进程...

    Linux进程间通信-详解 (经典)

    ### Linux进程间通信详解 #### 一、管道 **1.1 管道概述及相关API应用** 管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。通常由父进程创建管道,并通过管道与子进程进行...

    《Linux 设备驱动开发详解》(宋宝华) 学习笔记.zip

    1. **Linux内核架构**:首先,你需要理解Linux内核的基本结构和工作原理,包括进程管理、内存管理、中断处理和系统调用等核心概念。 2. **设备模型**:Linux设备模型是一个抽象层次,它提供了一种统一的方式来管理...

    嵌入式Linux性能详解-Linux内存管理

    为了有效地减少进程占用的内存,首先需要了解进程内存使用的各个方面,包括: - **虚拟内存与物理内存**:现代操作系统通常采用虚拟内存机制,为每个进程提供独立的地址空间。虚拟内存空间被映射到实际物理内存中。...

    linux进程间通信与同步.pdf

    ### Linux进程间通信与同步详解 #### 一、概述 在多任务操作系统中,进程间通信与同步机制是解决进程间数据交换与资源共享的关键技术。这些机制确保了多个并发运行的任务能够有效地协作,并且避免了资源冲突。对于...

    Linux进程管理命令详解:ps、kill、pkill的使用方法

    内容概要:本文详细讲解了在 Linux环境中常用的几个用于管理进程的命令,其中包括如何使用ps查看进程,kill终止指定 PID的进程,以及 pkill和 pgrep通过名字来定位并操作相关进程。此外还介绍了 htop,pstree等可视...

    Linux top 命令详解

    * 用户进程空间内改变过优先级的进程占用 CPU 百分比 * 空闲 CPU 百分比 * 等待输入输出的 CPU 时间百分比 最后两行为内存信息。内容如下: * 物理内存总量 * 使用的物理内存总量 * 空闲内存总量 * 用作内核缓存的...

    Linux查看CPU和内存使用情况

    ### Linux查看CPU和内存使用情况详解 在Linux系统管理中,了解CPU和内存的使用情况是至关重要的。这不仅有助于日常的系统监控,还能在问题出现时迅速定位并解决。本文将详细介绍如何在Linux环境下使用`top`命令查看...

    Linux进程调度策略分析

    `task_struct`实际上就是通常所说的进程控制块(PCB),它包含了进程的所有相关信息,如进程ID、状态、内存使用情况等。进程的状态在Linux中主要分为五种: 1. **TASK_RUNNING(运行状态)**:无论是进程正在占用CPU...

    linux ps 命令详解

    在日常运维中,`ps`命令常用于排查问题,例如找出占用CPU或内存高的进程,或者查找僵尸进程。同时,它也是编写shell脚本获取进程信息的重要工具。 综上所述,`ps`命令是Linux系统管理中的必备工具,通过灵活运用其...

    嵌入式Linux应用程序开发详解

    嵌入式系统领域的Linux应用程序开发有其独特性,因为资源有限,所以需要对性能和内存使用有精细的控制。本书会讲解如何优化代码以适应这些限制,以及如何使用调试工具如GDB来查找和修复问题。此外,还将介绍如何构建...

Global site tag (gtag.js) - Google Analytics