`

linux动态库加载的秘密

 
阅读更多

linux 下有动态库和静态库,动态库以.so为扩展名,静态库以.a为扩展名。二者都使用广泛。本文主要讲动态库方面知识。

   
   基本上每一个linux 程序都至少会有一个动态库,查看某个程序使用了那些动态库,使用ldd命令查看 
  1. # ldd /bin/ls
  2. linux-vdso.so.=> (0x00007fff597ff000)
  3. libselinux.so.=> /lib64/libselinux.so.(0x00000036c2e00000)
  4. librt.so.=> /lib64/librt.so.(0x00000036c2200000)
  5. libcap.so.=> /lib64/libcap.so.(0x00000036c4a00000)
  6. libacl.so.=> /lib64/libacl.so.(0x00000036d0600000)
  7. libc.so.=> /lib64/libc.so.(0x00000036c1200000)
  8. libdl.so.=> /lib64/libdl.so.(0x00000036c1600000)
  9. /lib64/ld-linux-x86-64.so.(0x00000036c0e00000)
  10. libpthread.so.=> /lib64/libpthread.so.(0x00000036c1a00000)
  11. libattr.so.=> /lib64/libattr.so.(0x00000036cf600000)

   这么多so,是的。使用ldd显示的so,并不是所有so都是需要使用的,下面举个例子

main.cpp
  1. #include <stdio.h>
  2. #include <iostream>
  3. #include <string>
  4. using namespace std;
  5. int main ()
  6. {
  7.    cout << "test" << endl;
  8.    return 0;
  9. }
   使用缺省参数编译结果
  1. # g++ -o demo main.cpp
  2. # ldd demo
  3.     linux-vdso.so.=> (0x00007fffcd1ff000)
  4.         libstdc++.so.=> /usr/lib64/libstdc++.so.(0x00007f4d02f69000)
  5.         libm.so.=> /lib64/libm.so.(0x00000036c1e00000)
  6.         libgcc_s.so.=> /lib64/libgcc_s.so.(0x00000036c7e00000)
  7.         libc.so.=> /lib64/libc.so.(0x00000036c1200000)
  8.         /lib64/ld-linux-x86-64.so.(0x00000036c0e00000)
   如果我链接一些so,但是程序并不用到这些so,又是什么情况呢,下面我加入链接压缩库,数学库,线程库
  1. # g++ -o demo -lz -lm -lrt main.cpp
  2. # ldd demo
  3.         linux-vdso.so.=> (0x00007fff0f7fc000)
  4.         libz.so.1 => /lib64/libz.so.1 (0x00000036c2600000)
  5.         librt.so.1 => /lib64/librt.so.1 (0x00000036c2200000)
  6.         libstdc++.so.=> /usr/lib64/libstdc++.so.(0x00007ff6ab70d000)
  7.         libm.so.6 => /lib64/libm.so.6 (0x00000036c1e00000)
  8.         libgcc_s.so.=> /lib64/libgcc_s.so.(0x00000036c7e00000)
  9.         libc.so.=> /lib64/libc.so.(0x00000036c1200000)
  10.         libpthread.so.=> /lib64/libpthread.so.(0x00000036c1a00000)
  11.         /lib64/ld-linux-x86-64.so.(0x00000036c0e00000)

  看看,虽然没有用到,但是一样有链接进来,那看看程序启动时候有没有去加载它们呢

  1. # strace ./demo
  2.     execve("./demo", ["./demo"], [/* 30 vars */]) = 0
  3.     ... = 0
  4.     open("/lib64/libz.so.1", O_RDONLY) = 3
  5.     ...
  6.     close(3) = 0
  7.     open("/lib64/librt.so.1", O_RDONLY) = 3
  8.     ...
  9.     close(3) = 0
  10.     open("/usr/lib64/libstdc++.so.6", O_RDONLY) = 3
  11.     ...
  12.     close(3) = 0
  13.     open("/lib64/libm.so.6", O_RDONLY) = 3
  14.     ...
  15.     close(3) = 0
  16.     open("/lib64/libgcc_s.so.1", O_RDONLY) = 3
  17.     ...
  18.     close(3) = 0
  19.     open("/lib64/libc.so.6", O_RDONLY) = 3
  20.     ...
  21.     close(3) = 0
  22.     open("/lib64/libpthread.so.0", O_RDONLY) = 3
  23.     ...
  24.     close(3) = 0
  25.     ...
  看,有加载,所以必定会影响进程启动速度,所以我们最后不要把无用的so编译进来,这里会有什么影响呢?
   大家知不知道linux从程序(program或对象)变成进程(process或进程),要经过哪些步骤呢,这里如果详细的说,估计要另开一篇文章。简单的说分三步:
    1、fork进程,在内核创建进程相关内核项,加载进程可执行文件;
    2、查找依赖的so,一一加载映射虚拟地址
    3、初始化程序变量。
  可以看到,第二步中dll依赖越多,进程启动越慢,并且发布程序的时候,这些链接但没有使用的so,同样要一起跟着发布,否则进程启动时候,会失败,找不到对应的so。所以我们不能像上面那样,把一些毫无意义的so链接进来,浪费资源。但是开发人员写makefile 一般有没有那么细心,图省事方便,那么有什么好的办法呢。继续看下去,下面会给你解决方法。
  先使用 ldd -u demo 查看不需要链接的so,看下面,一面了然,无用的so全部暴露出来了吧
  1. # ldd -u demo
  2. Unused direct dependencies:
  3.         /lib64/libz.so.1
  4.         /lib64/librt.so.1
  5.         /lib64/libm.so.6
  6.         /lib64/libgcc_s.so.1
  使用 -Wl,--as-needed 编译选项
  1. # g++ -Wl,--as-needed -o demo -lz -lm -lrt main.cpp
  2. # ldd demo
  3.         linux-vdso.so.=> (0x00007fffebfff000)
  4.         libstdc++.so.=> /usr/lib64/libstdc++.so.(0x00007ff665c05000)
  5.         libc.so.=> /lib64/libc.so.(0x00000036c1200000)
  6.         libm.so.=> /lib64/libm.so.(0x00000036c1e00000)
  7.         /lib64/ld-linux-x86-64.so.(0x00000036c0e00000)
  8.         libgcc_s.so.=> /lib64/libgcc_s.so.(0x00000036c7e00000)
  9. # ldd -u demo
  10. Unused direct dependencies:

 

 

我们知道linux链接so有两种途径:显示和隐式。所谓显示就是程序主动调用dlopen打开相关so;这里需要补充的是,如果使用显示链接,上篇文章讨论的那些问题都不存在。首先,dlopen的so使用ldd是查看不到的。其次,使用dlopen打开的so并不是在进程启动时候加载映射的,而是当进程运行到调用dlopen代码地方才加载该so,也就是说,如果每个进程显示链接a.so;但是如果发布该程序时候忘记附带发布该a.so,程序仍然能够正常启动,甚至如果运行逻辑没有触发运行到调用dlopen函数代码地方。该程序还能正常运行,即使没有a.so.

 

  既然显示加载这么多优点,那么为什么实际生产中很少码农使用它呢, 主要原因还是起使用不是很方便,需要开发人员多写不少代码。所以不被大多数码农使用,还有一个重要原因应该是能提前发现错误,在部署的时候就能发现缺少哪些so,而不是等到实际上限运行的时候才发现缺东少西。

 

  下面举个工作中最常碰到的问题,来引申出本篇内容吧。

写一个最简单的so, tmp.cpp

1.    int test()

2.    {

3.      return 20;

4.    }

  编译=>链接=》运行, 下面main.cpp 内容请参见上一篇文章。

[stevenrao]$ g++ -fPIC -c tmp.cpp

[stevenrao]$ g++ -shared -o libtmp.so tmp.o

[stevenrao]$ mv libtmp.so /tmp/

[stevenrao]$ g++ -o demo -L/tmp -ltmp main.cpp

[stevenrao]$ ./demo

./demo: error while loading shared libraries: libtmp.so: cannot open shared object file: No such file or directory

 

 

 

 

[stevenrao]$ g++ -fPIC -c tmp.cpp

[stevenrao]$ g++ -shared -o libtmp.so tmp.o

[stevenrao]$ mv libtmp.so /tmp/

[stevenrao]$ g++ -o demo -L/tmp -ltmp main.cpp

[stevenrao]$ ./demo

./demo: error while loading shared libraries: libtmp.so: cannot open shared object file: No such file or directory

[stevenrao]$ ldd demo

linux-vdso.so.1 => (0x00007fff7fdc1000)

        libtmp.so => not found

 

[stevenrao]$ ldd demo

linux-vdso.so.1 =>  (0x00007fff7fdc1000)

        libtmp.so => not found

   这个错误是最常见的错误了。运行程序的时候找不到依赖的so。一般人使用方法是修改LD_LIBRARY_PATH这个环境变量

   export LD_LIBRARY_PATH=/tmp

[stevenrao]$ ./demo

test

   这样就OK了, 不过这样export 只对当前shell有效,当另开一个shell时候,又要重新设置。可以把export LD_LIBRARY_PATH=/tmp 语句写到 ~/.bashrc中,这样就对当前用户有效了,写到/etc/bashrc中就对所有用户有效了。

   前面链接时候使用 -L/tmp/ -ltmp 是一种设置相对路径方法,还有一种绝对路径链接方法。

[stevenrao]$ g++ -o demo  /tmp/libtmp.so main.cpp

[stevenrao]$ ./demo

  test

[stevenrao]$ ldd demo

        linux-vdso.so.1 =>  (0x00007fff083ff000)

        /tmp/libtmp.so (0x00007f53ed30f000) 

绝对路径虽然申请设置环境变量步骤,但是缺陷也是致命的,这个so必须放在绝对路径下,不能放到其他地方,这样给部署带来很大麻烦。所以应该禁止使用绝对路径链接so。

   

   搜索路径分两种,一种是链接时候的搜索路径,一种是运行时期的搜索路径。像前面提到的 -L/tmp/ 是属于链接时期的搜索路径,即给ld程序提供的编译链接时候寻找动态库路径;而 LD_LIBRARY_PATH则既属于链接期搜索路径,又属于运行时期的搜索路径。

   

   这里需要介绍链-rpath链接选项,它是指定运行时候都使用的搜索路径。聪明的同学马上就想到,运行时搜索路径,那它记录在哪儿呢。也像. LD_LIBRARY_PATH那样,每部署一台机器就需要配一下吗。呵呵,不需要..,因为它已经被硬编码到可执行文件内部了。看看下面演示

[stevenrao] $ g++ -o demo -L /tmp/ -ltmp main.cpp

[stevenrao] $ ./demo

./demo: error while loading shared libraries: libtmp.so: cannot open shared object file: No such file or directory

[stevenrao] $ g++ -o demo -Wl,-rpath /tmp/ -L/tmp/ -ltmp main.cpp

[stevenrao] $ ./demo

test

[stevenrao] $ readelf -d demo

Dynamic section at offset 0xc58 contains 26 entries:

  Tag        Type                         Name/Value

 0x0000000000000001 (NEEDED)             Shared library: [libtmp.so]

 0x0000000000000001 (NEEDED)             Shared library: [libstdc++.so.6]

 0x0000000000000001 (NEEDED)             Shared library: [libm.so.6]

 0x0000000000000001 (NEEDED)             Shared library: [libgcc_s.so.1]

 0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]

 0x000000000000000f (RPATH)              Library rpath: [/tmp/]

 0x000000000000001d (RUNPATH)            Library runpath: [/tmp/]

   看看是吧,编译到elf文件内部了,路径和程序深深的耦合到一起

继续上一篇《 linux下so动态库一些不为人知的秘密(中) 》介绍so搜索路径,还有一个类似于-path,叫LD_RUN_PATH环境变量, 它也是把路径编译进可执行文件内,不同的是它只设置RPATH。

 [stevenrao] g++ -o demo -L /tmp/  -ltmp main.cpp
 [stevenrao] readelf -d demo
 Dynamic section at offset 0xb98 contains 25 entries:
  Tag        Type                         Name/Value
 0x0000000000000001 (NEEDED)             Shared library: [libtmp.so]
 ....
 0x000000000000000f (RPATH)              Library rpath: [/tmp/]
 
  另外还可以通过配置/etc/ld.so.conf,在其中加入一行
  /tmp/
  这个配置项也是只对运行期有效,并且是全局用户都生效,需要root权限修改,修改完后需要使用命令ldconfig 将 /etc/ld.so.conf 加载到ld.so.cache中,避免重启系统就可以立即生效。
  除了前面介绍的那些搜索路径外,还有缺省搜索路径/usr/lib/ /lib/ 目录,可以通过-z nodefaultlib编译选项禁止搜索缺省路径。
  [stevenrao] $ g++ -o demo -z nodefaultlib  -L/tmp -ltmp main.cpp
  [stevenrao] $  ./demo
   ./demo: error while loading shared libraries: libstdc++.so.6: cannot open shared object file
 
  这么多搜索路径,他们有个先后顺序如下
  1、RUMPATH 优先级最高
  2、RPATH   其次
  3、LD_LIBRARY_PATH
  4、/etc/ld.so.cache
  5、/usr/lib/ /lib/
 
  查看一个程序搜索其各个动态库另一个简单的办法是使用 LD_DEBUG这个环境变量;
  [stevenrao] $ export LD_DEBUG=libs
  [stevenrao] $ ./demo

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    二进制的秘密1

    【二进制的秘密1】这篇文章主要探讨了如何在Linux环境下使用命令行工具分析二进制文件,特别是可执行文件的属性和内部结构。在深入这个主题之前,我们首先需要了解一些基本概念。 **二进制文件格式** 在*nix系统...

    第6章 第一个Linux应用程序.ppt

    动态库在运行时加载,允许代码共享,减少磁盘空间占用和加载时间。对比静态链接和动态链接的效果,可以通过`gcc -static hello_test.c`和`gcc hello_test.c`编译同一个程序,观察生成的可执行文件大小差异。 6.3 ...

    详细的Linux-pam配置

    * `/usr/lib/security/pam_*.so`:可动态加载的 PAM 服务模块 PAM 的配置 PAM 的配置是通过单个配置文件 `/etc/pam.conf` 或者配置目录 `/etc/pam.d/` 实现的。配置文件是由多行组成的,每行的格式如下: `...

    单片机的小秘密 指令数据都被写在了哪?

    此外,PC上运行的程序一般都依赖于操作系统提供的动态链接库(DLL)或共享对象(SO),而单片机上的程序则通常使用静态链接的方式。这是由于单片机的内存资源有限,为了节省空间,单片机程序往往将所有必要的函数和...

    Harmony.2.2.2.0-Harmony 为您提供了一种优雅且高级的方式来更改用 C# 编写的应用程序中的功能完整项目源码

    它在游戏中效果很好,并且在 7 天死亡、战斗技术、围攻、城市:天际线、坎巴拉太空计划、氧气不包括、乌鸦菲尔德、边缘世界、庇护所、星露谷、斯塔塞尔、深海、终极书游戏、总矿工、未转动、SCP:秘密实验室等游戏中...

    ioncube_loaders

    这些文件可能有如 "ioncube_loader_lin_x86-64.so"(Linux平台的64位加载器)、"ioncube_loader_win_x86.dll"(Windows平台的32位动态链接库)等,这些是IonCube扩展的具体实现,用于不同操作系统和PHP版本。...

    binwalk windows python版

    3. **扩展性**:Python 是一种动态类型的语言,拥有丰富的第三方库支持,这使得 `binwalk` 的功能可以轻松地通过编写插件进行扩展。 ### 三、binwalk 使用教程 1. **安装**:在 Windows 上,首先确保已经安装了 ...

    Wifi加密工具移植文档

    配置和编译安装OpenSSL的过程涉及到为特定的处理器架构(如本例中的arm-cortex_a8-linux-gnueabi)编译库文件,并安装到指定路径。在编译完成后,相关的库文件会被放置在工作目录中的wifi目录下,以备后续步骤使用。...

    C语言编程透视

    本章节将深入分析动态链接的过程,包括共享库的加载机制、符号解析以及动态链接器的作用。此外,还将探讨动态链接带来的优势和潜在的问题。 ##### 缓冲区溢出与注入分析 安全是软件开发的重要方面。本章节将介绍...

    Packt.Mastering.Qt.5

    - **Linux实现添加:** - Linux环境下Qt应用程序的构建与调试。 - 针对Linux特性的QMake配置优化。 - **MacOS实现添加:** - MacOS下的Qt开发环境搭建。 - 特定于MacOS的QMake配置示例。 - **将SysInfo转换为...

    OGRE使用指南(入门教程)

    2. 添加动态光源和阴影效果。 3. 实现摄像机动画,让玩家自由探索场景。 4. 创建粒子系统,模拟火焰燃烧效果。 5. 利用脚本语言配置场景,增加可编辑性。 ### 七、进阶学习 完成入门教程后,你可以进一步研究: 1....

    jacob-1.15-M3-x86.zip

    Jacob的核心是一个名为"jacob.dll"的动态链接库,它是Jacob与Java交互的关键。这个库文件是Jacob的核心组成部分,它实现了Java与COM接口之间的桥梁,使得开发者能够利用Java代码来控制Word的功能,如创建、编辑、...

    cmake_wiki_pdf

    - **RPATH处理**:讲解如何正确处理动态库的路径问题。 - **汇编语言支持**:介绍CMake对汇编语言的支持情况。 - **IDE集成**:列出了一系列支持CMake语法高亮显示的编辑器和IDE。 - **特定项目生成器文档**:为...

    [Android开发精要].扫描版.pdf

    1. **Android架构**:介绍Android系统的层次结构,包括Linux内核、HAL(硬件抽象层)、库、框架层以及应用程序层,帮助开发者理解各层之间的交互。 2. **Activity生命周期**:详述Activity的启动、暂停、恢复、停止...

    Hopper Disassembler 2.7.7

    Hopper是一款跨平台的反汇编器,支持Mac OS X、Windows和Linux操作系统。它能够将机器语言代码转换为人类可读的汇编语言,使得开发者和安全研究人员能够洞察程序的内部结构。此外,Hopper还提供了一些高级功能,如...

    Maven权威指南 很精典的学习教程,比ANT更好用

    在Linux上安装Maven 2.3.4. 在FreeBSD或OpenBSD上安装Maven 2.4. 验证Maven安装 2.5. Maven安装细节 2.5.1. 用户相关配置和仓库 2.5.2. 升级Maven 2.6. 获得Maven帮助 2.7. 使用Maven Help插件 2.7.1. ...

    metasploit中文使用详解.pdf

    1. **安装包安装**:官网提供了包含所有依赖库的安装包,例如`framework-3.5.1-linux-i686.run`,只需具备root权限即可直接安装。 2. **源码包安装**:另一种方法是下载源码包并自行编译安装,但这种方式相对复杂...

    Flynn Sprint-开源

    开发者可以根据自己的兴趣和专长,为游戏添加新的功能、优化性能、修复问题,甚至创建全新的关卡和游戏模式,极大地丰富了游戏内容。 在游戏机制上,Flynn Sprint引入了一些独特的概念,如“门”和“运输器”。门...

Global site tag (gtag.js) - Google Analytics