`

linux 系统监控、诊断工具之 lsof 用法简介

 
阅读更多

1、lsof 简介

lsof 是 linux 下的一个非常实用的系统级的监控、诊断工具。
它的意思是 List Open Files,很容易你就记住了它是 “ls + of”的组合~
它可以用来列出被各种进程打开的文件信息,记住:linux 下 “一切皆文件”
包括但不限于 pipes, sockets, directories, devices, 等等。
因此,使用 lsof,你可以获取任何被打开文件的各种信息。

只需输入 lsof 就可以生成大量的信息,因为 lsof 需要访问核心内存和各种文件,所以必须以 root 用户的身份运行它才能够充分地发挥其功能。

lsof 的示例输出:

 

1 root@YLinux:~/lab 0# lsof

 

 

2 COMMAND     PID   TID       USER   FD      TYPE     DEVICE SIZE/OFF       NODE NAME

 

 

3 systemd       1             root  cwd       DIR        8,6     4096          2 /

 

 

4 systemd       1             root  rtd       DIR        8,6     4096          2 /

 

 

5 systemd       1             root  txt       REG        8,6  2273340    1834909 /usr/lib/systemd/systemd

 

 

6 systemd       1             root  mem       REG        8,6   210473    1700647 /lib/libnss_files-2.15.s

 

 

7 ...

 

 

2、lsof 常用用法

 
 2.1 监控打开的文件、设备
查看文件、设备被哪些进程占用 

 

1 # lsof /dev/tty1

 

 

2 COMMAND     PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME

 

 

3 bash       1770 jian    0u   CHR    4,1      0t0 1045 /dev/tty1

 

 

4 bash       1770 jian    1u   CHR    4,1      0t0 1045 /dev/tty1

 

 

5 bash       1770 jian    2u   CHR    4,1      0t0 1045 /dev/tty1

 

 

6 bash       1770 jian  255u   CHR    4,1      0t0 1045 /dev/tty1

 

 

7 startx     1845 jian    0u   CHR    4,1      0t0 1045 /dev/tty1

 

 

8 startx     1845 jian    1u   CHR    4,1      0t0 1045 /dev/tty1

 

 

9 ...

 

2.2 监控文件系统

指定目录、挂载点,可以看到有哪些进程打开了其下的文件: 

 

1 # lsof /data/

 

 

2 COMMAND   PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME

 

 

3 bash    15983 jian  cwd    DIR    8,5     4096 8252 /data/backup

 

 

4 ...

 

这在 umount 某个文件系统失败时非常有用(通常会报该 FS is busy)。

列出某个目录(挂载点 如 /home 也行)下被打开的文件:

 

1 # lsof +D /var/log/

 

 

2  

 

 

3 COMMAND   PID   USER  FD   TYPE DEVICE SIZE/OFF   NODE NAME

 

 

4 rsyslogd  488 syslog   1w   REG    8,1     1151 268940 /var/log/syslog

 

 

5 rsyslogd  488 syslog   2w   REG    8,1     2405 269616 /var/log/auth.log

 

 

6 console-k 144   root   9w   REG    8,1    10871 269369 /var/log/ConsoleKit/history

 

列出被指定进程名打开的文件:

 

01 # lsof -c ssh -c init

 

 

02  

 

 

03 COMMAND    PID   USER   FD   TYPE DEVICE SIZE/OFF   NODE NAME

 

 

04 init         1       root  txt    REG        8,1   124704  917562 /sbin/init

 

 

05 init         1       root  mem    REG        8,1  1434180 1442625 /lib/i386-linux-gnu/libc-2.13.so

 

 

06 init         1       root  mem    REG        8,1    30684 1442694 /lib/i386-linux-gnu/librt-2.13.so

 

 

07 ...

 

 

08 ssh-agent 1528 lakshmanan    1u   CHR        1,3      0t0    4369 /dev/null

 

 

09 ssh-agent 1528 lakshmanan    2u   CHR        1,3      0t0    4369 /dev/null

 

 

10 ssh-agent 1528 lakshmanan    3u  unix 0xdf70e240      0t0   10464 /tmp/ssh-sUymKXxw1495/agent.1495

 

2.3 监控进程

指定进程号,可以查看该进程打开的文件: 

 

01 # lsof -p 2064

 

 

02 COMMAND  PID USER   FD   TYPE     DEVICE SIZE/OFF    NODE NAME

 

 

03 firefox 2064 jian  cwd    DIR        8,6     4096 1571780 /home/jian

 

 

04 firefox 2064 jian  rtd    DIR        8,6     4096       2 /

 

 

05 firefox 2064 jian  txt    REG        8,6    44224 1985670 /usr/lib/firefox-12.0/firefox

 

 

06 firefox 2064 jian  mem    REG        8,6 14707012  925361 /usr/share/fonts/chinese/msyhbd.ttf

 

 

07 firefox 2064 jian  mem    REG        8,6 15067744  925362 /usr/share/fonts/chinese/msyh.ttf

 

 

08 firefox 2064 jian  mem    REG        8,6 16791251 1701681 /usr/share/fonts/wenquanyi/wqy-zenhei.ttc

 

 

09 firefox 2064 jian  mem    REG       0,16 67108904   10203 /dev/shm/pulse-shm-3021850167

 

 

10 ...

 

当你想要杀掉某个用户所有打开的文件、设备,你可以这样:

 

1 kill -9 `lsof -t -u lakshmanan`

 

此处 -t 的作用是单独的列出 进程 id 这一列。

关于杀死进程的 4 种方式,请参考:

http://www.thegeekstuff.com/2009/12/4-ways-to-kill-a-process-kill-killall-pkill-xkill/

 

2.4 监控网络

查看指定端口有哪些进程在使用(lsof -i 列出所有的打开的网络连接): 

 

1 # lsof -i:22

 

 

2 COMMAND  PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME

 

 

3 sshd    1569 root    3u  IPv4  10303      0t0  TCP *:ssh (LISTEN)

 

 

4 sshd    1569 root    4u  IPv6  10305      0t0  TCP *:ssh (LISTEN)

 

 

5 ...

 

列出被某个进程打开所有的网络文件:

 

1 lsof -i -a -p 234

 

或者

 

1 lsof -i -a -c ssh

 

列出所有 tcp、udp 连接:

 

1 lsof -i tcp;

 

 

2 lsof -i udp;

 

列出所有 NFS 文件:

 

1 lsof -N -u lakshmanan -a

 

查看指定网口有哪些进程在使用:

 

1 # lsof -i@192.168.1.91

 

 

2 COMMAND     PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME

 

 

3 skype      1909 jian   54u  IPv4   9116      0t0  TCP 192.168.1.91:40640->64.4.23.153:40047 (ESTABLISHED)

 

 

4 pidgin     1973 jian    7u  IPv4   6599      0t0  TCP 192.168.1.91:59311->hx-in-f125.1e100.net:https (ESTABLISHED)

 

 

5 pidgin     1973 jian   13u  IPv4   9260      0t0  TCP 192.168.1.91:54447->by2msg3010511.phx.gbl:msnp (ESTABLISHED)

 

 

6 ...

 

 

3、更多使用技巧

 

 3.1 监控用户 

 
查看指定用戶打开的文件(lsof -u ^lakshmanan 可以排除某用户): 

 

1 # lsof -u messagebus

 

 

2 COMMAND    PID       USER   FD   TYPE     DEVICE SIZE/OFF    NODE NAME

 

 

3 dbus-daem 1805 messagebus  cwd    DIR        8,6     4096       2 /

 

 

4 dbus-daem 1805 messagebus  rtd    DIR        8,6     4096       2 /

 

 

5 dbus-daem 1805 messagebus  txt    REG        8,6  1235361 1834948 /usr/bin/dbus-daemon

 

 

6 dbus-daem 1805 messagebus  mem    REG        8,6   210473 1700647 /lib/libnss_files-2.15.so

 

 

7 dbus-daem 1805 messagebus  mem    REG        8,6   190145 1700642 /lib/libnss_nis-2.15.so

 

 

8 dbus-daem 1805 messagebus  mem    REG        8,6   490366 1700636 /lib/libnsl-2.15.so

 

 

9 ...

 

 3.2 监控应用程序

 
查看指定程序打开的文件: 

 

1 # lsof -c firefox

 

 

2 COMMAND  PID USER   FD   TYPE     DEVICE SIZE/OFF    NODE NAME

 

 

3 firefox 2064 jian  cwd    DIR        8,6     4096 1571780 /home/jian

 

 

4 firefox 2064 jian  rtd    DIR        8,6     4096       2 /

 

 

5 firefox 2064 jian  txt    REG        8,6    44224 1985670 /usr/lib/firefox-12.0/firefox

 

 

6 firefox 2064 jian  mem    REG        8,6 14707012  925361 /usr/share/fonts/chinese/msyhbd.ttf

 

 

7 firefox 2064 jian  mem    REG        8,6 15067744  925362 /usr/share/fonts/chinese/msyh.ttf

 

 

8 firefox 2064 jian  mem    REG        8,6 16791251 1701681 /usr/share/fonts/wenquanyi/wqy-zenhei.ttc

 

 

9 ...

 

4、命令模式技巧

 

4.1 组合逻辑查询条件

只有多个查询条件都满足, 用 "-a" 参数,默认是 -o 。 

 

1 # lsof -a -c bash -u root

 

 

2 COMMAND  PID USER   FD   TYPE DEVICE SIZE/OFF    NODE NAME

 

 

3 bash    1986 root  cwd    DIR    8,6     4096 1701593 /root/lab

 

 

4 bash    1986 root  rtd    DIR    8,6     4096       2 /

 

 

5 bash    1986 root  txt    REG    8,6  1994157 1700632 /bin/bash

 

 

6 bash    1986 root  mem    REG    8,6  9690800  405214 /usr/lib/locale/locale-archive

 

 

7 bash    1986 root  mem    REG    8,6   210473 1700647 /lib/libnss_files-2.15.so

 

4.2 lsof 命令的重复执行模式:

基于给定的参数延时多少秒 重复执行 lsof

+r 表示 当没有文件被打开的时候,repeat mode 将自行结束。

-r 表示 不管文件是否存在或者被打开,它都将执行,直到你中断它。

每个循环的输出使用 ‘=======’ 做分隔符,你也可以用 ‘-r’ | ‘+r’ 指定延时时间。

 

 

01 # lsof -u lakshmanan -c init -a -r5

 

 

02  

 

 

03 =======

 

 

04 =======

 

 

05 COMMAND   PID       USER   FD   TYPE DEVICE SIZE/OFF    NODE NAME

 

 

06 inita.sh 2971 lakshmanan  cwd    DIR    8,1     4096  393218 /home/lakshmanan

 

 

07 inita.sh 2971 lakshmanan  rtd    DIR    8,1     4096       2 /

 

 

08 inita.sh 2971 lakshmanan  txt    REG    8,1    83848  524315 /bin/dash

 

 

09 inita.sh 2971 lakshmanan  mem    REG    8,1  1434180 1442625 /lib/i386-linux-gnu/libc-2.13.so

 

 

10 inita.sh 2971 lakshmanan  mem    REG    8,1   117960 1442612 /lib/i386-linux-gnu/ld-2.13.so

 

 

11 inita.sh 2971 lakshmanan    0u   CHR  136,4      0t0       7 /dev/pts/4

 

 

12 inita.sh 2971 lakshmanan    1u   CHR  136,4      0t0       7 /dev/pts/4

 

 

13 inita.sh 2971 lakshmanan    2u   CHR  136,4      0t0       7 /dev/pts/4

 

 

14 inita.sh 2971 lakshmanan   10r   REG    8,1       20  393578 /home/lakshmanan/inita.sh

 

 

15 =======

 

以上输出是前 5 秒没有输出,然后 “inita.sh” 启动后,开始有了输出。

 

5、最 后的技巧

关于磁盘空间告警 df -h --max=1 与 du -hx --max=1 显示不一致的问题,

最常见的的还是下面这种情况:

lsof|grep -i delete

看看被删除的文件:有些删了文件,但是进程没 reload,那些空间还是占用的,你可以理解为类似 windows 下的进程句柄没释放的概念吧~ 只是 windows 下如果有文件被进程使用,你一般是删不掉的,而 linux 虽然不做删除限制,但却要等到进程使用完文件才能完全释放,以防止进程奔溃,这是操作系统对资源的管理差异吧~
例如 nginx 会有很多临时文件占用了 /tmp 目录,删掉后,依然占用着空间,

此时你可以:

pkill -9 nginx && /etc/init.d/nginx restart
好吧,本文到此结束了,关于 lsof 还有很多很多,不过哥常用、知道的就这些了,哥也只能帮你到这儿了,

如果你还需要其它的内容,请自行 google 吧,骚年。。。

 

6、refer: 

使用 lsof 查找打开的文件

http://www.ibm.com/developerworks/cn/aix/library/au-lsof.html

15 Linux lsof Command Examples (Identify Open Files)

http://www.thegeekstuff.com/2012/08/lsof-command-examples/

实用的系统工具之 lsof

http://www.ylinux.org/forum/t/276

分享到:
评论

相关推荐

    linux使用lsof命令查看文件打开情况

    本文将深入探讨`lsof`命令的使用方法及其在不同场景下的应用。 ### 前言 在Linux环境下,一切资源都被抽象为文件,包括硬件设备、网络连接等。了解哪些进程正在使用哪些文件,可以帮助我们诊断系统问题、定位资源...

    lsof_4.76.tar.gz

    总之,lsof是Linux系统管理中的一个强大工具,通过其详尽的输出信息,我们可以深入洞察系统的运行状态。正确安装和使用lsof,能够提升系统的监控能力,有效提高故障排查和系统优化的效率。在实际工作中,结合其他...

    Linux系统故障诊断与排除

    首先,我们来了解一些基本的故障诊断工具和方法: 1. **日志分析**:`/var/log`目录下包含了系统运行的各种日志文件,如`syslog`、`kern.log`、`auth.log`等,通过阅读这些日志可以找到问题的线索。 2. **错误代码...

    lsof-4.87-6.el7.x86_64.rpm

    在Linux系统管理中,有一款强大的工具——lsof,它能显示出当前系统中所有打开的文件和进程的关联情况,是系统管理员进行问题诊断和性能分析的重要助手。本文将深入探讨lsof在CentOS7.4操作系统中的使用及其相关知识...

    Linux系统一本通一本全

    12. **故障排查与日志分析**:教给读者如何通过日志文件诊断问题,使用strace、lsof等工具跟踪系统行为,以及进行性能分析。 本书以通俗易懂的语言和丰富的实例,为读者构建了一条从入门到精通的Linux学习路径,...

    linux期末考试参考题库_linux期末_linux_Linux题库_题库Linux_

    10. **故障排查**:学习如何阅读和理解系统日志,使用`strace`、`lsof`等工具进行系统级问题诊断。 这个“linux期末考试参考题库.doc”文档应该包含了上述所有主题的习题和解答,通过认真研读和实践,你应该能够...

    lsof

    《深入理解lsof工具:Linux系统监控利器》 在Linux操作系统中,管理和监控系统资源是运维人员日常工作中不可或缺的一部分。而lsof(List Open Files)是一个强大的命令行工具,它能显示当前系统中打开文件的相关...

    Linux Server Hacks

    此外,还可能介绍一些调试工具的高级使用方法,比如strace用于跟踪系统调用和信号,lsof用于查看打开的文件,以及tcpdump和Wireshark这类网络分析工具来捕获和分析网络流量。 这本书的标签“linux hacks monitor”...

    linux性能诊断优化.rar

    理解这些工具的使用方法,可以帮助我们定位性能瓶颈。 2. **进程管理**:了解如何通过`ps`和`kill`命令管理进程,包括查看进程状态、资源消耗以及结束进程,这些都是性能优化的基础。 3. **性能分析**:`strace`和...

    Linux讲义 Linux讲义 Linux讲义

    10. **故障排查**:讲解如何使用`dmesg`、`strace`、`lsof`等工具诊断和解决问题,以及阅读和理解系统日志。 以上内容涵盖了Linux讲义中的主要知识点,对于初学者来说,理解和掌握这些知识是深入探索Linux世界的...

    Linux系统管理员手册

    11. **故障排查**:学习如何使用调试工具,如strace、lsof、gdb等,诊断和解决系统问题。了解如何阅读系统日志,定位错误信息。 12. **脚本编程**:熟悉bash或其他Shell脚本语言,编写自动化脚本,提升工作效率。 ...

    Linux查看端口占用lsof -i:port的方法

    总的来说,`lsof -i:port`是Linux系统管理员的得力工具,能够有效地监控和诊断网络端口的使用情况。熟练掌握这一命令,将有助于提高故障排查和系统维护的效率。希望这篇文章能帮助你更好地理解和运用`lsof`,在日常...

    循序渐进Linux第2版高清版PDF

    同时,也讨论了如何通过工具如strace、lsof和syslog来调试和监控系统行为。 最后,针对现代数据中心的需求,书中介绍了Linux集群技术和负载均衡。这部分内容可能会涵盖高可用性集群的构建、故障切换机制、以及如何...

    linux电子教案完整版

    13. **故障排查和性能监控**:教授如何使用strace、gdb、lsof、iotop、vmstat等工具来诊断问题和监控系统性能。 14. **虚拟化技术**:介绍Linux下的虚拟化技术,如KVM、Docker和LXC,以及虚拟机和容器的管理。 15....

    一周内学会linux系统管理PPT文档

    Linux系统管理是IT领域中的基础技能之一,尤其对于服务器运维人员和云计算专业人士来说至关重要。这份“一周内学会Linux系统管理”的PPT文档旨在为初学者提供一条快速掌握Linux操作系统的路径。以下是一些核心知识点...

    Linux运维-03-监控专题配套资料.zip

    "Linux运维-03-监控专题配套资料.zip"这个压缩包文件很可能包含了关于Linux系统监控的详细文档和资料,旨在帮助运维人员掌握如何有效地监控Linux服务器。以下是根据这些信息可能包含的一些核心知识点: 1. **系统...

    linux 最新私房菜

    3. Linux桌面环境:讲解GNOME、KDE等主流桌面环境的使用方法。 4. 文件系统与文件管理:深入理解Linux的目录结构,掌握文件和目录的操作,如创建、删除、移动、复制等。 5. 命令行操作:教授常用命令的使用,如ls、...

    Linux操作系统完全教程

    13. **系统监控与日志**:了解如何使用工具如top、htop、iotop、vmstat、iostat等监控系统性能,以及日志文件的重要性与查看方法。 14. **防火墙与安全**:配置iptables防火墙规则,理解端口、服务和安全策略,学习...

    linux教程(不错的资源,欢迎下载)

    11. **系统监控与维护**:学习使用工具如`top`、`htop`、`iotop`来监控系统资源,了解磁盘管理、日志分析、性能优化等技巧。 12. **故障排查与调试**:掌握使用`dmesg`、`strace`、`lsof`等工具进行问题诊断,学习...

    Linux性能测试指令集.rar

    在Linux系统中,进行性能测试是优化和诊断系统问题的关键步骤。这个压缩包"Linux性能测试指令集.rar"包含了关于Linux性能测试的一些重要指令和工具的详细信息,特别是"Linux性能测试常用指令集(一).doc"文档,很...

Global site tag (gtag.js) - Google Analytics