我的ubuntu空间小的可怜,总共就20G,因为是双系统,vista占了100G,汗。。。就这样将就这,其中/home目录只有可怜的7G多,再加上要在淘宝上买东西,所有又装了个虚拟机,用了3G,接着汗。。。接着,某天系统warning,只有不到2M的可用空间,暴汗。。。已经很省着用了,咋个就这么穷,打开目录想看看哪个东西动了我的硬盘,一打开我的妈哟,加上隐藏文件,大大小小直接看不见大小的文件至少上了30个,更不说里面的东西了。。。我要看那些占了较大空间的文件是哪些不是要挨着点开,受不了这么做,google了一下,写了个python 文件,还是把大家伙找出来了,嘿嘿。。。
import os
from os.path import join,getsize
#得到一个目录下所有文件以及目录的大小,用了递归
def get_size(src):
'''Get the size of a directory or a file'''
size=0L
if os.path.isfile(src): #文件直接算
size=os.stat(src)[6]
elif os.path.isdir(src):
for item in os.listdir(src):
itemsrc=join(src,item)
#print item
#iterate to caculate the directory size
size+=get_size(itemsrc)
return size
#只得到目录的大小,没有用递归
def getdirsize(dir):
size = 0L
for root,dirs,files in os.walk(dir):
size += sum([getsize(join(root, name)) for name in files])
return size
def listdir(dir):
for item in os.listdir(dir):
try:
size = getdirsize(join(dir,item))/1024.0/1024.0
#只打印大于200M的文件
if size>200:
print 'file is %s ,size is %.2f' %(item,size)
except Exception:
continue
if __name__=='__main__':
dirname=r'/home/sunny'
listdir(dirname)
因为ubuntu下可以直接看见该文件夹下的文件的大小,看不见目录的大小,所以直接用第二个方法就可以了,当然这个带点人工,如果要全自动的就用第一个方法。
分享到:
相关推荐
在处理文本文件时,统计文件中的行数是一个常见的需求。无论是用于数据分析、日志处理还是其他场景,了解文件的具体规模有助于进一步的数据处理工作。Python 作为一种广泛使用的编程语言,在这方面提供了多种解决...
通过给定的路径,读取下面所有的目录,找出不同类型的文件并统计个数及大小
python统计一个文件夹下指定文件的大小并获得这个文件下所有文件大小的总和以及得到最大文件里面出现次数最多的单词。萌新有错的地方请多指教
在面试中,除了理论知识,还可能要求考生用Python解决实际问题,例如编写一个函数来统计一个文件中某个单词出现的次数,或者如何将文件内容按行反转输出等。这样的实际操作题目更能够考察考生对于文件操作细节的理解...
"emc-pypi-main"这个文件可能是一个包含EMC Python接口的库,通过Python的`pip`或`conda`等包管理器可以进行安装。例如: ```bash pip install emc-pypi-main ``` 安装完成后,你可以使用Python编写脚本来调用EMC...
`os.walk()`函数是其中的一个重要方法,它用于遍历一个目录树,即递归地遍历目录及其所有子目录,并返回当前目录、子目录列表以及普通文件列表。在给定的标题和描述中,我们可以看到这个功能被用于遍历"test"目录下...
常见的编程语言有不同的代码结构,例如,Python一行可能包含一个完整的功能,而C++可能需要多行来实现相同的功能。因此,统计代码行数时通常需要区分注释行、空行和实际代码行。 批处理文件(.bat)是Windows操作...
本文将详细介绍如何使用Python3来实现指定目录下的文件SHA-256值及文件大小的统计,并通过一个具体的脚本来展示其实现过程。 #### 知识点一:计算文件的SHA256值 SHA-256是SHA-2系列哈希函数的一种,它可以将任意...
本话题将深入探讨如何使用Python实现一个目录文件扫描工具,它能够递归地遍历指定目录,收集所有文件的相关信息,并将这些信息整理成Excel表格的形式。 首先,我们需要了解Python中的`os`和`os.path`模块。`os`模块...
在“自动办公-33 Python分块拆分txt文件中的数据”这个实例中,可能包含了一个具体的Python脚本,演示了如何按照上述步骤来实现分块拆分TXT文件。这个实例可能涵盖了以下关键知识点: - **文件操作**:包括文件的...
生成器可以在每次迭代时生成一个值,而不会一次性生成所有值,这样可以有效地管理内存。在本项目中,可能会有一个自定义的生成器函数,用于按块生成txt文件的内容。 3. **文本解析**:项目可能涉及到解析txt文件中...
1. `os.listdir(dirname)`:这个函数用于列出指定目录`dirname`下的所有文件和子目录,返回的是一个包含所有文件名(不包括路径)的列表。 2. `os.getcwd()`:返回当前工作目录的路径,即程序运行时所在的目录。 3...
这个实践性的教程基于一个已修改的Python27脚本,使其兼容Python3.6,并包含了一个名为`get-gitInfo.py`的实用脚本。 首先,让我们了解`python-gitlab`库。这是一个Python绑定库,它提供了与GitLab API交互的功能,...
当用户在ArcGIS中运行这个脚本时,它会生成一个.esriaddin文件,这是一个XML文件,包含了插件的所有元数据和指向实际Python代码的引用。 "config.xml"同样是配置文件,它定义了Add-In的具体属性,如位置、大小、...
本主题将聚焦于一个具体案例:如何使用Python来分块拆分txt文本文件中的数据。在实际工作中,我们可能遇到非常大的文本文件,一次性读入内存可能会导致性能问题甚至内存溢出。因此,分块读取和处理文件是一种有效且...
在给出的文件中,作者介绍了一种使用Python集合(set)来统计列表中不同元素数量的方法。这里,我将详细介绍这一方法的知识点以及相关概念。 首先,Python中的列表(list)是一种包含多个有序元素的数据结构,元素...
分块拆分是指将一个大文件分成若干个小块进行处理的方法。这种方法适用于大型数据集或日志文件等场景,可以显著提高处理效率和减少内存占用。 ### 描述解读:py源码实例自动办公Python分块拆分txt文件中的数据提取...
minio 兼容Amason的S3分布式对象存储项目,采用Golang实现,客户端支持Java,Python,Javacript, Golang语言。Minio可以做为云存储的解决方案用来保存海量的图片,视频,文档。由于采用Golang实现,服务端可以工作在...
这段代码将根据提供的风向和频率数据生成一个颜色编码的风玫瑰图,颜色代表不同的风速范围。通过调整参数,如'nsector'(风向扇区的数量)和'opening'(扇区的开口大小),可以自定义图的外观。此外,还可以使用其他...