`

Python压缩文件

 
阅读更多
python处理zip文件
有时我们需要在 Python 中使用 zip 文件,而在1.6版中,Python 就已经提供了 zipfile 模块可以进行这样的操作。不过 Python 中的 zipfile 模块不能处理多卷的情况,不过这种情况并不多见,因此在通常情况下已经足够使用了。下面我只是对一些基本的 zipfile 操作进行了记录,足以应付大部分的情况了。
zipfile 模块可以让你打开或写入一个 zip 文件。比如:
import zipfile
z = zipfile.ZipFile('zipfilename', mode='r')
这样就打开了一个 zip 文件,如果mode为'w'或'a'则表示要写入一个 zip 文件。如果是写入,则还可以跟上第三个参数:
compression=zipfile.ZIP_DEFLATED

compression=zipfile.ZIP_STORED
ZIP_DEFLATED是压缩标志,如果使用它需要编译了zlib模块。而后一个只是用zip进行打包,并不压缩。
在打开了zip文件之后就可以根据需要是读出zip文件的内容还是将内容保存到 zip 文件中。
读出zip中的内容
很简单,zipfile 对象提供了一个read(name)的方法。name为zip文件中的一个文件入口,执行完成之后,将返回读出的内容,你把它保存到想到的文件中即可。
写入zip文件
有两种方式,一种是直接写入一个已经存在的文件,另一种是写入一个字符串。
对于第一种使用 zipfile 对象的 write(filename, arcname, compress_type),后两个参数是可以忽略的。第一个参数是文件名,第二个参数是表示在 zip 文件中的名字,如果没有给出,表示使用与filename一样的名字。compress_type是压缩标志,它可以覆盖创建 zipfile 时的参数。第二种是使用 zipfile 对象的 writestr(zinfo_or_arcname, bytes),第一个参数是 zipinfo 对象或写到压缩文件中的压缩名,第二个参数是字符串。使用这个方法可以动态的组织文件的内容。
需要注意的是在读出时,因为只能读出内容,因此如果想实现按目录结构展开 zip 文件的话,这些操作需要自已来完成,比如创建目录,创建文件并写入。而写入时,则可以根据需要动态组织在 zip 文件中的目录结构,这样可以不按照原来的目录结构来生成 zip 文件。
于是我为了方便使用,创建了自已的一个 ZFile 类,主要是实现象 winrar 的右键菜单中的压缩到的功能--即将一个zip文件压缩到指定目录,自动创建相应的子目录。再有就是方便生成 zip 文件。类源码为:
import zipfile
import os.path
import os
class ZFile(object):
    def __init__(self, filename, mode='r', basedir=''):
        self.filename = filename
        self.mode = mode
        if self.mode in ('w', 'a'):
            self.zfile = zipfile.ZipFile(filename, self.mode, compression=zipfile.ZIP_DEFLATED)
        else:
            self.zfile = zipfile.ZipFile(filename, self.mode)
        self.basedir = basedir
        if not self.basedir:
            self.basedir = os.path.dirname(filename)
       
    def addfile(self, path, arcname=None):
        path = path.replace('\\', '/')
        if not arcname:
            if path.startswith(self.basedir):
                arcname = path[len(self.basedir):]
            else:
                arcname = ''
        self.zfile.write(path, arcname)
           
    def addfiles(self, paths):
        for path in paths:
            if isinstance(path, tuple):
                self.addfile(*path)
            else:
                self.addfile(path)
           
    def close(self):
        self.zfile.close()
       
    def extract_to(self, path):
        for p in self.zfile.namelist():
            self.extract(p, path)
           
    def extract(self, filename, path):
        if not filename.endswith('/'):
            f = os.path.join(path, filename)
            dir = os.path.dirname(f)
            if not os.path.exists(dir):
                os.makedirs(dir)
            file(f, 'wb').write(self.zfile.read(filename))
           
       
def create(zfile, files):
    z = ZFile(zfile, 'w')
    z.addfiles(files)
    z.close()
   
def extract(zfile, path):
    z = ZFile(zfile)
    z.extract_to(path)
    z.close()
这个 zfile.py 模块提供了两个方法:create和extract,还有一个 ZFile 的类。create和extract用来创建和解压 zip 文件。
create需要两个参数,第一个为要生成的zip文件名,第二个为一个文件列表,它是一个list变量,每一项或者是一个字符串文件名,或者是一个tuple,第一个为文件名,第二个为在压缩文件中的名字,可以有路径,如:
['d:/a.csv', 'd:/test/a.JPG', ('d:/test/mixin/main.py', 'main.py')]
那么对于文件名有以下的处理,如果文件列表中的文件名与压缩文件名的路径相同,则在压缩文件中会自动变成相对路径。比如上面的文件列表,如果压缩文件为:
d:/aaaa.zip
则在压缩文件中的压缩文件名最终为:
['a.csv', 'test/a.JPG', 'main.py']
那么最后一个因为指定了在压缩文件中的名字,因此使用指定的名字。
extrace需要两个参数,第一个为压缩文件名,第二个为解压到的路径名。
这两个方法都使用了 ZFile 类。ZFile 类则提供了一些更底层些的类。它的构造函数可以根据mode的值来选择是打开还是写入。另外如果还想做更底层的控制,可以通过 ZFile 实例得到 zfile 属性,它是一个 ZipFile 模块实例,可以直接使用。






(windows)python脚本:自动备份并压缩文件,同时删除过期文件



       近来忙东忙西,有些重复性的事务就懒得做,比如文件备份。不过不做也不行。这两天闲下来,现学现用python写了这个文件自动备份的脚本。

        有以下2个亮点:

1.可以放在计划任务中定期执行,所需备份的内容由dsvr1list.txt文件提供,备份文件自动备份到按当前日期生成的目录中。

2.程序刚开始就执行清除1个月以前的所有备份目录,这个功能对于只有特定大小的备份设备及其有用,从此文件备份完全不用人工干涉。

      代码很简单,该注释的我都注释了。需要注意的是,我安装的的是python 2.5.1,是否对其他版本的python兼容有待考查;压缩格式我选用7-zip,其中7z.exe是它的命令行程序,该软件为开源软件,并且压缩比应该算是同类软件中最高的。(经过我的测试,备份文件服务器上2.4G左右的东西,压缩后只剩不到900M)如果第一次安装python环境和7-zip软件,请为它们设置path变量,因为我的脚本里面假定它们可以在任何目录下执行。

#!/usr/bin/python
# Filename: bDatasvr1.py
# This program is for files backup only
# It also needs 7-zip as the compress tool.
# Tengda huang, Dec 17th, 2007
# ver 1.0

import os
import time
import distutils.dir_util
import datetime

# connecting to the remote computer
link_command = r"net use k: \\10.10.10.1\mysvr1 mypassword /user:backupUser"

print 'Connecting to remote computer'

if os.system(link_command) == 0:
    print 'Successful connecting to drive k !'
else:
    print 'Drive k already linked or link failed!'

# delete old directories and files if the dir name created by time is older than 30 days
for root, dirs, files in os.walk('k:'):
    for name in dirs:
        (y1, m1, d1) = (int(x) for x in name.split('-'))
        date1 = datetime.date(y1, m1, d1)
        datenow = time.strftime('%Y%m%d')
        y2 = int(datenow[:4])
        m2 = int(datenow[4:6])
        d2 = int(datenow[6:])
        date2 = datetime.date(y2, m2, d2)
        if (date2 - date1).days > 30:
            print 'Expired dir! Deleting directory... ', name
            distutils.dir_util.remove_tree(os.path.join("k:",name))
print 'Old directory deleting done!'
print 'Starting to create backup files!'

# 1. The files and directories to be backed up are specified in the list.
source = r'@dsvr1list.txt'

# 2. The backup must be stored in a main directory,
#    that is  \\10.10.10.1mysvr1
#    which mapped as drive k:
target_dir = 'k:' 

# 3. The files are compressed and backed up into a 7-zip file type.
#    The subdirectories are named by the current day time.
today = target_dir + time.strftime('%Y-%m-%d')

# The current time is the name of the zip archive
now = time.strftime('%H%M%S')

# Create the subdirectory if it isn't already there
if not os.path.exists(today):
    os.mkdir(today) # make directory
    print 'Successfully created directory', today

# The name of the zip file
target = today + os.sep + 'share' + now + '.7z'

# 5. Use the 7z command to compress and put the files in a 7z archive
zip_command = "7z a -t7z %s %s" % (target, source)

# Runing the backup
if os.system(zip_command) == 0:
    print 'Successful backup to', target
else:
    print 'Backup FAILED'

# Disconnect from the remote computer
unlink_command = r"net use k: /delete"

if os.system(unlink_command) == 0:
    print 'Successfully detach from drive k! '
    print 'All job done!'
else:
    print 'Backup FAILED'


使用python压缩文件为zip压缩包
python自带了zipfile,貌似支持ZIP64,看帮助文档里好像有个选项
今天我的工作只是备份,所以只是创建zip档,其他就不关心了 ……
#!/usr/bin/env python
#coding=gbk
# python[AT]Live.it
import os
import sys
import getopt
import string
import zipfile

# print Help message
def Help():
    print "Usage : python %s -t D:\\dir -z test.zip" %sys.argv[0]
    sys.exit(0)
# get options
try:
    opts , args = getopt.getopt(sys.argv[1:], "ht:z:")
except getopt.GetoptError:
    print "\tBad arguments !"
    Help()
# enum options
if 0 == len(opts):
    Help()
for o,v in opts:
    if ‘-h‘ == o.lower():
        Help()
    if ‘-t‘ == o.lower():
        target = v
    if ‘-z‘ == o.lower():
        zipname = v
# zip directory
def zipDirectory(dir):
    dir = dir.strip()
    for (root,dirs,files) in os.walk(dir):
        for filename in files:
            print "Zip : %s" %(root+os.sep+filename)
            z.write(root+os.sep+filename)
    z.close()
# zip single file
def zipSingleFile(singleFile):
    print "Zip : %s" %singleFile
    singleFile = singleFile.strip()
    z.write(singleFile )
    z.close()
# run it
if os.path.isdir(target):
    z = zipfile.ZipFile(zipname,‘w‘)
    zipDirectory(target)
if os.path.isfile(target):
    z = zipfile.ZipFile(zipname,‘w‘)
    zipSingleFile(target)
run it
D:\>python zip.py -t D:\WIR -z E:\wir.zip
Zip : D:\WIR\Clip.py
Zip : D:\WIR\getClip.pl
Zip : D:\WIR\getClip.py
Zip : D:\WIR\openfiles.bmp
Zip : D:\WIR\Thumbs.db
Zip : D:\WIR\01\logosessions.png
Zip : D:\WIR\01\netsession.png
Zip : D:\WIR\01\netstat.png
Zip : D:\WIR\01\psloggedon.png
Zip : D:\WIR\01\tcpvcon.png
Zip : D:\WIR\01\wir
D:\>ls E:\wir.zip
E:\wir.zip

分享到:
评论

相关推荐

    python 压缩文件

    Python是一种强大的、面向对象的编程语言,其内置的`zipfile`和`tarfile`模块提供了处理压缩文件的能力。在本篇文章中,我们将深入探讨如何使用Python来创建、读取和解压ZIP文件,以及一些相关的高级用法。 标题中...

    Python压缩文件的脚本

    Python压缩文件的脚本

    python压缩文件与解压缩文件

    此外,还有第三方库如`tarfile`用于处理TAR格式的压缩文件。 首先,我们来看如何使用`zipfile`库来创建ZIP压缩文件。在Python中,你可以通过以下步骤实现: 1. 导入`zipfile`模块。 2. 创建一个`ZipFile`对象,...

    python压缩文件、ini文件读写源码

    python 文件夹压缩(包含空文件夹)、ini文件读写(解决大小写不敏感)

    c++调用python接口实现压缩拆分文件功能

    压缩文件通常使用的是`gzip`、`zip`或`tar`等格式,Python中的`zlib`、`zipfile`和`tarfile`库提供了对这些格式的支持。在Python代码中,我们可以编写函数来读取文件,然后使用这些库进行压缩,并将结果写入新的压缩...

    Python应用实战案例:Python压缩NC格式(附代码).zip

    在本实践案例中,我们将探讨如何使用Python处理和压缩NetCDF (Network Common Data Form) 文件。NetCDF是一种广泛用于科学数据存储的自描述、多维数组格式,它支持跨平台的访问和共享。Python提供了多个库来处理这种...

    Python实现PDF图片文件压缩

    在这个场景中,我们将讨论如何使用Python来实现PDF图片文件的压缩。首先,我们需要理解PDF文件的结构,它可能包含文本、图像和其他元素。对于含有大量图片的PDF文件,压缩图片可以显著减小文件大小,便于存储和传输...

    python的一款zip解压文件,大文件速度有点慢

    使用请看我的文章

    将压缩文件隐藏到图片python实现

    将压缩文件隐藏到图片的python实现,更改筛选标准可以推广到融合各种文件

    python定时备份文件

    2. **Python压缩文件**: Python内置的`zipfile`库可以用来创建、读取、更新和提取ZIP格式的压缩文件。在本例中,我们使用`os.system`调用系统命令来压缩文件。`os.system`是一个低级别的接口,它直接执行操作系统...

    Python压缩和解压缩文件

    在Python编程语言中,处理压缩和解压缩文件是一项常见的任务,尤其在数据传输、存储优化以及备份场景下。Python提供了内置的`zipfile`和`tarfile`模块,方便我们对ZIP和TAR格式的文件进行操作。接下来,我们将详细...

    python+PDF压缩+典型的PDF压缩算法

    总的来说,Python结合适当的库和算法,可以有效地实现PDF文件的压缩,使得在保持文档质量的同时,大大减少了文件的存储空间。在实际应用中,我们需要根据PDF的具体内容和需求,灵活选择和组合不同的压缩方法,以达到...

    python3 多线程压缩文件

    python3 多线程压缩文件

    Python实现多级目录压缩与解压文件的方法

    在Python中,`zipfile`库提供了`ZipFile`类,用于读取、写入和操作ZIP格式的压缩文件。以下是一个简单的解压函数`unZipFile`: ```python import zipfile import os def unZipFile(zipPath, unZipPath=''): # ...

    Huffman 编码图像无损压缩和解压缩 Python示例代码 哈夫曼编码

    6. 将编码后的位串转换为字节序列写入压缩文件 解压原理: 1. 从压缩文件读取编码后的位串 2. 去除填充,提取实际的编码文本 3. 对编码文本进行解码,恢复原始的像素值序列 4. 将解码得到的一维像素值序列 reshape ...

    python压缩文件夹内所有文件为zip文件的方法

    本文实例讲述了python压缩文件夹内所有文件为zip文件的方法。分享给大家供大家参考。具体如下: 用这段代码可以用来打包自己的文件夹为zip,我就用这段代码来备份 import zipfile z = zipfile.ZipFile('my-...

    Python压缩解压缩zip文件及破解zip文件密码的方法

    python 的 zipfile 提供了非常便捷的方法来压缩和解压 zip 文件。 例如,在py脚本所在目录中,有如下文件: readability/readability.js readability/readability.txt readability/readability-print.css ...

    python实现定时压缩指定文件夹发送邮件

    - `zipfile`: 用于压缩文件。 - `datetime`: 用于日期时间的操作。 - `os`: 提供了一种使用操作系统功能的方法。 可以通过以下命令安装缺失的库: ```bash pip install pywin32 ``` #### 二、核心功能实现 本案例...

    使用Python来压缩文件和解压缩文件

    在Python编程语言中,处理压缩文件是一项常见的任务,如创建、读取和解压缩ZIP文件。本篇文章将深入探讨如何使用Python内置的`zipfile`模块来实现这一功能。 首先,我们要了解`zipfile`模块。`zipfile`是Python标准...

Global site tag (gtag.js) - Google Analytics