`

使用python批量转换文件编码方式

阅读更多

在工作中遇到了问题,有一些文件跟现有工程的文件编码方式不同,于是就想到编写代码批量进行转换,刚好,最近再学习python语言,我觉得学好一门语言最好的方式就是实践,所以,决定使用python批量转换文件的编码。

 

思路就是从一种编码格式转换成另外一种编码。但实际中还是有一种情况,就是在目录中,有些文件是不需要转换的,如果这种时候也统一转换的话,同样会出现乱码,所以这个地方要处理。

 

#codeing=utf-8
import chardet
import sys,os

def convertEncoding(to_encode,old_filepath):
    print old_filepath
    f1=file(old_filepath)
    text=f1.read();
    f1.closed

    enc=chardet.detect(text)
    print enc
    if enc['encoding']  == None :
        return
    text=text.decode(enc['encoding']).encode(to_encode)
    f2=file(old_filepath,'w')
    f2.write(text)
    f2.close()


def listFiles(fromdir):
    for root,dirs,files in os.walk(fromdir):

       if len(files)!=0:
            for file in files:
                convertEncoding("UTF-8",os.path.join(root,file))

if __name__ =="__main__":
	listFiles("D:\\WebContent")

 这里用到了外部库Chardet,需要另外下载。转换的地方是从检测到的编码类型直接转化为我们要改变的编码类型,这样,就避免了前面说的问题。

分享到:
评论

相关推荐

    Python批量转换文件编码格式

    本方案介绍了一种使用Python批量转换文件编码格式的方法。具体来说,我们需要编写一个Python脚本来遍历指定目录下的所有文件,并将GBK编码的文件转换为UTF-8编码。为了使脚本更具通用性,我们还考虑到了不同Python...

    使用python批量转换文件编码为UTF-8的实现

    本文将详细讲解如何使用Python批量将文件编码转换为UTF-8。 首先,我们要了解Python中处理文件编码的基本操作。在Python中,打开文件时可以指定文件的编码。例如,使用`open(filename, 'r', encoding='utf-8')`来以...

    python实现批量转换文件编码(批转换编码示例)

    本示例将介绍如何使用Python批量转换文件的编码格式。在处理跨语言或不同系统间的数据时,不同编码间的转换常常是必不可少的步骤。 首先,我们要了解Python中的编码处理。在Python 3中,字符串默认采用UTF-8编码。`...

    批量将文件编码方式由ansi转为utf-8

    标题"批量将文件编码方式由ansi转为utf-8"涉及到的是一个文件处理任务,即转换大量以ANSI编码存储的文件到UTF-8编码。这通常是由于ANSI编码不支持某些非英文字符,或者在跨平台交互时可能会遇到问题,而UTF-8编码则...

    批量文件编码转换工具

    在IT领域,文件编码是数据存储和传输中的一个重要概念,不同的编码方式决定了字符集的表示方式,例如GB2312和UTF-8就是两种常见的字符编码格式。本工具名为"批量文件编码转换工具",专门针对那些需要处理大量文件...

    如何利用python批量转换文件编码?例如,txt文件由UTF-16LE转为UTF-8……

    本篇文章将介绍如何利用Python批量转换文件编码,以解决处理数据时遇到的编码问题。我们将以一个具体的例子来说明,即如何将TXT文件从UTF-16LE编码转换为UTF-8编码。 首先,我们要导入必要的库。`os`库用于操作文件...

    批量编码转化工具(实现文件编码的自动检测)

    工具会根据这些参数执行批量转换操作,并可能在转换完成后生成日志,记录每个文件的处理结果。 5. 编程语言和库: 这个工具可能使用Python、Java或C#等编程语言实现,因为它们都有强大的文件操作和编码处理库。...

    python批量实现Word文件转换为PDF文件

    本文将详细介绍如何使用Python批量实现Word到PDF的转换。 首先,我们需要了解Python中遍历目录的方法,这是批量处理文件的基础。Python提供了多种方式来遍历一个目录及其子目录中的文件: 1. **使用`glob`模块**:...

    使用python批量转换文件编码为UTF-8

    由于这两天换了IDE,在导入以前的工程的时候发现了一个大问题,由于以前脑残的我不知道改编码方式,导致出现了...怎么查看文件的编码方式 好吧我承认就出现了这一个问题。 那么遇到问题我们该怎么办呢,没错,Google,

    OFD批量转换PDF源代码

    标题中的“OFD批量转换PDF源代码”指出这是一个关于将OFD文件批量转换为PDF格式的程序源代码。OFD(Open Fixed-layout Document)是中国国家标准的电子文档格式,主要用于存储固定版面的文档,如政府文件、发票等。...

    python整合ffmpeg实现视频文件的批量转换

    我们的思路是,设定一个文件夹存放源视频文件,python读取该文件夹下的全部文件,并对文件通过ffmpeg进行分析,根据需要,修改目标文件的编码、分辨率等等,调用ffmpeg转换。 我这次的需求是,我家液晶电视只支持...

    批量文本编码转换

    3. **批量操作**:通过遍历目录,使用os模块来获取所有待转换文件,然后逐一进行编码转换。 4. **源码修改**:可能需要根据实际需求调整代码,例如处理特定编码的文件、设定输出路径、处理异常等。 5. **文件I/O**...

    批量设置文档编码方式

    在这个场景下,我们提到的"TextEncoding.exe"很可能是一个批量转换编码的工具。这样的工具可以帮助用户快速统一文件夹内所有文档的编码格式,避免手动逐个修改的繁琐工作。 1. **编码方式详解**: - ASCII编码:是...

    Python批量处理栅格转矢量Raster to Vector

    ### Python批量处理栅格转矢量(Raster to Vector) #### 地统计分析 在地理信息系统(GIS)领域中,地统计分析是一种重要的空间数据分析方法,它不仅涉及对地理数据进行统计学上的描述与推断,还涉及到利用这些...

    python中xls转xlsx代码、操作说明、相关第三方库安装文件及安装方式

    本指南将详细讲解如何使用Python进行这种转换,并提供相关的安装步骤和代码示例。 1. **第三方库的安装** 在Python中,我们通常使用`pandas`库来读取和写入Excel文件,而`openpyxl`库用于处理xlsx格式。由于你提到...

    python实现文件批量编码转换及注意事项

    1. 在使用 `open` 函数时,明确指定文件的编码方式非常重要,因为 Python 不会自动识别文件的编码,尤其是从其他操作系统或应用中获取的文件。 2. 当使用 `os.system` 调用外部命令时,要确保命令的正确性,特别是...

    批量修改TXT文档编码

    4. **转换编码**:使用编程语言(如Python、Java)的内建函数或者专用工具,将读取到的内容按照新编码重新写入文件。 5. **保存为新文件**:转换后的文本保存为新文件,保持原有文件结构不变,以防止原始数据被覆盖...

    mac文件编码转换

    常见的文件类型如txt、xml、css、htm、html、php、jsp等,它们可能因开发环境或语言设定的不同而采用不同的编码方式,如ASCII、UTF-8、ISO-8859-1等。如果编码不一致,可能会导致乱码或者无法正确显示特殊字符。因此...

    python+POP3实现批量下载邮件附件

    在Python3中,对于字符串的编码处理和Python2有所不同,需注意编码方式的改变,比如不再使用unicode对象而是使用str对象。 知识点二:POP3协议 POP3(Post Office Protocol 3)是一种用于接收邮件的协议。通过它,...

Global site tag (gtag.js) - Google Analytics