`

python 转换文件编码

阅读更多
'''
Created on 2013-2-26

@author: whuang
'''

def convertEncoding(from_encode,to_encode,old_filepath,target_file):
    f1=file(old_filepath)
    content2=[]
    while True:
        line=f1.readline()
#        print line
        content2.append(line.decode(from_encode).encode(to_encode))
        if len(line) ==0:
            break

    f1.close()
    
#    print line
    f2=file(target_file,'w')
    f2.writelines(content2)
    f2.close()

def convertFromGBK2utf8(filepath):
#把文件由GBK编码转换为UTF-8编码,也就是filepath的编码是GBK
    convertEncoding("GBK", "UTF-8", filepath, filepath+".bak")

def convertFromUTF82gbk(filepath):
#把文件由UTF-8编码转换为GBK编码,也就是filepath的编码是UTF-8
    convertEncoding("UTF-8", "GBK", filepath, filepath+".bak")
 
filepath="e:\\test\\test5.txt"
convertFromUTF82gbk(filepath)

 

分享到:
评论

相关推荐

    python实现算术编码

    在这个Python实现中,我们将深入探讨算术编码的基本原理、Python编程实现的关键步骤以及如何进行编码和解码。 1. **算术编码的基本概念** 算术编码的核心思想是将输入符号的概率分布转化为一个连续的区间,通过...

    基于python开发的编码转换工具,图形化界面基于pyside2(qt5)开发.zip

    支持批量转换任意格式的文件编码; 可将文件编码转为UTF-8 BOM 、UTF-8、GB2312中的任意一种格式;.zip 基于python开发的编码转换工具,图形化界面基于pyside2(qt5)开发。 支持批量转换任意格式的文件编码; 可将...

    python 设置文件编码格式的实现方法

    如果要在python2的py文件里面写中文,则必须要添加一行声明文件编码的注释,否则python2会默认使用ASCII编码。(python3已经没有这个问题了,python3默认的文件编码是UTF-8) 必须将编码注释放在第一行或者第二行,...

    Shannon_Python香农编码_python_shannon_香农编码_

    在实际应用中,为了方便存储和传输,编码后的二进制字符串通常会被转换成十进制或十六进制表示,并添加适当的头部信息(如编码表的长度和编码表本身),以便解压时能重建编码表。 以上就是一个基于Python的香农编码...

    mac文件编码转换

    在Mac操作系统中,文件编码转换是一项重要的任务,尤其对于处理包含不同字符集的文本文件时。常见的文件类型如txt、xml、css、htm、html、php、jsp等,它们可能因开发环境或语言设定的不同而采用不同的编码方式,如...

    Python-f2b对目录及其文件进行base64编码解码的脚本文件

    在给定的场景中,我们关注的是一个名为"Python-f2b"的脚本,它专门用于对目录及其内部文件进行Base64编码和解码。Base64是一种用于将二进制数据转换为ASCII字符的编码方法,常用于在网络上传输非ASCII字符,如图片或...

    批量文件编码转换工具

    运行工具后,界面通常会有选项供用户选择源编码类型(如GB2312)和目标编码类型(如UTF-8),以及指定待转换文件的根目录。一旦设置完成,点击转换按钮,工具就会遍历指定目录下的所有文件,逐一进行编码转换。 在...

    Huffman 编码图像无损压缩和解压缩 Python示例代码 哈夫曼编码

    6. 将编码后的位串转换为字节序列写入压缩文件 解压原理: 1. 从压缩文件读取编码后的位串 2. 去除填充,提取实际的编码文本 3. 对编码文本进行解码,恢复原始的像素值序列 4. 将解码得到的一维像素值序列 reshape ...

    Python实现编码ANSI转UTF8

    Windows文档默认编码是ANSI,Linux文档默认编码是UTF8。项目进行平台移植(Windows—>Linux)时涉及到大量文档编码格式转换,即TXT...代码中Python实现了指定目录下TXT文档编码ANSI转UTF8。批量转换。简单。易实现。

    文件编码转换工具(GB2312与UTF-8转换) python写的一个小工具

    文件编码转换工具(GB2312与UTF-8转换) python写的一个小工具文件编码转换工具(GB2312与UTF-8转换) python写的一个小工具文件编码转换工具(GB2312与UTF-8转换) python写的一个小工具

    Python批量转换文件编码格式

    ### Python批量转换文件编码格式详解 #### 背景与需求 在日常工作中,我们可能会遇到需要处理大量文件的情况,特别是在文件编码不统一时。例如,如果一批文件原本使用GBK编码,而我们的应用或系统更倾向于使用UTF-8...

    Python PEP8 编码规范中文版

    对于Python2代码,如果存在混合使用的情况,应当统一转换为空格。如果在命令行中使用-t选项运行Python2代码,将会得到警告,如果使用-tt选项,则会将警告提升为错误。这一点非常关键,因为Python2和Python3在缩进...

    python实现批量转换文件编码(批转换编码示例)

    在提供的代码中,定义了一个名为`Encoding`的类,它包含了批量转换文件编码的功能。这个类有以下几个主要方法: 1. `__init__`: 初始化方法,设置文件扩展名(self.ext)和源编码、目标编码(self.srcEncoding和...

    Python中文本编码官方文件(howto-unicode)

    Python官方的这篇HOWTO文档《Python中文本编码官方文件(howto-unicode)》详细地介绍了Unicode编码的基本知识以及Python对Unicode的支持,这对于深入理解Unicode编码机制以及处理常见的编码问题极为重要。...

    文件编码转换器源码

    在这个特定的“文件编码转换器源码”中,主要涉及了从GB2312编码到UTF-8编码的转换。GB2312,全称为《信息交换用汉字编码字符集·基本集》,是中国大陆早期广泛使用的简体中文字符编码标准。而UTF-8则是Unicode ...

    视频格式转换python代码

    在提供的压缩包文件`MP4zhuanhuanAVI`中,很可能包含了实现上述转换过程的Python脚本,供用户参考和学习。通过这个例子,我们可以深入理解Python与OpenCV在视频处理中的应用,以及如何进行视频格式的转换。 总结来...

    如何利用python批量转换文件编码?例如,txt文件由UTF-16LE转为UTF-8……

    本篇文章将介绍如何利用Python批量转换文件编码,以解决处理数据时遇到的编码问题。我们将以一个具体的例子来说明,即如何将TXT文件从UTF-16LE编码转换为UTF-8编码。 首先,我们要导入必要的库。`os`库用于操作文件...

    基于python开发的编码转换工具,图形化界面基于pyside2(qt5)开发 支持批量转换任意格式的文件编码+源代码+文档说

    支持批量转换任意格式的文件编码; 可将文件编码转为UTF-8 BOM 、UTF-8、GB2312中的任意一种格式; src文件夹下是源码,exe文件夹下是打包好可直接在windows下运行的exe程序。 ---- 该资源内项目源码是个人的...

    使用python批量转换文件编码为UTF-8的实现

    在尝试批量转换文件编码时,我们通常会先遍历指定目录下的所有文件,找到需要转换编码的目标文件。这里使用`os.walk()`函数可以递归遍历指定路径下的所有子目录和文件,筛选出特定扩展名的文件,如`.java`文件。 ``...

Global site tag (gtag.js) - Google Analytics