从网上下下来的代码,一编译老是出现:
warning C4819: The file contains a character that
cannot be represented in the current code page (936). Save the file in Unicode
format to prevent data loss
另我感觉实在不爽得很,因为就一个头文件,就出现几百个这样的警告。采用warning
disable的方式应该也不怎么好,所以写了个utf8文件转换器。
用c++做这玩意,实在没意思,大才小用,所以用python做了一个。
import chardet
import tempfile
import
os
import shutil
import sys
def
convertUtf8(filename):
f=open(filename,'r')
t=''
#存放文件的数据
try:
for
line in f:
t+=line #所文件读到t里面
finally:
f.close()
encodeing =chardet.detect(t)['encoding']
if not
encodeing =='utf-8':
print 'file
encode',encodeing
wf=open(filename,'wr')
wf.write(unicode(t,encodeing).encode('utf-8'))
#编码
wf.close()
if __name__=="__main__":
filename = sys.argv[1] #第一个参数为文件名
convertUtf8(filename)
如果你也有我这样烦恼就用用吧。
lixiaomail
2008-07-23
分享到:
相关推荐
"UTF-8转ANSI文本文件转换器"就是这样一个工具,它能够帮助用户批量将UTF-8编码的文本文件转换为ANSI编码的文本文件。在此,我们将深入探讨UTF-8和ANSI编码的原理以及转换过程中涉及的关键知识点。 **一、UTF-8编码...
UTF8文件编码转换器是一种工具,它允许用户将文件从一种字符编码格式转换为UTF-8编码格式。在计算机科学和网页开发领域,文件编码是非常关键的,因为它决定了文本如何被正确地读取和显示。UTF-8是目前最常用的多语言...
批量文件GBK-UTF8编码转换器
这个“UTF-8编码转换器”工具旨在帮助用户方便地将文本数据从其他编码格式转换为UTF-8,确保数据在不同系统和平台之间的兼容性。 在计算机科学中,字符编码是用来表示文本的数字表示方式。不同的编码系统适用于不同...
比如,如果你有一个使用Big5编码的文本文件,但需要在UTF-8编码的环境中使用,这个转换器就可以派上用场。 需要注意的是,该工具仅能处理纯文字格式的文件,如txt、html等,不能用于处理包含二进制数据的文件,如MS...
“中文-UTF-8编码转换器.exe”是这个软件的可执行文件,用户可以通过运行这个程序来使用转换功能。在Windows操作系统中,.exe文件是可执行程序的标识,双击该文件即可启动转换器。在使用过程中,用户可能需要选择...
"GBK转UTF8"是指将使用GBK编码的文件转换成使用UTF-8编码的过程。这个过程通常涉及到读取GBK编码的文本,将其解码为Unicode码点,然后再用UTF-8编码规则重新编码这些码点,生成新的UTF-8文件。转换过程中需要注意的...
GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...
总而言之,这个基于Qt5.9开发的文件编码转换工具,能够帮助用户批量处理UTF-8与GB2312编码的转换,解决因编码不匹配导致的乱码问题。同时,由于采用了Qt框架,该工具具备了跨平台、丰富的功能集以及良好的用户体验。...
"批量utf文件转utf8-bom"这个主题指的是将一批以UTF编码的文件转换为带有BOM(Byte Order Mark)的UTF-8编码。BOM是一个特殊的字节序列,用于标识文件的编码类型,对于UTF-8编码,BOM的字节序列为0xEF, 0xBB, 0xBF。...
fileencodingtransform 文件编码转换器源码 v1.0 最近用VS2005做项目,遇到一个工程中有很多文件的编码不统一,有的是UTF-8,有的是GB32的,发布网站时就乱七八糟的。可以通过VS环境中的“高级保存选项”一个一个地...
标题和描述中提到的"编码转换器 绿色版 gb2312 gbk utf-8 万能转换"是一个软件工具,它能够帮助用户将文本文件从一种编码格式转换到另一种,尤其是GB2312、GBK和UTF-8这三种常见的中文编码格式。 1. **编码系统**:...
在压缩包子文件的文件名称列表中,我们看到"GB2UTF8.exe",这很可能是这个转换器的可执行文件。用户只需运行这个程序,并按照界面提示选择需要转换的文件或目录,就能完成编码转换过程。 在实际应用中,编码问题...
在压缩包中的"Utf8ToHex.exe"文件很可能是一个命令行工具,用户可以通过输入UTF-8字符串,得到其16进制表示。 使用这类工具通常涉及以下步骤: 1. 输入UTF-8编码的字符串。 2. 工具将字符串解析为单个字节,然后...
6. **注意事项**:在处理UTF-8文件时,确保你的编辑器和程序都正确配置为UTF-8模式,否则可能会出现乱码问题。在读取UTF-8文件时,也需要类似的处理,确保输入流以UTF-8模式打开。 总的来说,虽然C++标准库本身对...
这个“utf-8码转换器”程序是用SWT(Standard Widget Toolkit)开发的,旨在帮助用户将非UTF-8编码的文本转换为UTF-8编码。在IT行业中,理解和使用UTF-8编码是非常基础且重要的知识。 1. **Unicode与UTF-8**: ...
GB2312简体文字在线转换UTF8代码转换工具
在这个例子中,`Encoding.GetEncoding("GBK")`获取了GBK编码器,`GetBytes()`方法将GBK编码的字符串转换为字节数组,然后`Encoding.UTF8.GetString()`将这个字节数组还原为UTF-8编码的字符串。 对于文件的编码转换...
批量转UTF8工具则是针对那些需要将大量文本文件从其他编码格式(如GBK、BIG5等)转换为UTF8编码的场景而设计的实用软件。 在计算机领域,文本文件的编码方式决定了如何存储和显示其中的文字。不同的编码体系有着...