论坛首页 编程语言技术论坛

文件编码自动检测及编码转换encodechecker v0.5

浏览 1153 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2014-04-15  
由于很多软件都不能准确自动识别文件编码,因此写了个文件编码识别和转换工具.
编码知识见:
http://zhang-xzhi-xjtu.iteye.com/admin/blogs/1770285

代码见
https://github.com/zhang-xzhi/encodingchecker

目前支持如下编码格式
GBK
US-ASCII
ISO-8859-1
utf-8_withoutBom
utf-8_withBom
UTF-16BE_withBom
UTF-16BE_withoutBom
UTF-16LE_withBom
UTF-16LE_withoutBom
UTF-32BE_withBom
UTF-32BE_withoutBom
UTF-32LE_withBom
UTF-32LE_withoutBom

工具界面如下:



1 可以选择载入的文件
2 可以选择使用什么编码对文件进行解释
3 可以转换文件的编码并且另存文件.




文件载入后,会自动计算文件的可能编码,以及不可能的编码.
注意:ISO-8859-1对于所有文件都是成立的.




选择不同的编码对文件进行解释.Text中会显示该编码的字符串.

1 注意,用户需要自行判断通过检测的可能编码中哪个才是正确的编码.
2 用户可以查看在不可能的编码中,该文件会展示成什么样子.





左侧编码选择正确的编码,右侧编码选择另存文件的编码,可以对文件编码进行转换.
论坛首页 编程语言技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics