论坛首页 Java企业应用论坛

文件编码自动检测及编码转换

浏览 7041 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2012-06-03  
由于很多软件都不能准确自动识别文件编码,因此写了个文件编码识别和转换工具.
编码知识见:
http://zhang-xzhi-xjtu.iteye.com/admin/blogs/1269675

工具界面如下:



1 可以选择载入的文件
2 可以选择使用什么编码对文件进行解释
3 可以转换文件的编码并且另存文件.




文件载入后,会自动计算文件的可能编码,以及不可能的编码.
注意:ISO-8859-1对于所有文件都是成立的.




选择不同的编码对文件进行解释.Text中会显示该编码的字符串.

1 注意,用户需要自行判断通过检测的可能编码中哪个才是正确的编码.
2 用户可以查看在不可能的编码中,该文件会展示成什么样子.





左侧编码选择正确的编码,右侧编码选择另存文件的编码,可以对文件编码进行转换.
   发表时间:2012-06-04  

这个能不能递归扫描文件夹下,符合下面表达式的文件类型

*.java|*.xml|.js

然后批量操作

再加上 "同时备份" 功能 可选
0 请登录后投票
   发表时间:2012-06-04  
这个当然是可以搞的 但是你能确定这些文件的编码都是同一个吗
0 请登录后投票
   发表时间:2012-06-04  
很多情况下如果是本地文件的转码的话,使用类似EditPlus的工具就可以了,
当然你现在用java写的吗,可以再linux或mac下使用了
0 请登录后投票
   发表时间:2012-06-04  
我是用的notepad++,但是,工具都是有局限的.

1 没有精确的告诉你文件的编码是什么,而且,一般工具会做一些聪明的猜测,比如xml文件前面声明了encoding="UTF-8",工具就以为是UTF-8的了.其实该文件完全可以是GBK编码的(我承认这么做很傻,但是很多时候身不由己,如果整个系统的都是声明utf-8,实际使用GBK,那我绝对不改这个文件的编码).
2 转码时没有检测信息是否完全可以互转,由于1中说的问题,有可能发生A转成B,B就再也不能转回A了.

所以还是回归原始,自己写程序检查.让一切都透明起来,当然,这个是程序员的个人爱好了.
0 请登录后投票
   发表时间:2012-06-04  
建议用vim,windows版本的就有自动识别转换功能,还能diff,比notepad++强大多了。
0 请登录后投票
   发表时间:2012-06-05  
iconv 
0 请登录后投票
   发表时间:2012-06-06  
你用的fireFox那个库吗
0 请登录后投票
   发表时间:2012-11-24  
自己写的实现
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics