论坛首页 Java企业应用论坛

bboss 将内容为GBK编码文件转UTF-8工具介绍

浏览 3743 次
精华帖 (0) :: 良好帖 (2) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2012-03-23   最后修改:2012-03-23
bboss 将内容为GBK编码文件转UTF-8工具介绍

bboss 3.6中新增了文件内容字符编码集自动扫描和编码转换工具。本文介绍详细使用方法
对应的组件:
bboss.org.mozilla.intl.chardet.UTF8Convertor

3.6版本尚未发布,不过可以在github下载最新的源码,自行构建jar包升级

组件的详细用法如下:

UTF8Convertor convertor = new UTF8Convertor();
    	//转换文件字符编码GBK,GB2312,gb18030为UTF-8
		convertor.convertCharsetToUtf_8("D:\\workspace\\smc-desktop");
		
		//转换文件字符编码GBK,GB2312,gb18030为UTF-8,指定忽略的目录名称,指定要转换的文件类型
		convertor.convertCharsetToUtf_8("D:\\workspace\\smc-desktop",
				new String[]{".svn","classes",".settings","文档","dbinit-system","distrib","doc","lib","lib-client","lib-compile"},
				new String[]{".jsp",".java",".js",".css",".txt",".properties",".html",".htm",".tld",".vm",".xml"});
		
		//获取文件内容编码集
		 String charset = convertor.takefilecharset(new File("D:\\workspace\\smc-desktop/src-sys/com/frameworkset/platform/sysmgrcore/purviewmanager/PurviewManagerOrgTree.java"));
		//打印没有精确识别出字符集的文件信息
		 System.out.println(convertor.getUnknown());
   发表时间:2012-03-23  
不错,有时候工作中遇到这种编码问题,都是找一些软件做的
0 请登录后投票
   发表时间:2012-03-23  
这个可以自动识别文件件编码,只对需要处理的文件进行处理
0 请登录后投票
   发表时间:2012-03-26   最后修改:2012-03-26

http://simen-net.iteye.com/blog/603252
用SWT写了个小工具,自动识别源编码格式转换,So Easy


0 请登录后投票
   发表时间:2012-03-26  
simen_net 写道

http://simen-net.iteye.com/blog/603252
用SWT写了个小工具,自动识别源编码格式转换,So Easy



恩,赞同你的分享精神

0 请登录后投票
   发表时间:2012-03-26  
有现成的jar包麻烦传一下吧。
0 请登录后投票
   发表时间:2012-03-26  
附件传上来了,下来试试吧,如果想看源码就到正文中提到的github地址下载吧,sourceforge是定期发布的版本目前只有3.5的源码。
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics