`
zhang_xzhi_xjtu
  • 浏览: 536691 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

文件编码自动检测及编码转换encodechecker v0.5

阅读更多
由于很多软件都不能准确自动识别文件编码,因此写了个文件编码识别和转换工具.
编码知识见:
http://zhang-xzhi-xjtu.iteye.com/admin/blogs/1770285

代码见
https://github.com/zhang-xzhi/encodingchecker

目前支持如下编码格式
GBK
US-ASCII
ISO-8859-1
utf-8_withoutBom
utf-8_withBom
UTF-16BE_withBom
UTF-16BE_withoutBom
UTF-16LE_withBom
UTF-16LE_withoutBom
UTF-32BE_withBom
UTF-32BE_withoutBom
UTF-32LE_withBom
UTF-32LE_withoutBom

工具界面如下:



1 可以选择载入的文件
2 可以选择使用什么编码对文件进行解释
3 可以转换文件的编码并且另存文件.




文件载入后,会自动计算文件的可能编码,以及不可能的编码.
注意:ISO-8859-1对于所有文件都是成立的.




选择不同的编码对文件进行解释.Text中会显示该编码的字符串.

1 注意,用户需要自行判断通过检测的可能编码中哪个才是正确的编码.
2 用户可以查看在不可能的编码中,该文件会展示成什么样子.





左侧编码选择正确的编码,右侧编码选择另存文件的编码,可以对文件编码进行转换.
分享到:
评论

相关推荐

    java文件字符编码检测和转换

    字符编码检测和转换 附件中:FileEncodeDetector.java 此文件可以检测指定文件的编码格式 public static String getFileEncode(File file) {...} 附件中:FileCharsetConverter.java 此文件可以实现两个编码的相互...

    读取创建CSV文件并自动解析文件编码方式

    然而,需要注意的是,自动检测编码并不总是100%准确,尤其是当文件没有BOM(字节顺序标记)时。因此,最好在知道文件编码的情况下明确指定,或者在读取前先进行人工检查。 总结,读取和创建CSV文件是数据处理中的...

    java 文件编码转换

    1. **检测编码**:使用`FileCharsetDetector`或类似工具,对文件进行预读,分析字节模式,推测出最可能的编码格式。 2. **读取文件**:使用`java.io`或`java.nio`包中的类,如`BufferedReader`或`Files`,打开文件并...

    Linux查看文件编码格式及文件编码转换

    2. **配置Vim自动识别编码**:可以通过配置`.vimrc`文件来让Vim自动识别文件编码。 - 在用户主目录下的`.vimrc`文件中添加以下内容: ```vim set encoding=utf-8 set fileencodings=ucs-bom,utf-8,cp936 ``` ...

    GBK2UTF8_V0.5_20220106 文件编码转换工具

    标题“GBK2UTF8_V0.5_20220106 文件编码转换工具”指的是一个专门用于处理文本文件编码转换的应用程序,版本号为0.5,发布日期为2022年1月6日。这个工具的主要功能是将GBK编码的文本文件转换成UTF8编码,或者反过来...

    万能的文件编码转换工具。

    这款工具的操作流程简单:用户只需选择待转换文件所在的文件夹,然后指定目标编码格式,软件会自动扫描并转换文件中的编码,确保在新格式下能正确显示文本内容。 该工具特别适用于处理大量文档,如网站源代码、...

    C# 编码自动识别 匹配文件当前编码格式

    本文将详细讲解"C#编码自动识别匹配文件当前编码格式"这一主题,以及如何利用提供的代码实现这一功能。 编码是计算机用于表示和存储字符集的方式,常见的有ASCII、GB2312、GBK、HZ、UTF-8等。GB2312是中国早期的...

    文件编码转换工具

    在处理跨平台或跨语言的文件时,文件编码的不一致可能导致乱码问题,这时就需要文件编码转换工具来解决。 "文件编码转换工具"是一种专门用于处理不同编码格式之间转换的软件。这种工具通常支持常见的编码格式,如...

    lvgl v9.1版本通过LvglFontTool V0.5工具生成内部字体使用

    lvgl v9.1版本通过LvglFontTool V0.5工具生成内部字体使用 该文件使用的编码是:GB2312

    Qt文件编码批量转换

    Qt5.9开发的文件编码转换。该工具我用来在Windows7下面VS2015编译器与MinGW编译器编码转换。MinGW编译器使用UTF-8编码,VS2015使用GB2312编码。 预编译头文件缺失,将头文件替换为 #include #include #include #...

    TXT编码批量转换 V2.0编码UnicodeANSIUTF-8互转软件功能Unicode转ANSI转UTF-8互转软件.exe

    Txt文件编码批量转换器用于批量转换txt文本文档的编码格式。通常,我们电脑里的txt文件都是ASNI编码,当放到手机或MP3里时,打开看到的往往都是乱码,面目全非。我们需要先把它们转换为Unicode格式,才能够在手机和...

    超级批量编码转换 1.0

    在《超级批量编码转换 1.0》中,用户可以一次性选择多个需要转换编码的文件或整个目录,程序将自动识别并列出所有包含文本的文件。用户只需指定目标编码格式,如将所有文件转换为UTF-8,然后点击开始转换,软件就会...

    批量文件编码转换工具

    本工具名为"批量文件编码转换工具",专门针对那些需要处理大量文件编码问题的用户,能够有效地节省时间和精力。 GB2312编码,全称“中华人民共和国国家标准汉字编码”,是简体中文字符集的一种标准,主要应用于早期...

    易语言文件编码转换

    通过学习提供的源码,我们可以了解如何在易语言中读取文件、检测编码、转换编码以及写入新文件的详细步骤。这对于初学者来说是一份很好的学习资料,可以帮助他们掌握文件操作和编码转换的基本技能。 6. **实际应用*...

    文件编码转换器

    3. 选择编码:用户可以选择源文件的编码类型,如果不确定,转换器还可能提供自动检测功能,尝试识别文件的编码。 4. 输出编码设置:用户可以设定转换后的文件编码,以便满足特定需求或兼容性要求。 5. 转换过程:...

    文件编码批量转换程序 v1.3

    3. **编码检测**:自动检测文件的原始编码,确保转换的准确性。 4. **转换选项**:用户可能可以选择保留原文件名或添加转换后缀,以便区分转换前后的文件。 5. **日志记录**:程序可能记录转换过程,包括成功转换的...

    批量修改文件编码软件

    一旦找到目标文件,用户只需点击“一键修改”,软件便会自动将这些文件的编码格式转换为预设的目标编码,如UTF-8无BOM格式。 批量修改过程中,软件通常会先读取每个文件的内容,识别其当前编码,然后使用适当的算法...

    大批量文件编码转换 v1.0.zip

    标题中的“大批量文件编码转换 v1.0.zip”指的是一个专门用于进行文件编码转换的工具,这个工具具有批量处理的能力,能够一次性处理大量文件,从而极大地提高了工作效率。编码转换在IT领域中是非常常见的需求,尤其...

    txt文件编码批量转换器V2.11版

    转换成功的文本文件会自动存放到同一个文件里面,名字为原来的文本文件名字加上编码格式。 更新历史: 2009-09-27 《txt文件编码批量转换器V1.1版》第一次发布。 2010-08-31 《txt文件编码批量转换器V2.1版》...

    java源文件编码转换工具加源码(自动检测源文件编码类型)

    1. **自动检测编码**:通过分析文件内容,识别出源文件的原始编码格式。这通常涉及到查找特定编码特征的字节序列,比如UTF-8的BOM(字节顺序标记)或其他编码特有的字符序列。 2. **转换编码**:一旦检测到源文件的...

Global site tag (gtag.js) - Google Analytics