`
zhang_xzhi_xjtu
  • 浏览: 538589 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

文件编码自动检测及编码转换encodechecker v0.5

阅读更多
由于很多软件都不能准确自动识别文件编码,因此写了个文件编码识别和转换工具.
编码知识见:
http://zhang-xzhi-xjtu.iteye.com/admin/blogs/1770285

代码见
https://github.com/zhang-xzhi/encodingchecker

目前支持如下编码格式
GBK
US-ASCII
ISO-8859-1
utf-8_withoutBom
utf-8_withBom
UTF-16BE_withBom
UTF-16BE_withoutBom
UTF-16LE_withBom
UTF-16LE_withoutBom
UTF-32BE_withBom
UTF-32BE_withoutBom
UTF-32LE_withBom
UTF-32LE_withoutBom

工具界面如下:



1 可以选择载入的文件
2 可以选择使用什么编码对文件进行解释
3 可以转换文件的编码并且另存文件.




文件载入后,会自动计算文件的可能编码,以及不可能的编码.
注意:ISO-8859-1对于所有文件都是成立的.




选择不同的编码对文件进行解释.Text中会显示该编码的字符串.

1 注意,用户需要自行判断通过检测的可能编码中哪个才是正确的编码.
2 用户可以查看在不可能的编码中,该文件会展示成什么样子.





左侧编码选择正确的编码,右侧编码选择另存文件的编码,可以对文件编码进行转换.
分享到:
评论

相关推荐

    批量编码转化工具(实现文件编码的自动检测)

    2. 自动检测编码的技术: 工具通常采用“字节顺序标记”(BOM)识别、统计字符频率、比较编码表等多种方法来自动检测文件的编码。BOM是某些编码(如UTF-16和UTF-8)在文件开头放置的一个特殊标记,用于表明其编码类型...

    java文件字符编码检测和转换

    字符编码检测和转换 附件中:FileEncodeDetector.java 此文件可以检测指定文件的编码格式 public static String getFileEncode(File file) {...} 附件中:FileCharsetConverter.java 此文件可以实现两个编码的相互...

    读取创建CSV文件并自动解析文件编码方式

    然而,需要注意的是,自动检测编码并不总是100%准确,尤其是当文件没有BOM(字节顺序标记)时。因此,最好在知道文件编码的情况下明确指定,或者在读取前先进行人工检查。 总结,读取和创建CSV文件是数据处理中的...

    java 文件编码转换

    1. **检测编码**:使用`FileCharsetDetector`或类似工具,对文件进行预读,分析字节模式,推测出最可能的编码格式。 2. **读取文件**:使用`java.io`或`java.nio`包中的类,如`BufferedReader`或`Files`,打开文件并...

    Linux查看文件编码格式及文件编码转换

    2. **配置Vim自动识别编码**:可以通过配置`.vimrc`文件来让Vim自动识别文件编码。 - 在用户主目录下的`.vimrc`文件中添加以下内容: ```vim set encoding=utf-8 set fileencodings=ucs-bom,utf-8,cp936 ``` ...

    GBK2UTF8_V0.5_20220106 文件编码转换工具

    标题“GBK2UTF8_V0.5_20220106 文件编码转换工具”指的是一个专门用于处理文本文件编码转换的应用程序,版本号为0.5,发布日期为2022年1月6日。这个工具的主要功能是将GBK编码的文本文件转换成UTF8编码,或者反过来...

    万能的文件编码转换工具。

    这款工具的操作流程简单:用户只需选择待转换文件所在的文件夹,然后指定目标编码格式,软件会自动扫描并转换文件中的编码,确保在新格式下能正确显示文本内容。 该工具特别适用于处理大量文档,如网站源代码、...

    C# 编码自动识别 匹配文件当前编码格式

    本文将详细讲解"C#编码自动识别匹配文件当前编码格式"这一主题,以及如何利用提供的代码实现这一功能。 编码是计算机用于表示和存储字符集的方式,常见的有ASCII、GB2312、GBK、HZ、UTF-8等。GB2312是中国早期的...

    文件编码转换工具

    在处理跨平台或跨语言的文件时,文件编码的不一致可能导致乱码问题,这时就需要文件编码转换工具来解决。 "文件编码转换工具"是一种专门用于处理不同编码格式之间转换的软件。这种工具通常支持常见的编码格式,如...

    lvgl v9.1版本通过LvglFontTool V0.5工具生成内部字体使用

    lvgl v9.1版本通过LvglFontTool V0.5工具生成内部字体使用 该文件使用的编码是:GB2312

    Linux下查看文件编码,文件编码格式转换和文件名编码.doc

    Linux 文件编码查看、转换和文件名编码转换 在 Linux 中查看文件编码可以通过多种方式实现,例如,在 Vim 中可以使用 `set fileencoding` 命令来查看当前文件的编码格式。如果需要自动识别文件编码,可以在 `~/....

    TXT编码批量转换 V2.0编码UnicodeANSIUTF-8互转软件功能Unicode转ANSI转UTF-8互转软件.exe

    Txt文件编码批量转换器用于批量转换txt文本文档的编码格式。通常,我们电脑里的txt文件都是ASNI编码,当放到手机或MP3里时,打开看到的往往都是乱码,面目全非。我们需要先把它们转换为Unicode格式,才能够在手机和...

    mac文件编码转换

    在Mac操作系统中,文件编码转换是一项重要的任务,尤其对于处理包含不同字符集的文本文件时。常见的文件类型如txt、xml、css、htm、html、php、jsp等,它们可能因开发环境或语言设定的不同而采用不同的编码方式,如...

    批量文件编码转换工具

    本工具名为"批量文件编码转换工具",专门针对那些需要处理大量文件编码问题的用户,能够有效地节省时间和精力。 GB2312编码,全称“中华人民共和国国家标准汉字编码”,是简体中文字符集的一种标准,主要应用于早期...

    文件编码转换器

    3. 选择编码:用户可以选择源文件的编码类型,如果不确定,转换器还可能提供自动检测功能,尝试识别文件的编码。 4. 输出编码设置:用户可以设定转换后的文件编码,以便满足特定需求或兼容性要求。 5. 转换过程:...

    文件编码批量转换程序 v1.3

    3. **编码检测**:自动检测文件的原始编码,确保转换的准确性。 4. **转换选项**:用户可能可以选择保留原文件名或添加转换后缀,以便区分转换前后的文件。 5. **日志记录**:程序可能记录转换过程,包括成功转换的...

    AiThinkerIDE_V0.5.zip

    AiThinkerIDE_V0.5.zip文件正是为ESP8266芯片量身定制的一款集成开发环境(Integrated Development Environment,简称IDE),它简化了程序编写、编译和上传的过程,是初学者和专业人士进行ESP8266开发的重要工具。...

    文件编码转换器源码 v1.0

    **文件编码转换器源码 v1.0** 是一个基于C#编程语言开发的开源工具,主要用于处理文本文件的编码转换问题。在信息技术领域,文件编码是决定字符如何在计算机中存储和显示的关键因素,不同的编码标准如ASCII、GBK、...

    php大批量文件编码转换 v1.0

    其智能检测编码的功能则解决了用户需要事先了解文件编码的难题,工具会自动识别每个文件的原始编码,减少了出错的可能性。 在提供的压缩包中,有两个文件:`说明.htm`和`code.php`。`说明.htm`很可能是对工具的使用...

    大批量文件编码转换 v1.0.zip

    总结而言,“大批量文件编码转换 v1.0.zip”是一个专门针对文件编码转换需求设计的工具,它通过智能检测和批量处理功能,有效地解决了文件编码不一致所引发的问题。借助它,用户可以轻松地将文件从当前编码转换为...

Global site tag (gtag.js) - Google Analytics