`
roomy
  • 浏览: 52551 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

JAVA检测文件字符编码

    博客分类:
  • J2SE
 
阅读更多
import info.monitorenter.cpdetector.io.ASCIIDetector;
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;
import info.monitorenter.cpdetector.io.ParsingDetector;
import info.monitorenter.cpdetector.io.UnicodeDetector;
import java.io.File;
import java.nio.charset.Charset;
/**
 * @author   ---
 * @version  1.0, 2011-12-20
 * @since    JDK1.5
 */
public class FileEncodeDetector {	
	/**
	 * @param file
	 * @return
	 */
	public static String charsetDetect(File file) {
		CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
		detector.add(new ParsingDetector(false));
		detector.add(JChardetFacade.getInstance());
		detector.add(ASCIIDetector.getInstance());
		detector.add(UnicodeDetector.getInstance());	
		String encode = null;
		Charset charset = null;
		try {
			charset = detector.detectCodepage(file.toURI().toURL());	
			if (charset != null) {
				encode = charset.name();
			} else {
				// ...
			}
		} catch (Exception ex) {
			// ...
		}
		return encode;
	}
}
 
分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    java文件字符编码检测和转换

    字符编码检测和转换 附件中:FileEncodeDetector.java 此文件可以检测指定文件的编码格式 public static String getFileEncode(File file) {...} 附件中:FileCharsetConverter.java 此文件可以实现两个编码的相互...

    java文件字符编码集判断依赖.zip

    通用的文件字符编码集判断需要借助第三方包cpdetector.jar 使用Cpdetector jar包检测文件编码需要依赖antlr-2.7.7.jar、chardet-1.0.jar、jargs-1.0.jar三个jar包 本下载资源一站式全包含,并附带亲测有效的片段...

    java获取字符串编码类型代码(导入直接查看结果)

    下面我们将详细探讨如何在Java中检测和获取字符串的编码类型。 首先,Java标准库并没有提供一个直接的API来检测字符串的编码。通常,我们需要通过一些间接的方式来推测编码。一种常见方法是尝试用不同的编码方式...

    Java判断文件编码格式 - 明明是悟空 - 博客园1

    cpdetector是一个轻量级的开源项目,它的大小大约为500KB,提供了一种基于概率统计的算法来检测文件的编码格式。该项目包含了多种探测器,如ParsingDetector、JChardetFacade、ASCIIDetector和UnicodeDetector等,...

    java获取文件编码(判断有无BOM)

    在Java中,我们可以通过`java.nio.charset.Charset`类来检测文件的编码,但这个类并不支持检测BOM。因此,我们需要引入第三方库,如`chardet`或`cpdetector`。这两个库都可以帮助我们自动识别文件的编码,并检查是否...

    Java字符编码及获取文件编码

    在Java编程语言中,字符编码是一个至关重要的概念,它涉及到数据的存储、处理和传输。字符编码决定了如何将字符(如字母、数字、符号)转换为数字表示,以便计算机能够理解并操作它们。本篇文章将深入探讨Java中的...

    JAVA获取文件编码格式

    **cpdetector** 是由Java编写的一个库,它提供了多种方法来检测文件的字符集。这个库包含了多个字符集检测器,能够检测包括但不限于ASCII、UTF-8、GBK、ISO-8859-1等在内的多种编码格式。使用cpdetector,开发者可以...

    Java自动识别文件字符编码工具类.rar

    Java自动识别文件字符编码工具类 参考博客 https://blog.csdn.net/superbeyone/article/details/103036914 使用方式: String encode = EncodingDetect.getFileEncode(geoJsonFile); log.info("系统检测到文件[ {}...

    java 获取文件字符集编码依赖包

    `cpdetector`是Java中一个常用的库,用于自动检测文件的字符集编码。这个库能够帮助开发者识别文件的编码类型,从而避免在处理文本时出现乱码问题。 `cpdetector`库主要由`com.joestelmach`组织开发,它包含了多种...

    读取创建CSV文件并自动解析文件编码方式

    在Java中,`java.nio.charset.Charset`类用于表示字符编码,但默认情况下,Java文件读取操作通常假设文件为UTF-8编码。对于其他编码,我们需要借助第三方库如`jcconf`或`ICU4J`来检测编码。 ```java import ...

    Java判断文件的编码

    1. **UTF-8**:一种可变长度的字符编码,适用于所有Unicode字符,它通过使用一种巧妙的方案来表示各种字符,使得常见的ASCII字符集可以用单字节表示。 2. **GBK**:全称《汉字内码扩展规范》,是中华人民共和国国家...

    java 文件编码转换

    在这个类中,开发者可能定义了方法来读取文件,使用`chardet.jar`检测文件的编码,然后将文件内容转换为期望的编码,如UTF-8。Java的`java.nio`包中的`Charset`和`CharsetDecoder`类是进行编码转换的核心工具。通过...

    获取文件编码方式的两种方式(1.cpdetector第三方jar包,包含源码elipse项目;2.EncodingDetect.java工具类)

    `cpdetector`是一个开源的Java库,它提供了一种方便的方式来检测文件或流的字符编码。这个库包括了多种字符集识别算法,如Unicode的BOM标记检测、频度分析等。使用`cpdetector`,你可以轻松地集成到Eclipse项目中,...

    java判断文件编码格式 三方工具包 cpdetector_1.0.10.jar

    3. 检测文件:使用`DetectController`或`CharsetDetector`的检测方法,传入待检测文件的路径,工具包会自动分析并返回最可能的字符编码。 4. 处理结果:接收并处理返回的编码结果,根据实际情况选择合适的编码进行...

    java验证文件真实格式和编码格式工具类

    `VerifyFileEncoder.java` 类可能包含了检测文件编码的方法。常见的文件编码有ASCII、UTF-8、GBK等。检测文件编码的方法包括: 1. **BOM(Byte Order Mark)检测**:某些编码,如UTF-8和UTF-16,会在文件开始处包含...

    java 获取文件编码

    在Java编程语言中,获取文件编码是一个常见的任务,特别是在处理文本文件时,了解正确的编码格式至关重要,因为不同的编码方式会影响字符的表示和解析。本文将深入探讨如何在Java中识别和处理不同类型的文本编码,如...

    java判断文件编码

    3. 检测文件编码:使用`detectCharset`方法,传入待检测文件的路径,它将返回一个字符串,表示最可能的文件编码。 例如: ```java import com.mycompany.FileCharsetDetector; // 假设FileCharsetDetector在这个包...

    java 写的字符编码转换工具(附带源码)

    通过研究这个字符编码转换工具,不仅可以提升对Java字符编码的理解,还可以学习到文件操作、错误处理、用户交互等方面的知识,对于提升Java编程技能大有裨益。同时,源码分析也有助于我们学习和借鉴优秀的编程实践,...

    Java 获得文件编码格式

    2. `cpdetector_1.0.7.jar`: 这个库是Character Set Detector的Java实现,专门用于检测文件的字符编码。CPDetector库包含多种字符集检测算法,如JChardet(基于Mozilla的chardet),它通过分析文件的字节模式来猜测...

    java程序判断文件编码的类型

    下面是一个示例Java代码片段,用于检测文件编码类型: ```java public static String get_charset(File file) { String charset = "GBK"; byte[] first3Bytes = new byte[3]; try { boolean checked = false; ...

Global site tag (gtag.js) - Google Analytics