`

Java 获得文件编码格式

阅读更多

Java 获得文件编码格式

转的,不丢人。

import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;

import java.io.File;
import java.nio.charset.Charset;

public class CharacterEnding {

	public static String getFileCharacterEnding(String filePath) {

		File file = new File(filePath);

		return getFileCharacterEnding(file);
	}

	/**
	 * Try to get file character ending. </p> <strong>Warning: </strong>use
	 * cpDetector to detect file's encoding.
	 * 
	 * @param file
	 * @return
	 */
	public static String getFileCharacterEnding(File file) {

		String fileCharacterEnding = "UTF-8";

		CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
		detector.add(JChardetFacade.getInstance());

		Charset charset = null;

		// File f = new File(filePath);

		try {
			charset = detector.detectCodepage(file.toURL());
		} catch (Exception e) {
			e.printStackTrace();
		}
		if (charset != null) {
			fileCharacterEnding = charset.name();
		}

		return fileCharacterEnding;
	}

	public static void main(String[] args) {
		String filePath = "d:\\t.txt";
		String type = CharacterEnding.getFileCharacterEnding(filePath);
		System.out.println(type);
	}
}

 

 

分享到:
评论

相关推荐

    JAVA获取文件编码格式

    标题提到的“JAVA获取文件编码格式”是一项常见的任务,特别是在处理来自不同来源的文本文件时。在这种情况下,我们可以利用第三方开源库来帮助我们完成这项工作。描述中提到了一个叫做"cpdetector"的工具,这是一个...

    获取文件编码格式(纯JAVA代码,绝对对你有用)

    java 识别文件的编码格式 读取文件的编码 utf-8 gbk gb2312 java 编码 java 获取文件编码格式 java 乱码查找

    java获取文件编码格式

    通过webview打开html文件有可能编码不同就会乱码,所以要获取html文件的编码格式动态改变webview编码设置

    java验证文件真实格式和编码格式工具类

    在Java编程环境中,正确处理文件的真实格式和编码格式至关重要,特别是在进行数据解析和文本处理时。这个主题主要涉及两个核心工具类:`VerifyFileType.java` 和 `VerifyFileEncoder.java`,它们分别用于验证文件的...

    java获取文件编码

    java获取文件原始编码,

    Java判断文本文件编码格式以及读取

    如果很多时候我们没有约定好文件格式,我们就难以读取文件内容,此时,我们就需要一个工具来探测所读文本的编码格式,此工具可以允许用户读取诸如utf-8,gbk,gb2312一类的文件格式。内置了一些常用的探测实现类,...

    java获取文件编码(判断有无BOM)

    本文将详细介绍如何在Java中获取文件的编码并判断文件是否带有BOM。 首先,让我们了解一下什么是BOM。BOM是UTF-8、UTF-16和UTF-32等编码格式中的一个可选标记,用于告知解析器文件的编码类型。例如,UTF-8的BOM是三...

    java 获取文件编码

    在Java编程语言中,获取文件编码是一个常见的任务,特别是在处理文本文件时,了解正确的编码格式至关重要,因为不同的编码方式会影响字符的表示和解析。本文将深入探讨如何在Java中识别和处理不同类型的文本编码,如...

    详解Java如何获取文件编码格式

    在Java编程中,获取文件编码格式是一个常见的需求,特别是在处理跨平台或来自不同来源的文本文件时。本文将深入探讨如何使用Java来识别文件的编码类型,主要关注两种方法:一种是简单的UTF-8与GBK的区分,另一种是...

    读取创建CSV文件并自动解析文件编码方式

    本文将深入探讨如何读取和创建CSV文件,并特别关注自动解析文件编码方式这一关键环节。我们将使用Java语言进行示例,同时引入第三方库来辅助处理编码问题。 首先,创建CSV文件的基本过程涉及将数据写入具有特定分隔...

    如何使用Java代码获取文件、文件流或字符串的编码方式.zip

    本工程用于研究如何使用Java代码获取文件、文件流或字符串的编码方式 本工程编码方式:UTF-8 开发工具:MyEclipse 参考博客:http://blog.csdn.net/gaohuanjie/article/details/43735891

    java识别文件编码

    代码工具类,可以用java代码区分文本文档的编码,非常实用

    获取文件编码格式与文件转码

    下面将详细探讨如何获取文件编码格式以及如何进行文件转码。 1. **文件编码格式的获取** - **通过文件头部标识判断**:很多编码格式会在文件开头包含特定的字节序,如UTF-8的BOM(Byte Order Mark)或GBK的两个...

    获取zip文件编码格式 cpdetector.zip

    "获取zip文件编码格式 cpdetector.zip" 是一个工具,它能够帮助我们识别ZIP文件内文本文件的编码格式。 这个工具的关键依赖于三个JAR文件:antlr-1.0.jar、cpdetector-1.08.jar和jchardet-1.0.jar。这些库提供了...

    获取编码格式的工具类

    本文将详细探讨“获取编码格式的工具类”这一主题,它旨在帮助开发者处理不同编码格式的文本文件,如UTF-8和GBK等。 首先,我们要了解编码格式的基本概念。常见的字符编码有ASCII、GB2312、GBK、BIG5以及Unicode...

    EncodingDetect.java自动获取文件的编码.rar

    EncodingDetect.java,java自动获取文件的编码,智能识别文件编码,支持本地file及指定url的编码识别,支持多达40余种编码的识别,包括最常见的UTF-8,GBK,GB2312,BIG5,UNICODE,ISO8859_1,ASCII等,FileUtil....

    Java字符编码及获取文件编码

    在实际应用中,我们可以使用以下步骤来尝试获取文件编码: 1. 检查文件头是否有BOM(UTF-8, UTF-16, UTF-32)。 2. 使用`CharsetDetector`类(如ICU4J中的)进行检测,该类会基于文件内容的统计特性来推测编码。 3....

    获取文件编码方式的两种方式(1.cpdetector第三方jar包,包含源码elipse项目;2.EncodingDetect.java工具类)

    总的来说,了解并掌握这两种文件编码检测方法,将有助于你更好地处理各种编码问题,确保程序能够正确读取和处理任何格式的文本文件。在实际开发中,可以根据项目需求选择合适的方法,并进行适当的优化和扩展。

    解析URL和文件的编码方式

    在处理未知编码的文件时,可能需要使用一些库来自动检测文件的编码,例如ICU4J库提供了`BreakIterator`和`CharsetDetector`类,能够帮助识别文件的编码格式。 了解和熟练掌握URL和文件的编码方式对于开发跨平台、跨...

Global site tag (gtag.js) - Google Analytics