Java 读取UTF-8文件中文乱码
InputStreamReader isr = new InputStreamReader(new FileInputStream(file), "UTF-8");
BufferedReader read = new BufferedReader(isr);
例如:
private static String readUTF8File(String filePath) throws IOException { InputStreamReader isr = null; BufferedReader read = null; StringBuffer str = null; try { isr = new InputStreamReader( new FileInputStream(new File(filePath)), "UTF-8"); read = new BufferedReader(isr); str = new StringBuffer(); char[] buff = new char[1024]; int byteRead = 0; while ((byteRead = read.read(buff)) != -1) { str.append(new String(buff, 0, byteRead)); } return str.toString(); } finally { isr.close(); read.close(); str = null; isr = null; read = null; } }
应该没问题,试试吧!
相关推荐
Java避免UTF-8的csv文件打开中文出现乱码的方法 在Java中,避免UTF-8的csv文件打开中文出现乱码的方法是非常重要的。csv文件是 comma separated values 的缩写,常用于数据交换和导入导出操作。然而,在Java中读取...
本文将深入探讨如何使用Java来处理带有BOM的UTF-8文件。 首先,`UnicodeInputStream`和`UnicodeReader`是Java中用于处理Unicode编码流的类。它们是`java.io`包的一部分,提供了对带有BOM的文件进行读取的功能。`...
这个场景中,我们面临的挑战是如何正确处理UTF-8带有BOM(Byte Order Mark)的文件,因为BOM可能会导致文件内容显示为问号或者其他乱码。下面将详细介绍如何解决这个问题。 首先,我们需要理解什么是UTF-8的BOM。...
例如,读取文本文件时,应使用`InputStreamReader`和合适的编码参数,如`new InputStreamReader(new FileInputStream(file), "UTF-8")`。 总结,理解并正确处理Java中的字符编码问题,需要关注整个数据流程,从...
通过以上方法,我们可以有效地解决Java JSP项目中的UTF-8乱码问题。在实际开发中,一定要养成良好的编码习惯,避免因为编码问题带来的不必要的麻烦。同时,定期复习和总结有关编码的知识点,对于提升开发效率和代码...
标题中的“dom4j 写UTF-8的xml乱码问题 使用FileOutputStream”涉及的是在使用Java编程语言处理XML文件时遇到的编码问题。DOM4J是一个强大的Java库,用于处理XML、XPath和XSLT,它提供了丰富的API来读取、写入、修改...
本资源主要关注如何判断一个文本文件是否采用UTF-8编码。 在Windows系统中,比如Windows 7旗舰版,我们经常使用Notepad.exe(记事本)来查看和编辑文本文件。在编程环境中,有时候我们需要编写代码来检查文件的编码...
6. 国际化与本地化:`java.text`包中的类,如`MessageFormat`和`ResourceBundle`,在处理多语言内容时,需要考虑如何存储和读取UTF-8编码的资源文件。 7. 编译器参数:Java编译器`javac`支持`-encoding`选项,可以...
如果一个GBK编码的文本包含非GBK字符,使用UTF-8编码器读取会出现乱码。因此,通过转换器将GBK编码转换为UTF-8编码,可以确保文本在各种系统和语言环境中都能正确显示。 4. **编码转换工具的实现**: - 接收输入:...
- 在处理中文字符时,必须确保使用正确的字符编码,例如UTF-8。UTF-8是一种广泛支持的编码格式,可以正确表示大多数语言的字符,包括中文。 - 如果在读取CSV文件时使用了错误的编码(如GBK或ISO-8859-1),则会...
这是因为 Drools 的源代码中,在 org.drools.rule.builder.dialect.java.JavaDialect 类中,public void compileAll() 方法里,文件不是使用 UTF-8 编码的。解决方案是修改 addClassCompileTask 方法,使用 getBytes...
在UTF-8编码环境下,它可以正确地识别和处理包含中文或其他多字节字符的文件名,避免了文件名在上传过程中出现乱码的情况。关键的改进在于`MyFileUpload.java`文件,这个文件中的一行代码实现了对文件名编码的转换,...
"Java读取TXT文本文件乱码解决方案" Java 读取 TXT 文本文件乱码解决方案中,主要讨论的是在 Java 中读取 TXT 文本文件时出现乱码的问题,并提供了解决方案。 首先,文章中提供了一个简单的读取 TXT 文件的代码,...
这个名为`encoding_p.java`的Java源代码文件,应该包含了一个简单的类或函数,用于实现文件从GBK到UTF-8,以及从UTF-8到GBK的转换。在Java中,我们可以使用`java.nio.charset`包中的`Charset`和`CharsetDecoder`、`...
例如,读取一个UTF-8编码的文本文件,可以使用以下Python代码: ```python with open('file.txt', 'rb') as file: content_bytes = file.read() content_str = content_bytes.decode('utf-8') ``` 这段代码中,`...
在Eclipse中,如果你的源代码或者类文件(.class)是以GBK编码保存,而Eclipse默认配置为UTF-8,那么在打开或读取这些文件时就可能出现乱码。 解决这个问题通常需要以下步骤: 1. **设置Eclipse编码**:首先,确保...
例如,如果你从一个GB2312编码的文件读取数据,而你的系统或程序默认使用UTF-8编码,那么你需要进行转码以避免乱码问题。同样,当处理来自不同地区的文本数据时,可能需要将USC2编码的文件转换为UTF-8,以便在支持...
java读写excel包括utf8转码为可识别汉字gbk,jxl方式读取excel,生成一个新的excel