在多语言环境中需要保存配置数据,一般采用Unicode格式。在java中,默认是ASCII码格式文件。所以在读取Unicode格式文件的时候,要制定字符集。
譬如有一个Unicode格式的文件,命名为data.conf。里面保存一些名/值对(key/value pari),和properties文件内容是一样的,但是文件后缀名是.conf。现在想读取该文件。
String filePath = getFilePath("data.conf");
InputStreamReader isr = null;
try {
//Unicode file.
isr = new InputStreamReader(new FileInputStream(filePath ), "UTF-16");
// isr = new InputStreamReader(new FileInputStream(filePath ), "UNICODE");
final Properties props = new Properties();
props.load(isr);
//handle properties here
} catch (final FileNotFoundException e) {
throw new RuntimeException(e);
} catch (final IOException e) {
throw new RuntimeException(e);
} finally {
try {
isr.close();
} catch (final IOException ioe) {
throw new RuntimeException(ioe);
}
}
这样就可以正确地读出Unicode编码的文件内容了。
分享到:
相关推荐
在本主题中,我们关注的是如何利用Java解析DXF(Drawing Exchange Format)文件,这是一种由AutoCAD软件生成的二进制或ASCII格式的文件,用于存储二维图形数据。DXF文件通常包含各种几何实体,如圆(circle)、椭圆...
在给定的文件中,虽然部分内容难以直接解析为明确的IT知识,但通过其标题“常用的java汉字unicode编码”以及描述“该文档有常用的java汉字unicode编码”,我们可以深入探讨与之相关的知识点。 ### Unicode编码的...
将中文字符转换为Unicode编码,可以使用`Character`类的`toChars()`方法,或者直接通过字符串的`codePointAt()`方法获取码点,然后以"\u"开头的十六进制格式表示。例如: ```java String chineseStr = "你好"; for ...
Jad是Java反编译器的代表之一,它能够将.class文件解析成接近原始的Java源代码,帮助开发者理解代码逻辑。 在Java反编译过程中,Jad.exe通常被用来查看或分析已有的字节码,以获取类、方法、变量等信息。反编译工具...
通过以上策略,我们可以有效地解决Java解析文件时的乱码问题。在实际应用中,遇到乱码问题时,应首先确定文件的正确编码,然后根据编码选择合适的读取方式。同时,养成良好的编码习惯和项目规范,可以预防大部分的...
2. **Unicode编码到字符转换**:逆向过程,将Unicode编码解析并转换回对应的字符。这需要正确解读每个编码并查找相应的字符。 3. **支持多国语言**:由于Unicode覆盖了世界各地的语言,此转换器能够处理中文、日文...
在Java中,解析PDF文件通常需要借助特定的库。本篇文章将深入探讨两个用于Java的PDF解析工具:XPDF和PDFBox,并提供相关示例程序。 首先,我们来看XPDF。XPDF是一个开源的PDF工具集,它主要由命令行工具组成,如...
BOM是UTF-8、UTF-16和UTF-32等编码格式中的一个可选标记,用于告知解析器文件的编码类型。例如,UTF-8的BOM是三个字节(0xEF, 0xBB, 0xBF),而UTF-16LE和UTF-16BE的BOM分别是两个字节(0xFF, 0xFE)和(0xFE, 0xFF...
Extract Text – 使用PDFBox,您可以从PDF文件中提取Unicode文本。 Split & Merge – 使用PDFBox,您可以将单个PDF文件分成多个文件,并将它们合并为一个文件。 Fill Forms – 使用PDFBox,您可以在文档中填写表单...
由于历史原因,不同系统和文件可能使用不同的字符编码,如GBK、Big5或Unicode的UTF-8、UTF-16等。正确识别并转换编码是确保中文字符串正确提取的关键步骤。 总结一下,从Java、C#和Designer文件中提取中文字符串...
为了确保程序能够正确解析文件内容,必须先判断文件的编码格式。本文将详细介绍如何使用Java来判断文件是否为UTF-8或GBK编码,并提供一个示例代码。 #### 文件编码基础知识 1. **UTF-8**:一种可变长度的字符编码...
Java Emoji Converter提供了一个统一的接口,允许开发者将一个格式的Emoji字符串转化为另一种格式,确保在各种环境中都能正确显示。 这个工具的核心功能包括: 1. **编码转换**:它能够识别并转换Unicode编码的...
### 转换带十六进制Unicode编码字符串文件的Java程序 #### 一、背景介绍 在处理文本数据时,经常会遇到不同格式的编码问题,其中Unicode编码是一种广泛使用的字符编码标准,它能够支持世界上几乎所有的字符集。...
这个工具类,如`TxtEncodingDetect.java`所示,提供了一种方法来检测和解析文本文件的编码格式,比如GBK和UTF-8,这两种编码在中文环境中尤为常见。 GBK编码是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,...
首先,让我们了解ZIP文件格式。ZIP是一种广泛使用的文件存档格式,它允许将多个文件和目录打包成一个单一的压缩文件,以节省存储空间和提高传输效率。ZIP文件内部包含了文件的原始数据以及元数据,如文件名、日期...
### Java程序判断文件编码的类型 #### 知识点概览 本文档旨在教导读者如何通过Java编程语言来判断文件的编码类型。这包括常见的编码格式如GBK、UTF-8等。了解文件编码对于处理多语言环境下的文本数据至关重要。 ##...
本文将深入探讨如何通过Java解析emoji表情并将其安全地存入Oracle数据库,以及在移动端恢复显示这些表情。 首先,我们需要了解emoji表情的本质。它们属于Unicode字符集的一部分,特别是Unicode的补充区块,如...
### XML与Java解析技术知识点概览 #### 一、课程目标 本课程旨在为学习者提供坚实的XML及其相关技术的基础,并培养他们使用Java编写XML处理应用程序的能力。具体来说,课程包含两个主要目标: 1. **提供学生对于...
2. **编译过程中的编码转换**:Java编译器(`javac`)在编译Java源文件时,会根据源文件的实际编码格式解析其中的文本内容,并将其转换成Unicode格式存储在`.class`文件中。 3. **运行时的编码转换**:Java虚拟机...