`
wengeldouble
  • 浏览: 5245 次
社区版块
存档分类
最新评论

java文件读取德语乱码

阅读更多

 今天在文件读取西欧国家的语言时,发现乱码,于是搜索了下,发现是编码格式的问题:

 

从维基百科中找到德语的乱码问题,上面这样说道:

乱码问题

由于德语的计算机编码为西欧语言,国际标准ISO-8859-1,所以在使用GB系列BIG5编码的中文系统(如常见的Windows系列)中用一些纯文本无法正确显示变音字符,必须将德文文字转换为Unicode编码才能在文字编辑工具中正常显示。特别是在使用默认GB2312的浏览器查看没有给出语言编码的德文网页时也会出现乱码。但在中文版的GNU/Linux中由于默认使用了UTF-8而避免了乱码。如果变音字符直接用GB系列或BIG5编码保存再次打开就会变成乱码。

 

德语譬如: Graubünden

 

于是代码段更改:

 

/**
 * format String Code
 * @param str
 * @return
 */
private String FormatStringCode(String str){

try {
str = new String(str.getBytes(), "ISO-8859-1");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}

return str;
}

 

解决了这个问题,为了防止下次遇到其他特殊字符的编码问题,于是稍做整理了下:

 

ISO 8859系列字符集

ISO 8859系列字符集是欧洲计算机制造商协会(ECMA)在上世纪80年代中期设计,并被国际标准化(ISO)组织采纳为国际标准。ISO 8859系列字符集目前有15个字符集,包括:

  • ISO 8859-1 大部分的西欧语系,例如英文、法文、西班牙文和德文等(Latin-1
  • ISO 8859-2 大部分的中欧和东欧语系,例如捷克文、波兰文和匈牙利文等(Latin-2
  • ISO 8859-3 欧洲东南部和其它各种文字(Latin-3
  • ISO 8859-4 斯堪的那维亚和波罗的海语系(Latin-4
  • ISO 8859-5 拉丁文与斯拉夫文(俄文、保加利亚文等)
  • ISO 8859-6 拉丁文与阿拉伯文
  • ISO 8859-7 拉丁文与希腊文
  • ISO 8859-8 拉丁文与希伯来文
  • ISO 8859-9 为土耳其文修正的Latin-1Latin-5
  • ISO 8859-10 拉普人、北欧与爱斯基摩人的文字(Latin-6
  • ISO 8859-11 拉丁文与泰文
  • ISO 8859-13 波罗的海周边语系,例如拉脱维亚文等(Latin-7
  • ISO 8859-14 凯尔特文,例如盖尔文、威尔士文等(Latin-8
  • ISO 8859-15 改进的Latin-1,增加遗漏的法文、芬兰文字符和欧元符号(Latin-9
  • ISO 8859-16 罗马尼亚文(Latin-10

其中缺少的编号12据说是为了预留给天城体梵文字母(Deva-nagari)的。印地文和尼泊尔文都使用了这种在七世纪形成的字母表。由于印度定义了自己的编码ISCIIIndian Script Code for Information Interchange),所以这个编号就未被使用。ISO 8859系列字符集都是单字节字符集,即只使用0x00-0xFF对字符编码。

 

 

Thanks,

wengel

分享到:
评论

相关推荐

    java读取txt文件乱码解决方案

    java读取txt文件乱码解决方案java读取txt文件乱码解决方案java读取txt文件乱码解决方案java读取txt文件乱码解决方案java读取txt文件乱码解决方案java读取txt文件乱码解决方案java读取txt文件乱码解决方案java读取txt...

    java读写csv文件,中文乱码问题

    解决Java读取CSV文件中文乱码问题的步骤如下: 1. **指定字符编码**:在使用`BufferedReader`或者`FileReader`读取文件时,应明确指定编码。例如,使用`InputStreamReader`构造函数可以传入编码类型,如`new ...

    java 读取文件乱码

    在Java编程中,遇到“java 读取文件乱码”的问题通常是由于编码格式不匹配导致的。当程序按照一种编码方式打开文件,而文件实际采用的是另一种编码时,就会出现乱码现象。解决这个问题需要理解Java中处理字符编码的...

    Java读写xml,word,xml文件(防乱码)

    ### Java读写XML、Word与TXT文件:去除乱码问题详解 #### 一、引言 在实际开发过程中,我们经常需要处理各种类型的文件,包括XML、Word文档以及普通的文本文件(如TXT)。这些文件在读写过程中经常会遇到乱码问题,...

    java 解析csv文件例子,csv文件 中文乱码问题

    首先,我们需要了解如何使用Java的标准库`java.io`和`java.nio`来读取CSV文件。最常用的是使用`BufferedReader`配合`Scanner`或者`Files.lines()`方法。例如: ```java import java.io.BufferedReader; import java...

    JAVA 解决Properties文件保存中文乱码

    本文将深入探讨如何在Java中解决Properties文件保存和读取中文乱码的挑战。 首先,我们需要理解Java默认使用ISO-8859-1编码来处理Properties文件。由于此编码不支持大部分中文字符,因此在保存或加载包含中文的...

    java读取远程网页乱码解决方案

    在Java编程中,读取远程网页内容是一项常见的任务,但可能会遇到编码问题导致乱码。本文将深入探讨这个问题,提供有效的解决方案,确保正确地读取和处理远程网页的字符编码。 首先,理解网页编码至关重要。网页通常...

    彻底解决JAVA读取写入 TXT中文乱码问题 源码

    在Java编程中,读取和写入TXT文件时,经常遇到中文乱码的问题。这是因为Java默认的字符编码可能与TXT文件的实际编码不一致,导致字符无法正确解析。本篇文章将深入探讨这个问题,并提供完整的源码解决方案。 首先,...

    Java Properties 解决中文乱码和顺序读写.docx

    Java Properties 类是Java标准库中...总之,Java Properties类是Java开发中处理配置文件的利器,通过它的方法可以方便地读取、修改和保存配置信息,尤其在处理包含中文字符的配置时,注意编码问题,确保数据的正确性。

    Java读取TXT文本文件乱码解决方案.doc

    Java 读取 TXT 文本文件乱码解决方案 Java 读取 TXT 文本文件时可能会出现乱码问题,这个问题是由于字符集编码不正确引起的。解决方案是使用正确的编码方式读取文本文件。下面是详细的解决方案: 首先,需要了解 ...

    java 读取文件 文件读取操作

    在Java编程语言中,文件读取是常见的任务,可以用于处理各种类型的数据,如文本、图像、音频等。本文将详细介绍Java中四种不同的文件读取方法:按字节读取、按字符读取、按行读取以及随机读取。 1. **按字节读取...

    java读取文件方法大全

    根据给定的文件信息,我们可以总结出一系列关于Java中读取文件的方法,这些方法涵盖了不同层次的数据读取,包括字节、字符以及行级别的读取。以下是对这些知识点的详细阐述: ### Java读取文件方法大全:读取File流...

    java如何读取文件

    在Java编程语言中,读取文件是一项常见的操作,尤其是在处理数据、日志文件或配置信息时。本文将详细解析如何使用Java读取文本文件,基于提供的代码示例,深入探讨其工作原理及最佳实践。 ### Java读取文本文件的...

    java 文件读写

    在这个场景中,我们关注的是“java文件读写”,特别是读取`properties`配置文件和处理目录及文件的操作。下面我们将详细探讨这两个主题。 首先,`properties`配置文件是Java应用中常用的一种存储配置信息的方式。...

    Java实现文件下载并解决中文文件名乱码

    ### Java实现文件下载并解决中文文件名乱码 在日常的Web开发中,经常会遇到需要让用户下载文件的需求,尤其是在企业级应用中。然而,在实际操作过程中可能会遇到一个常见问题:当文件名包含中文字符时,下载后的...

    java中读取目录下指定的文件

    在Java编程语言中,读取目录下指定的文件是一项常见的任务,这主要涉及到文件I/O操作。Java提供了丰富的API来处理文件系统相关的操作,包括读取、创建、删除文件以及遍历目录等。这里我们将详细讲解如何在Java中实现...

    javadbf 标题中文乱码处理

    基于javadbf-0.4.0而修改的,导入dbf文件时标题转码采用系统默认编码处改为采用用户自定义的转码格式,从而解决标题乱码的问题

Global site tag (gtag.js) - Google Analytics