`
goblin_god
  • 浏览: 54434 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

用java读取unicode编码的txt文件

    博客分类:
  • J2SE
阅读更多
                   FileInputStream inStream = new FileInputStream("d:\\00L.txt");
		   int inread = inStream.available(); 
		   byte[] inword = new byte[inread];
		   inStream.read(inword, 0, inread);

		   int[] charinto = new int[inread];
		   int i = 0;
		   int[] intcharo = new int[inread / 2];
		   char[] intcharpp = new char[inread / 2];
		   intcharpp[0] = (char) 65534;
		   for (i = 2; i < inread;) {
		    charinto[i] = inword[i] > 0 ? inword[i] : 256 + inword[i];
		    charinto[i + 1] = inword[i + 1] > 0 ? inword[i + 1]
		      : 256 + inword[i + 1];
		    intcharo[i / 2] = (int) (charinto[i] + 256 * charinto[i + 1]);
		    intcharpp[i / 2] = (char) intcharo[i / 2];
		    i += 2;
		   }
		   inStream.close();
		   String str = new String(intcharpp,1,intcharpp.length-1);
分享到:
评论
1 楼 melofoever 2011-11-25  
读别的字符都没问题,但是读汉字“一”出错了,你测试一下!谢谢!

相关推荐

    Java读取TXT文本文件乱码解决方案.doc

    "Java读取TXT文本文件乱码解决方案" Java 读取 TXT 文本文件乱码解决方案中,主要讨论的是在 Java 中读取 TXT 文本文件时出现乱码的问题,并提供了解决方案。 首先,文章中提供了一个简单的读取 TXT 文件的代码,...

    常用的java汉字unicode编码

    在给定的文件中,虽然部分内容难以直接解析为明确的IT知识,但通过其标题“常用的java汉字unicode编码”以及描述“该文档有常用的java汉字unicode编码”,我们可以深入探讨与之相关的知识点。 ### Unicode编码的...

    java 中文Unicode转换

    在实际开发中,我们可能还会遇到从文件读取或写入Unicode编码的情况。Java的`FileReader`和`FileWriter`默认使用平台的默认编码,这可能不适用于包含中文的文件。因此,我们通常需要明确指定`InputStreamReader`和`...

    Unicode编码所有汉字

    在实际开发中,Unicode编码对于处理多语言文本特别有用,比如网页、数据库存储、文件读写等场景。Java的Unicode支持使得开发者能够轻松处理各种语言的数据,从而构建全球化应用程序。 总结一下,本压缩包可能包含的...

    java实现十六进制字符unicode与中英文转换示例

    在Java编程语言中,处理Unicode编码和十六进制字符转换是一项常见的任务,特别是在处理文本数据时。本示例探讨了如何使用Java实现从Unicode十六进制字符串到中英文字符的转换,以及反过来的过程。理解Unicode和UTF...

    java 读取服务器上的某个文件,并解决UTF-8 BOM文件的问号问题

    BOM是Unicode编码的一个可选特征,它在文件的开头插入三个特殊的字节(EF BB BF),用来标识该文件是用UTF-8编码的。大部分现代文本编辑器可以正确处理BOM,但在某些情况下,如直接读取文件内容或进行特定的解析操作...

    java去掉txt文本的bom头信息

    要从TXT文件中删除BOM头,我们可以使用Java的字节流和字符流进行操作。以下是一个简单的示例,展示了如何读取带有BOM头的UTF-8文件,并将其写入一个新的不带BOM头的文件: ```java import java.io.*; import java....

    java获取文件编码(判断有无BOM)

    在Java编程中,处理文件编码是一项常见的任务,特别是在读取、写入或转换文本文件时。文件编码决定了字符集的表示方式,而BOM(Byte Order Mark)则是一种特殊的Unicode标记,用于标识文件的编码类型。本文将详细...

    java 获取文件编码

    在Java编程语言中,获取文件编码是一个常见的任务,特别是在处理文本文件时,了解正确的编码格式至关重要,因为不同的编码方式会影响字符的表示和解析。本文将深入探讨如何在Java中识别和处理不同类型的文本编码,如...

    Java读取TXT文本文件乱码解决方案.pdf

    Java 读取 TXT 文本文件时遇到乱码问题通常是由于编码格式不匹配导致的。在 Java 中,当读取文本文件时,默认使用的是平台的默认编码,这在处理某些特定编码的文件时可能会引发乱码。以下是针对这个问题的详细解释和...

    Java判断文件的编码

    1. **UTF-8**:一种可变长度的字符编码,适用于所有Unicode字符,它通过使用一种巧妙的方案来表示各种字符,使得常见的ASCII字符集可以用单字节表示。 2. **GBK**:全称《汉字内码扩展规范》,是中华人民共和国国家...

    转换带十六进制Unicode编码字符串文件的Java程序文.pdf

    ### 转换带十六进制Unicode编码字符串文件的Java程序 #### 一、背景介绍 在处理文本数据时,经常会遇到不同格式的编码问题,其中Unicode编码是一种广泛使用的字符编码标准,它能够支持世界上几乎所有的字符集。...

    JavaTxt解析文本代码或输出指定编码文本

    在Java编程语言中,处理文本文件的编码是一个常见的任务,特别是在读取和写入TXT文件时。`JavaTxt解析文本代码或输出指定编码文本`这个主题聚焦于如何使用Java有效地识别和处理不同编码类型的TXT文件。这个工具类,...

    Java程序读取服务器端数据文件的解决方法及比较

    此外,Java采用Unicode编码,这进一步增加了跨平台数据处理的复杂性。 #### 解决方案 根据上述分析,针对Java程序读取服务器端数据文件的问题,可以采取以下几种方法: 1. **文本文件读取**:对于服务器端生成的...

    java 写文件 java 写文件 java 写文件 java 写文件

    Java编程语言提供了丰富的API用于处理文件操作,包括创建、读取、写入和删除文件等。在Java中,写文件是通过`java.io`包中的类实现的,主要涉及File类、FileWriter类、BufferedWriter类等。下面将详细阐述Java写文件...

    java io读取文件

    Java IO API提供了一系列类和接口,使得开发者能够高效地读取、写入和操作文件。下面我们将深入探讨Java IO读取文件的技术及其在大数据场景下的应用。 1. **基础概念** - **流(Stream)**:Java IO基于流的概念,...

    java 读取文件乱码

    博文链接中的资源`UnicodeReader.java`和`UnicodeInputStream.java`可能提供了自定义的类来处理非ASCII字符集的文件,尤其是针对Unicode编码的文件。`UnicodeReader`可能是一个扩展了`BufferedReader`的类,它允许...

    Java1Unicode_java_accountdut_

    在实际应用中,处理Unicode编码转换的场景可能包括读取不同编码格式的文件、网络传输、数据库存储等。例如,当从GBK编码的文本文件读取数据时,需要先将GBK编码转换为Unicode,然后再在Java程序中进行处理。Java的`...

    unicode码转中文

    在Java编程语言中,处理Unicode码转换为中文字符是一项常见的任务,特别是在处理字符串、文件读写以及网络通信时。 上传Servlet(UploadServlet.java)可能是处理用户上传的包含Unicode码的数据文件的一个服务端...

Global site tag (gtag.js) - Google Analytics