0 0

java读取txt繁体字问题20

txt文件中有繁体字.
在jsp中显示的是?号.怎么将繁体字显示出来,请大家帮忙看下

in = new BufferedReader(new FileReader(strAbsPath + "//ttt.txt"));
String f="~~~";
while((str = in.readLine()) != null){
      String tos = str;
应该怎么转?
OO 
2008年7月01日 12:01

6个答案 按时间排序 按投票排序

0 0

采纳的答案

将txt文件另存为.在另存对话框中,选择编码项为UTF-8.

再将读取到的内容字符串进行编码.转换为UTF-8的格式.

byte[] bytes = str.getBytes("UTF-8");
String result = new String(bytes, "UTF-8");

       

2008年7月01日 12:38
0 0

上面程序应该是可以的

2008年7月02日 15:35
0 0

先将txt文件save as为Encoding是UTF-8的文件
再将jsp中的pageEncoding和charset的值改为UTF-8

2008年7月02日 09:47
0 0

需要搞清楚txt文件里的编码是什么才好说清楚。
你是notepad打开的?
如果是就另存,出现文件编码是utf的则是utf8
如果是iso或西欧的则可能是big5或则gbk,是big5需要转码使用Java以字节读入,然后new String(bytes,“big5”);这样内存里就是正确的unicode了,直接输出io可用。

2008年7月01日 17:44
0 0

import java.io.*;

public class ReadFile {

	public static void readTextFile(){
		try{
			File file = new File("file.txt");  //路径你要具体指定一下!
			String line = null;
			InputStreamReader read=new InputStreamReader(new FileInputStream(file),"GBK"); 
			BufferedReader reader=new BufferedReader(read);
			while( (line=reader.readLine())!=null){
				System.out.println(line);
			} 
			reader.close();
			read.close();
		}catch(Exception e){
			e.printStackTrace();
		}
	}
	
	public static void main(String[] args) {
		readTextFile();
	}
}

2008年7月01日 16:31
0 0

指定字符集。比如big5。

String encoding = "Big5";

Reader reader = new BufferedReader(
  new InputStreamReader(
    new FileInputStream(filename),
    encoding
  )
);

2008年7月01日 13:58

相关推荐

    java中文简体转繁体ZHConverter

    简体中文与繁体中文之间的转换涉及到字符映射,这是因为简体和繁体字在Unicode编码中拥有不同的码点。Java通过`java.text.BreakIterator`、`java.text.CollationKey` 和 `java.text.RuleBasedCollator`等类来处理...

    scala java 简体、繁体互转换,判断是否为简体、繁体

    在中文环境中,简体和繁体字的转换与识别是一个常见的需求,这在标题和描述中已经提到。这里我们将详细探讨如何使用Scala和Java来实现简体与繁体中文的互换以及判断文字是简体还是繁体。 首先,让我们了解简体和...

    Java及相关字符集编码问题研究

    GBK是GB2312的扩展,增加了对台湾繁体字的支持,以及部分少数民族文字和符号。GBK兼容GB2312,能够表示约21000个汉字。 **1.3 Unicode与UTF-8** Unicode是一种通用的字符编码方案,旨在提供所有语言文字的统一编码...

    字频计算统计

    在字频计算的上下文中,这个工具可能用于合并不同的字体文件,使得字频统计可以覆盖更多的汉字,尤其在处理包含特殊字符或繁体字的文本时,合并多种字体可以确保所有字符都能被正确识别和计数。 字频计算通常会用到...

    最全的编码问题,乱码问题,uft-8

    - 在Eclipse中,打开`Windows -> Preferences`,选择`General -> Content Types`,找到`Text`类别下的`Java Source File`,将其默认编码设置为`UTF-8`,并更新所有相关的Java文件。 3. **编译过程中的编码问题**:...

    乱码 编码方式解决 gbk ISO8859-1 utf8 编码

    ### 乱码问题与编码方式解决方案 在计算机科学与信息技术领域中,字符编码是一个至关重要的概念,它直接关系到文本数据的正确存储、传输与显示。本文将针对标题中的几种常见编码格式(GBK、ISO 8859-1、UTF-8)以及...

    gb18030编码

    GBK编码包含了大部分常用汉字,而GB18030则进一步增加了对繁体字、少数民族文字以及一些特殊符号的支持,总计可以表示超过27,000个汉字。 在Java编程环境中,处理GB18030编码至关重要,因为Java的默认字符集是UTF-8...

    Android Txt文本阅读器安卓开发源代码

    - 在Android中,读取TXT文件时,需要根据文件的编码类型进行解码,防止乱码问题。开发者可以通过`InputStreamReader`结合`BufferedReader`来实现这一过程,通过传入不同的编码参数(如"GBK"或"UTF-8")。 2. **...

    Java汉字转拼音pinyin4j用法详解

    pinyin4j使用了一个.txt的文本文件(uicode_to_hanyu_pinyin.txt)用来存储汉字unicode编码与拼音的对应关系,通过读取该配置文件达到转换的目的,该属性文件存储信息的基本格式如下: 89E3 (jie3,jie4,xie4) //...

    UTF-8.rar_utf_utf gb2312_utf 转换_utf-8_utf-8解码

    相对于UTF-8,它的字符覆盖范围较小,无法表示繁体字和其他语言的字符。 在处理中文文本时,有时需要将UTF-8编码的文件转换为GB2312编码,反之亦然。这通常涉及到编码转换函数的使用。在编程语言如Python、Java或...

    图片文字OCR识别-tesseract-ocr压缩包

    使用时,提供一个包含文字的图像文件作为输入,如`tesseract image.jpg output.txt`,这将会把识别出的文字保存到`output.txt`文件中。 **总结** Tesseract OCR引擎是实现图像文字识别的重要工具,尤其在验证码...

    手机 pdf 阅读器

    阅读TXT时,偶尔出现“java.lang.RuntimeException: IOException character”的BUG将在下次修正,目前在自测 一些问题由于无法重现,请大家反馈一下: 1、使用ANYVIEW删除文件时,程序会报错强行退出(NOKIA 6131) 2、...

    Tesseract OCR教程代码示例合集附doc OCR 1.1.rar

    2. **命令行使用**:通过命令行工具,可以调用Tesseract进行简单的文字识别,如`tesseract image.png output.txt`,这会将image.png图像中的文字识别后保存到output.txt文件。 3. **API集成**:对于开发者,可以通过...

    易语言程序免安装版下载

    数据库操作支持库增加读写长整数字段的功能,但受限于系统接口暂不能读写超出整数范围的数值。 7. 修改高级表格支持库,通过鼠标调整行高列宽时不改变当前光标行列号。 8. 修改BUG:在IDE中打开源代码文件(.e)后...

Global site tag (gtag.js) - Google Analytics