BBS水木清华站∶精华区
发信人: saturnian (hotaru), 信区: Java
标 题: Java1.1汉字问题解决方案
发信站: BBS 水木清华站 (Tue Dec 9 20:40:26 1997)
1. 复制字体文件(以win95环境为例)
cd <jdk或jre目录>\lib
copy font.properties.zh font.properties
另外有font.properties.zh_TW(繁体)、font.properties.ja(日文)
和font.properties.ko(韩文)可供选择。
2. 支持中文的字体
Dialog, Dialoginput, Serif, Sansserif, Monospaced
注意:其他字体如TimesRoman, Courier等均不支持中文
3. 程序设计上要注意的问题
a. 不要使用DataInputStream与DataOutputStream,而要用
BufferedReader与BufferedWriter。例如:
BufferedReader in=new BufferedReader
(new InputStreamReader(new FileInputStream(file)));
BufferedWriter out=new BufferedWriter
(socket.getOutputStream());
详细资料请参考jdk文档。
b. Properties类的save()和load()方法中文支持亦有问题。建议
不要使用它们,而用BufferedReader与BufferedWriter自行写
输入输出。
c. 对程序员而言,字符串无需任何转换(我指String.getBytes()
方法),亦无须使用Locale类。如果你还是担心,可在程序开头
使用以下方法:
Locale.setDefault(Locale.SIMPLIFIED_CHINESE);
但是这样做会使你的程序失去支持多内码的能力。不推荐使用。
^^^^^^^^^^
4. 测试心得
以上方法在win95平台上经测试完全没问题。java.awt包中的组件,
包括Label, Button, TextField, TextArea, List等等均无问题,而且
Graphics.drawString()方法亦可正常画出中文。另外文本文件的读写、
网络的文本传输均未发现问题。
另外,jre是分英文版和国际版的,若不使用国际版,就无法支持
中文以及其他内码。jdk则肯定支持中文。
5. 仍存在的小问题
TextComponent(即TextField与TextArea)的selectAll()方法。因
String.length()求出的长度是unicode的长度,若文本中有中文,该
方法无法把文本全部选上。
另外,TextComponent内亦无法输入中文,需使用copy/paste。
... 暂时只发现这些... :)
--
Hotaru -> Saturn ?
Hotaru == Saturn ??
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.116.95.22]
BBS水木清华站∶精华区
分享到:
相关推荐
总之,Unicode汉字内码表是中文信息化不可或缺的一部分,它不仅为计算机系统提供了处理汉字的标准方法,也为各种与中文相关的应用和服务提供了坚实的基础。通过掌握Unicode编码规则和使用方法,开发者和研究人员可以...
UNICODE码表在计算机领域内具有举足轻重的作用,它确保了文本在不同的设备和平台上能够准确无误地显示和处理。在此,通用规范汉字指的是在汉字书写系统中广泛使用的基本汉字字符集,其中包括一级字表、二级字表和三...
对于中文用户而言,Unicode的重要性不言而喻,它不仅确保了中文字符能在全球范围内被正确地显示和处理,还极大地促进了中文信息在互联网上的传播。 #### 常用汉字Unicode码表概述 本文提供的“最全的常用汉字...
3. **错误处理**:GBK编码不是无损的,有些GBK字符无法直接映射到Unicode。因此,转换过程中需要处理这些异常情况,例如返回错误代码或替换为替代字符。 4. **码表**:GBK码表是转换的关键,它定义了GBK编码和...
本文将深入探讨“常用的中文Unicode码表”,这对于编程、文本处理以及跨平台的软件开发尤其重要。 Unicode码表是一个庞大的集合,包含了来自不同语言的大量字符。对于中文来说,Unicode 提供了大量汉字的编码,使得...
总的来说,"unicode转gbk码表"是理解和处理多语言文本数据时的重要工具,尤其是在中文环境下,它帮助我们在不同的编码系统之间建立起桥梁,促进了信息的交流和传播。理解和运用这些编码转换方法,对于任何涉及跨平台...
unicode汉字和拼音对照表,按照: 汉字 编码 拼音声标 拼音声调(声调在字母后)声调在拼音后 纯拼音 的格式排列。一共是20902个汉字编码范围是 U4e00 ~ U9fa5.
3. **汉字与Unicode码转换**:在跨平台的数据交换中,将汉字转换成Unicode码,可以避免因编码问题导致的乱码问题。 4. **自然语言处理**:在进行中文自然语言处理任务,如词性标注、语义理解时,拼音信息可以帮助...
本文将深入探讨"汉字 字库 内码表"这一主题,特别是针对"C系列中文机汉字字库内码表"的相关知识。 首先,我们要理解什么是“内码”。在计算机中,内码是字符集中的每个字符在内存中存储时所使用的二进制代码,它...
Unicode不仅能够覆盖所有汉字,还包括全球各地的其他文字,确保了信息在全球范围内的准确传递和交流。在现代信息技术领域,Unicode已经成为处理多语言文本的首选编码标准,无论是网页开发、数据库管理还是软件编程,...
这是常用汉字的Unicode码表,和传智播客视频中的一致,谢谢大家分享
GBK编码,又称为GB2312-80的扩展,是中国大陆广泛使用的汉字编码标准,它是基于ISO-8859-1(西文字符)的基础上扩展的,主要针对简体中文,包括了大部分的汉字和一些非汉字符。GBK使用2个字节来表示一个字符,最多...
### 常用汉字的Unicode编码 #### 一、引言 在计算机科学与信息技术领域,字符编码是一项至关重要的技术,它确保了不同系统间文本数据的正确传输和显示。Unicode作为国际上广泛采用的一种字符编码标准,为每种语言...
总之,"GB和UNICODE互换码表+查找函数"是针对中文字符编码转换的重要工具,对于理解和处理中文字符在不同系统间的兼容性问题非常有用。理解和掌握这部分知识对于进行跨平台的文本处理工作至关重要。
本主题主要关注四种常见的字符编码标准:Unicode、GB18030、GB2312以及GBK,它们在中国汉字编码领域扮演着关键角色。 首先,Unicode是一个全球通用的字符集,它为世界上几乎所有的文字系统提供了唯一的数字表示,...
3. **《Unicode汉字内码表(十进制).txt》**:内码通常指的是计算机内部存储和处理字符时使用的编码,与Unicode编码有所不同。尽管Unicode是国际标准,但不同的操作系统和编程环境可能会使用不同的内码实现。此文件...
3. **UTF-8编码**:UTF-8是Unicode的一个变种,是一种可变长度的编码方式,它使用1到4个字节来表示一个Unicode字符。对于ASCII字符(拉丁字母等),UTF-8与ASCII编码相同,这使得它在兼容性方面具有优势。 在C语言...
在实际应用中,常见的汉字内码有GBK、BIG5、Unicode等,其中Unicode是一种国际通用的字符编码标准,包括了全世界大部分语言的文字,它采用16位或32位编码,能够覆盖更广泛的字符集,包括简体和繁体汉字。 汉字内码...
完整的Unicode码表 包括汉字、英文、藏文、泰米尔、日韩等各国语言编码。