`

Unicode汉字内码表3

阅读更多

BBS水木清华站∶精华区

发信人: saturnian (hotaru), 信区: Java 
标  题: Java1.1汉字问题解决方案 
发信站: BBS 水木清华站 (Tue Dec  9 20:40:26 1997) 
 
1. 复制字体文件(以win95环境为例) 
 
  cd <jdk或jre目录>\lib 
  copy font.properties.zh font.properties 
 
  另外有font.properties.zh_TW(繁体)、font.properties.ja(日文) 
  和font.properties.ko(韩文)可供选择。 
 
 
2. 支持中文的字体 
 
  Dialog, Dialoginput, Serif, Sansserif, Monospaced 
 
  注意:其他字体如TimesRoman, Courier等均不支持中文 
 
3. 程序设计上要注意的问题 
 
   a. 不要使用DataInputStream与DataOutputStream,而要用 
      BufferedReader与BufferedWriter。例如: 
 
      BufferedReader in=new BufferedReader 
        (new InputStreamReader(new FileInputStream(file))); 
 
      BufferedWriter out=new BufferedWriter 
        (socket.getOutputStream()); 
 
      详细资料请参考jdk文档。 
 
    b. Properties类的save()和load()方法中文支持亦有问题。建议 
       不要使用它们,而用BufferedReader与BufferedWriter自行写 
       输入输出。 
 
    c. 对程序员而言,字符串无需任何转换(我指String.getBytes() 
       方法),亦无须使用Locale类。如果你还是担心,可在程序开头 
       使用以下方法: 
         Locale.setDefault(Locale.SIMPLIFIED_CHINESE); 
       但是这样做会使你的程序失去支持多内码的能力。不推荐使用。 
                                                   ^^^^^^^^^^ 
4. 测试心得 
 
      以上方法在win95平台上经测试完全没问题。java.awt包中的组件, 
  包括Label, Button, TextField, TextArea, List等等均无问题,而且 
  Graphics.drawString()方法亦可正常画出中文。另外文本文件的读写、 
  网络的文本传输均未发现问题。 
      另外,jre是分英文版和国际版的,若不使用国际版,就无法支持 
  中文以及其他内码。jdk则肯定支持中文。 
 
5. 仍存在的小问题 
 
      TextComponent(即TextField与TextArea)的selectAll()方法。因 
  String.length()求出的长度是unicode的长度,若文本中有中文,该 
  方法无法把文本全部选上。 
      另外,TextComponent内亦无法输入中文,需使用copy/paste。 
 
      ... 暂时只发现这些... :) 
-- 
    Hotaru -> Saturn ? 
    Hotaru == Saturn ?? 
 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.116.95.22] 

BBS水木清华站∶精华区

分享到:
评论

相关推荐

    Unicode汉字内码表

    总之,Unicode汉字内码表是中文信息化不可或缺的一部分,它不仅为计算机系统提供了处理汉字的标准方法,也为各种与中文相关的应用和服务提供了坚实的基础。通过掌握Unicode编码规则和使用方法,开发者和研究人员可以...

    通用规范汉字UNICODE码表

    UNICODE码表在计算机领域内具有举足轻重的作用,它确保了文本在不同的设备和平台上能够准确无误地显示和处理。在此,通用规范汉字指的是在汉字书写系统中广泛使用的基本汉字字符集,其中包括一级字表、二级字表和三...

    最全的常用汉字Unicode码表

    对于中文用户而言,Unicode的重要性不言而喻,它不仅确保了中文字符能在全球范围内被正确地显示和处理,还极大地促进了中文信息在互联网上的传播。 #### 常用汉字Unicode码表概述 本文提供的“最全的常用汉字...

    GBK转UNICODE函数和码表

    3. **错误处理**:GBK编码不是无损的,有些GBK字符无法直接映射到Unicode。因此,转换过程中需要处理这些异常情况,例如返回错误代码或替换为替代字符。 4. **码表**:GBK码表是转换的关键,它定义了GBK编码和...

    常用的中文Unicode码表

    本文将深入探讨“常用的中文Unicode码表”,这对于编程、文本处理以及跨平台的软件开发尤其重要。 Unicode码表是一个庞大的集合,包含了来自不同语言的大量字符。对于中文来说,Unicode 提供了大量汉字的编码,使得...

    unicode转gbk码表

    总的来说,"unicode转gbk码表"是理解和处理多语言文本数据时的重要工具,尤其是在中文环境下,它帮助我们在不同的编码系统之间建立起桥梁,促进了信息的交流和传播。理解和运用这些编码转换方法,对于任何涉及跨平台...

    unicode汉字编码拼音对照表

    unicode汉字和拼音对照表,按照: 汉字 编码 拼音声标 拼音声调(声调在字母后)声调在拼音后 纯拼音 的格式排列。一共是20902个汉字编码范围是 U4e00 ~ U9fa5.

    汉字拼音及首字母unicode码对照库(2万多条)

    3. **汉字与Unicode码转换**:在跨平台的数据交换中,将汉字转换成Unicode码,可以避免因编码问题导致的乱码问题。 4. **自然语言处理**:在进行中文自然语言处理任务,如词性标注、语义理解时,拼音信息可以帮助...

    c系列中文机汉字字库内码表

    本文将深入探讨"汉字 字库 内码表"这一主题,特别是针对"C系列中文机汉字字库内码表"的相关知识。 首先,我们要理解什么是“内码”。在计算机中,内码是字符集中的每个字符在内存中存储时所使用的二进制代码,它...

    汉字ASCII码表

    Unicode不仅能够覆盖所有汉字,还包括全球各地的其他文字,确保了信息在全球范围内的准确传递和交流。在现代信息技术领域,Unicode已经成为处理多语言文本的首选编码标准,无论是网页开发、数据库管理还是软件编程,...

    常用汉字的Unicode码表

    这是常用汉字的Unicode码表,和传智播客视频中的一致,谢谢大家分享

    UNICODE GBK双向码表二进制文件

    GBK编码,又称为GB2312-80的扩展,是中国大陆广泛使用的汉字编码标准,它是基于ISO-8859-1(西文字符)的基础上扩展的,主要针对简体中文,包括了大部分的汉字和一些非汉字符。GBK使用2个字节来表示一个字符,最多...

    常用汉字的unicode编码

    ### 常用汉字的Unicode编码 #### 一、引言 在计算机科学与信息技术领域,字符编码是一项至关重要的技术,它确保了不同系统间文本数据的正确传输和显示。Unicode作为国际上广泛采用的一种字符编码标准,为每种语言...

    GB和UNICODE互换码表+查找函数

    总之,"GB和UNICODE互换码表+查找函数"是针对中文字符编码转换的重要工具,对于理解和处理中文字符在不同系统间的兼容性问题非常有用。理解和掌握这部分知识对于进行跨平台的文本处理工作至关重要。

    unicode与GB18030(GB2312,GBK) 转换码表

    本主题主要关注四种常见的字符编码标准:Unicode、GB18030、GB2312以及GBK,它们在中国汉字编码领域扮演着关键角色。 首先,Unicode是一个全球通用的字符集,它为世界上几乎所有的文字系统提供了唯一的数字表示,...

    Unicode汉字编码对照.7z

    3. **《Unicode汉字内码表(十进制).txt》**:内码通常指的是计算机内部存储和处理字符时使用的编码,与Unicode编码有所不同。尽管Unicode是国际标准,但不同的操作系统和编程环境可能会使用不同的内码实现。此文件...

    C语言GBK、Unicode与UTF8互转代码,含转码表及接口函数

    3. **UTF-8编码**:UTF-8是Unicode的一个变种,是一种可变长度的编码方式,它使用1到4个字节来表示一个Unicode字符。对于ASCII字符(拉丁字母等),UTF-8与ASCII编码相同,这使得它在兼容性方面具有优势。 在C语言...

    计算机汉字内码表汉字内码表

    在实际应用中,常见的汉字内码有GBK、BIG5、Unicode等,其中Unicode是一种国际通用的字符编码标准,包括了全世界大部分语言的文字,它采用16位或32位编码,能够覆盖更广泛的字符集,包括简体和繁体汉字。 汉字内码...

    unicode码表大全

    完整的Unicode码表 包括汉字、英文、藏文、泰米尔、日韩等各国语言编码。

Global site tag (gtag.js) - Google Analytics