中文区位码、国标码、机内码、输入码（外码）、字形码等 -

lxz891117

浏览: 34032 次
性别:

最近访客更多访客>>

不如远行

tuwenwei

FX夜归人

linuxgao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

中文区位码、国标码、机内码、输入码（外码）、字形码等

区位码

为了使每一个汉字有一个全国统一的代码，区位码是国家规定的94*94的一个方阵，其中每行叫做一个区，每列叫做一个位，组合起来就组成了区位码，我们可以在相关网站查询某个汉字的区位码，例如汉字“我”的区位码是46 50 ，标识“我”在46区，50位。

国标码

区位码+2020H。

国标码并不等于区位码，它是由区位码稍作转换得到。其转换方法为：先将十进制区码和位码转换为十六进制的区码和位码，;这样就得了一个与国标码有一个相对位置差的代码，;再将这个代码的第一个字节和第二个字节分别加上20H，就得到国标码。如：“保”字的区位码1703D，国标码为3123H，它是经过下面的转换得到的：1703D－>1103H->+2020H－>3123H。

机内码

国标码+8080H。

输入码（外码）

输入码就是使用英文键盘输入汉字时的编码。目前，我国已推出的输入码有数百种，但用户使用较多的约为十几种，按输入码编码的主要依据，大体可分为顺序码、音码、形码、音形码四类，如“保”?字，用全拼，输入码为码为“BAO”，用区位码，输入码为“1703”，用五笔字型则为“WKS”。

字形码

字形码，点阵代码的一种。为了将汉字在显示器或打印机上输出，把汉字按图形符号设计成点阵图，就得到了相应的点阵代码（字形码）。
用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小，可以计算出存储一个汉字所需占用的字节空间。
例：用16×16点阵表示一个汉字，就是将每个汉字用16行，每行16个点表示，一个点需要1位二进制代码，16个点需用16位二进制代码（即2个字节），共16行，所以需要16行×2字节/行=32字节，即16×16点阵表示一个汉字，字形码需用32字节。
即：字节数=点阵行数×（点阵列数/8）

用于打印的字库叫打印字库，其中的汉字比显示字库多，而且工作时也不像显示字库需调入内存。

为什么不用区位码直接表示国标码，为要加上2020H？

20H就是32D。

区位码是中国定义的94乘以94的一个表。一个字节只用低七位的话有127中状态。英文中0到32的字符都是些控制字符，第127位是del字符，即删除字符，所以总共有34个控制字符。（从0到127）128减去（从0到32是33加上第127位的那一个字符共34）34等于94。所以可供中文使用的是94个状态。
国标码其实就是交换码，是中国用来交换的，当然交换码是不能引起歧义的，94行94列的一个编码再加上32就是行号从33到126列号也是从33到126。这样就与0~32的英文控制字符没有冲突了。

机内码为什么要在国标码的基础上加上8080H，而不是直接只用国标码作为机内码？

因为在英文中只有26个字母，所以用一个字节就可以表示了，用一个字节的话可以表示2^8个符号，就是256个符号，绰绰有余啊，于是外国人制订了规范，规定0-127（00000000-01111111）个字符他们用了，用来表示英文字符和一些符号，就是ASCII码，但是汉字有很多，256个根本就不够，于是国家就用两个ASCII来表示一个汉字，就是2个字节标识一个汉字，例如“保”的区位码为：1703，所以国标码为：1703的10进制+2020H=3123H，然而：31H 和23H在ASCII中式有值的，31H在ASCII中表示数字1，23H表示的是“#”（这个可以在网上查询），那么如果我以国标码作为机内码的话，如果内存中有两个字节为31H和23H，那么到底是表示汉字“保”呢？还是字符1#呢？这样就有了歧义，但是解决办法就有了，0-127不是被英文字符占了吗？那么我就用127之后的来表示不就可以了吗？于是我把汉字的两个字节每个字节机上128（16进制就是80H），于是问题解决了，汉字“保”的机内码变为：3123H+8080H=B2A3H(10进制就是45475)，打开记事本按住alt+45475看看是不是“保”，这样就不会和英文的ASCII冲突了。

分享到：

MessageDigest、DigestInputStream、Dige ... | Java中unicode增补字符（辅助平面）相关用 ...

2016-05-10 11:06
浏览 652
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

中文区位码、国标码、机内码、输入码（外码）、字形码等

区位码

国标码

机内码

输入码（外码）

字形码

为什么不用区位码直接表示国标码，为要加上2020H？

机内码为什么要在国标码的基础上加上8080H，而不是直接只用国标码作为机内码？

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

中文区位码、国标码、机内码、输入码（外码）、字形码等

区位码

国标码

机内码

输入码（外码）

字形码

为什么不用区位码直接表示国标码，为要加上2020H？

机内码为什么要在国标码的基础上加上8080H，而不是直接只用国标码作为机内码？

评论

发表评论

相关推荐

最近访客更多访客>>