`

汉字信息的编码知识

 
阅读更多

1、区位码:GB2312-80字符集,组成一个94*94的矩阵。每一行称为一个“区”,每一列称为一个“位”。一个汉字的区号和位号合在一起构成“区位码”, 区位码的编码范围是:0101~9494

2、国标码国标码=(区位码的十六进制表示)+2020H国标码的取值范围:2121H~7E7EH

3、机内码中文或西文信息在计算机系统中的代码表示称为机内码。ASCII码是一种西文机内码,用一个字节表示。汉字机内码用连续两个字节表示,每个字节的最高位是1。

机内码 = 国标码+8080H =(区位码的十六进制表示)+A0A0H

GB2312-80的机内码编码范围为:A1A1H~FEFEH



4、输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码主要分顺序码(无重码)、音码、形码和音形码或形音码四类。

5、字形码:

(1)向量(矢量)法:将汉字分解成笔画,每种笔画使用一段段的直线(向量)近似地表示,这样每个字形都可以变成一连串的向量。

(2)点阵法(字模点阵码):每一个汉字以点阵形式存储在记录介质上,有点的地方为“1”,空白的地方为“0”。

16*16点阵:16*16/8=32字节

24*24点阵:24*24/8=72字节

 

一个汉字字模占用的字节数根据汉字库的汉字大小不同而不同。以HZK16、HZK12点阵字库为例,字模中每一点使用一个二进制位(Bit)表示,如果是1,则说明此处有点,若是0,则说明没有。这样,一个16×16点阵的汉字总共需要16*16/8=32个字节表示,一个12×12点阵的汉字总共需要16*12/8=24个字节表示
字模的表示顺序为:先从左到右,再从上到下,也就是先画左上方的8个点,再是右上方的8个点,然后是第二行左边8个点,右边8个点,依此类推,画满16×16个点。因此,HZK16中汉字在汉字库中具体位置的计算公式为:(94*(qh-1)+(wh-1))*32; HZK12中汉字在汉字库中具体位置的计算公式为:(94*(qh-1)+(wh-1))*24
汉字“房”的机内码为十六进制的“B7BF”,其中“B7”表示区码,“BF”表示位码。所以“房”的区位码为0xB7BF-0xA0A0=0x171F。将区码和位码分别转换为十进制得汉字“房”的区位码为“2331”,即“房”的点阵位于第23区的第31个字的位置,相当于在文件HZK16中的位置为第32×[(23-1)×94+(31-1)]=67136B以后的32个字节为“房”的显示点阵;相当于在文件HZK12中的位置为第24×[(23-1)×94+(31-1)]=50362B以后的24个字节为“房”的显示点阵

分享到:
评论

相关推荐

    中文编码基础知识介绍

    中文编码是计算机处理中文文本的关键技术,涉及多种字符集和编码方式。本文将详细介绍几种主要的中文编码标准,...理解和掌握这些编码知识对于处理中文信息至关重要,尤其是在软件开发、网页制作、数据库管理等领域。

    最全的unicode 汉字编码表

    ### 最全的Unicode汉字编码表知识点解析 #### Unicode与汉字编码概述 - **Unicode简介**:Unicode是一种国际标准字符编码方案,旨在支持世界上几乎所有语言的文字表示。它通过为每个字符分配一个唯一的数字来实现...

    汉字编码简明对照表

    3. **汉字编码的重要性**: 在信息技术领域,尤其是处理中文信息时,汉字编码至关重要。它不仅影响着数据的存储效率,还关系到数据的安全性以及跨平台兼容性等问题。 #### 二、GB2312-80标准详解 根据提供的部分...

    汉字与unicode编码(十六进制)对照表

    汉字是中文书写系统的核心,是中华文化传承的重要载体。在计算机处理汉字时,就...无论是软件开发、网站设计还是数据处理,掌握这一基础知识都能帮助我们更有效地处理中文信息,推动中文信息在全球范围内的传播和交流。

    汉字编码转换软件(中文转为编码)

    2. GB2312:中国国家标准的简体中文编码,包含了6763个常用汉字,是早期中文操作系统的主要编码方式。 3. GBK:在GB2312的基础上扩展,增加了对繁体字和其他少数民族文字的支持,共包含20902个汉字和图形符号。 4....

    汉字转编码工具.汉字转编码工具.

    以下是关于汉字转编码工具及其相关知识点的详细说明: 1. **编码系统**:汉字的编码方式有很多种,常见的有GB2312(国标简体中文)、GBK(扩展国标)、Big5(繁体中文)、Unicode(万国码)和UTF-8等。这些编码系统...

    汉字unicode编码表

    在计算机科学和信息处理领域中,了解并掌握汉字的Unicode编码对于处理中文文本至关重要。 #### 描述解析:“所有汉字的Unicode编码列表,从4E00-9FCF” 这段描述进一步明确了文档所包含的具体内容——即涵盖了从4E...

    汉字编码表

    ### 汉字编码知识点详解 #### 一、概述 汉字作为中文的主要书写形式,在计算机领域内有着极其重要的地位。为了使计算机能够正确地处理、存储及显示汉字,需要为每一个汉字分配一个唯一的编码。本篇文章将根据提供...

    汉字编码器(exe格式)

    下面将详细探讨汉字编码的相关知识点。 1. **汉字编码的基本概念**: - 汉字编码是为了在计算机中存储和处理汉字而设计的一系列标准。由于计算机只能处理二进制数字,因此需要将汉字转换为数字形式。 - 常见的...

    汉字编码简易转换工具

    总的来说,这款“汉字编码简易转换工具”帮助用户轻松完成汉字与字符之间的转换,理解这些基础知识对于进行中文信息处理、网页开发以及数据交互具有重要意义。无论是对编程初学者还是专业开发者,掌握汉字编码和转义...

    Unicode中文编码对照表

    Unicode中文编码对照表的主要知识点包括: 1. Unicode编码体系:理解Unicode的基本概念,它是如何通过唯一数字来表示所有语言的字符的。 2. UTF-8编码:中文在Unicode中最常见的编码方式,UTF-8是一种变长编码,...

    HZM.rar_汉字 编码_点阵字符_点阵汉字编码

    标题中的“HZM.rar_汉字 编码_点阵字符_点阵汉字编码”提示了我们,这个压缩包文件主要涉及的是汉字编码和点阵字符的相关知识,特别是点阵汉字编码,这是一种在早期计算机和单片机应用中常见的汉字表示方式。...

    中国汉字编码对照表.doc

    中国汉字编码对照表,作为汉字学习、研究和应用的得力助手,承担着桥梁和纽带的角色,将古老而丰富的汉字文化与现代信息技术巧妙地连接在一起。在信息化快速发展的今天,汉字编码对照表的意义更显重要。 汉字编码...

    GBK汉字内码扩展规范编码表

    GBK汉字内码扩展规范编码表,作为中文编码体系中的一员,不仅是一张...对于今天学习和工作中遇到的中文编码问题,GBK编码的知识仍然是不可或缺的,它为我们提供了一个理解中文字符编码体系和解决编码兼容问题的窗口。

    6674个汉字编码表

    ### 汉字编码知识点详解 #### 一、概述 在计算机系统中,为了能够准确地表示和处理各种字符(包括汉字),需要采用特定的编码方式。Unicode是一种国际化的字符编码标准,它为每一个字符分配了一个唯一的数字。本文...

    常见汉字unicode编码

    ### 常见汉字Unicode编码知识点 #### 一、引言 在计算机科学与软件开发领域,字符编码是一项至关重要的技术。随着全球化的推进,如何有效地处理多种语言文本成为了一个重要议题。Unicode作为国际上广泛接受的标准之...

    中文短信编码转换工具

    本文将深入探讨“中文短信编码转换工具”的核心知识点,包括PDU模式、中文编码、Unicode以及短信编码的转换过程。 首先,我们要理解GSM(Global System for Mobile Communications,全球移动通信系统)中的短信服务...

    RouterOS软路由中文编码转换,RouterOS使用中文备注

    本资源提供了一种解决方案,即中文编码转换工具,它能够将中文转换为RouterOS可以识别的编码格式。这样的工具对于那些需要在RouterOS中处理中文信息的用户来说非常实用,例如在中国地区部署网络、设置中文标识或者...

    GB2312简体中文编码表

    ### GB2312简体中文编码表知识点详解 #### 一、GB2312简介 GB2312是中国国家标准局于1980年发布的一种汉字编码标准,全称为《信息交换用汉字编码字符集·基本集》。它是中华人民共和国第一个汉字编码国家标准,...

    中国汉字GB2312编码表

    综上所述,《中国汉字GB2312编码表》作为中国汉字编码的一个里程碑,其在中文信息处理史上的地位不可撼动。它不仅促进了中文计算机技术的发展,更为后续的汉字编码标准提供了坚实的基础。从历史和发展的角度来看,GB...

Global site tag (gtag.js) - Google Analytics