`
jy02149522
  • 浏览: 47793 次
  • 性别: Icon_minigender_1
  • 来自: 天津
社区版块
存档分类
最新评论

一 计算机科学基础 1.2 非数值数据的表示

阅读更多

数值文字英文字母等都是字符,任何字符进入计算机时,都必须转换为二进制的形式,称为字符编码。


数字字符编码:三种常见编码为BCD编码(有权码),余3码(无权码),格雷码(无权码)。
BCD编码:用4位二进制数进行表示,0=0000,1=0001,... 9=1001.
余3BCD编码: 在BCD的编码基础上,把每个数的代码加上0011后构成。
格雷码: 规则为相邻的两个代码之间只有一位不同。

 

英文字符编码ASCII码 美国标准信息交换码,采用7位二进制数表示,低四位为行,高三位为列。
以前经常在书本上背 a = 97, A = 65,现在终于明白为什么了,在7位ASCII代码表里,a的位置是1100001
换成10进制就是64+32+1=97,A=1000001=65。

 

文字字符编码:文字处理的过程较为复杂,分别需要分解为输入汉字的存储输出等环节,且每个环节用的编码也不相同,且关键点在于要进行一系列的编码转换,输入环节所对应的是输入码,存储环节对应的是内部码,输出环节对应的是字形码

输入码1.数字编码 2.拼音码 3.字型码
数字编码:
对应于国标区位码6763个两级汉字所对应的编码,区位码分94个区,每个区94位。前两位是区位,后两位是字位,特点是无重码,和内码转换方便,前位后位都是10进制数字表示,但难以记忆。

拼音码:通过汉语拼音进行的编码,重码率高,影响速度。

字型码:通过偏旁部首进行的编码,比较典型的是五笔字形,表形码等

内部码:计算机内部处理,存储,传输汉字用的编码。汉字国标码采用4位16进制表示,由于会引起于个别字符内码于ASCII码冲突,所以将两个字节高位为1,用来作为机内码使用。国标码“3473H”等于机内码“B4F3”。

计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。 汉字交换码(国标码)主要用于汉字信息交换,我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码(高位为0),;所有的国标码汉字及符号组成一个94行94列的二维代码表中。在此方阵中,每一行称为一个"区",每一列称为一个"位"。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个唯一的区位码,没有重码。如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。  国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保”字的国标码为3123H,它是经过下面的转换得到的:1703D->1103H->+20H->3123H。国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”字,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字,还是两个西文字符“1”;和“#”?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,该字的机内码就是B1A3H。

显然,汉字机内码的每个字节都大于128,这就解决了与西文字符的ASCII码冲突的问题。如上所述,汉字输入码、区位码、;国标码与机内码都是汉字的编码形式,它们之间有着千丝万缕的联系,但其间的区别也是不容忽视的。

字形码:字形码是通过点阵及矢量函数表示的。当需要输入汉字时,利用汉字字形检索程序根据汉字的内码从字模库中找到相应的字形码。

待续。。。。。。

分享到:
评论

相关推荐

    大学计算机基础1.2计算机的数制.ppt

    在计算机科学中,数制是数字系统的基础,用于表示数值。本文档主要讲解了计算机中常见的四种数制:二进制、八进制、十进制和十六进制。 首先,数制是一种进位计数制,它遵循特定的基数和进位规则。例如,十进制数有...

    计算机导论csi认识计算机和计算机科学PPT优秀资料.ppt

    - 1.2 计算机科学:涵盖了数据处理、算法设计、软件工程和计算机硬件等多个方面。 - 1.3 机内信息表示基础:介绍了二进制数系统,它是计算机内部表示和处理数据的基础。 举例来说,数字35在不同的数制下有不同的...

    软件设计师考点

    第1章 计算机科学基础知识 1.1 考试大纲 (1)数制及其转换 二进制、八进制、十进制和十六进制等常用数制及其相互转换 (2)计算机内数据的表示 数的表示 非数值表示(字符和汉字的表示、声音表示、图像表示)...

    数据结构第一章答案

    在计算机科学中,关系是一个非常重要的概念,它是数据库和数据挖掘的基础。 1.3 选择题 在这里,我们看到了一些选择题。选择题是考查学生对数据结构的基本概念和定义的理解。这些选择题可以帮助学生巩固对数据结构...

    计算机应用基础教程~第1章计算机概述

    计算机的应用领域包括科学计算、数据处理、自动控制、计算机辅助系统、逻辑关系加工及人工智能、计算机网络等。 计算机的分类有巨型机、大、中型计算机、小型机、微型机等。 计算机的发展历程可以追溯到1822年英国...

    国科大数值分析部分作业解答

    数值分析的应用领域包括物理、工程、金融、计算机科学等。通过学习数值分析,学生能够掌握如何运用计算机和数学技巧来解决科学与工程问题。 需要注意的是,数值分析中涉及的每一种方法都有其适用的条件和限制,分析...

    计算机数学基础答案1-3

    【计算机数学基础】是大专计算机科学教育中必不可少的一部分,它主要涵盖了数学的基础概念,这些概念在计算机科学中有着广泛的应用,比如算法分析、数据结构、编程语言设计等。本部分答案详解涉及到了前三章的内容,...

    数据结构 (C语言版)课件:第一章 绪 论.ppt

    数据结构是计算机科学中至关重要的一个分支,它探讨如何有效地组织和存储数据,以便于高效地执行各种操作。《数据结构 (C语言版)》第一章绪论主要介绍了开设这门课程的原因、它所涵盖的范畴以及一些基本概念。 ...

    计算机科学与技术导论试卷及其答案

    计算机科学与技术是信息技术的基础,本试卷主要涵盖了计算机系统的基础知识,包括计算机组成、性能指标、数据存储、网络通信以及操作系统等方面。以下是根据题目内容详细解释的知识点: 1. **字节表示无符号整数的...

    《大学计算机基础》第1章-计算机基础知识.ppt

    本章重点讲解的是计算机的基础知识,包括计算机硬件的组成、发展历程、数据的表示以及计算机软件系统。 1.1 计算机的发展历程: 计算机的起源可以追溯到17世纪的机械计算器,如Blaise Pascal的加法器和Charles ...

    计算机科学概论 第10版 问题与答案

    **解析**: 缓冲区是计算机科学中的一个重要概念,它被用来暂时存储数据,以便在不同的硬件组件之间协调数据传输。通过使用缓冲区,可以解决数据源和目的地之间的速度不匹配问题,提高整体系统的效率。 ##### 1.4节 ...

    知识单元一 计算机与计算思维.pptx 解释计算机的基础,学习计算机的基础

    - 定义:计算思维是指利用计算机科学的基本概念来解决问题、设计系统和理解人类行为的一系列思维活动。 - 特点:抽象化、自动化、算法化等。 - 应用:在各个领域都有广泛的应用前景。 通过本课程的学习,学生不仅...

    数据结构基础概论PPT学习教案.pptx

    数据结构基础概论是计算机科学中的重要组成部分,主要研究如何高效地存储和处理数据,以适应计算机系统对大规模数据的管理需求。在这个领域,我们关注的是数据的组织方式,而不是它们的具体数值。以下是对该主题的...

    微机原理微型计算机的运算基础与信息表示方法PPT教案.pptx

    微机原理微型计算机的运算基础与信息表示方法是计算机科学中的一门重要课程,本教案涵盖了微机原理微型计算机的运算基础与信息表示方法的知识点。 2.1 进位计数制及其之间的转换 --------------------------- 进位...

    计算机基础知识(20211010174427).pdf

    17. 十进制数与不同进制之间的转换是计算机科学的基础,例如(13)10 转换成八进制为15,(35)10 转换成十六进制为23(1.2 p5)。 18. 计算机存储容量单位:1KB=1024Byte,1MB=1024KB,1GB=1024MB(1.2 p9)。存储...

Global site tag (gtag.js) - Google Analytics