`
hongan
  • 浏览: 175707 次
  • 性别: Icon_minigender_1
  • 来自: 佛山
社区版块
存档分类
最新评论

数据的机内表示;中文编码

J# 
阅读更多

1.定点数与浮点数

计算机处理的数值数据多数带有小数,小数点在计算机中通常有两种表示方法,一种是约定所有数值数据的小数点隐含在某一个固定位置上,称为定点表示法,简称定点数;另一种是小数点位置可以浮动,称为浮点表示法,简称浮点数

(1)定点数(fixed-point)

      

定点小数是纯小数,约定的小数点位置在符号位之后、有效数值部分最高位之前。若数据 x 的形式为 x = x0.x1x2xn ( 其中x0符号位x1xn是数值的有效部分,也称为尾数x1为最高有效位 ),则在计算机中的表示形式为:



 

一般说来,如果最末位 xn = 1,前面各位都为 0 ,则数的绝对值最小,即 |x|min = 2-n 。如果各位均为 1,则数的绝对值最大,即 |x|max =1-2-n 。所以定点小数的表示范围是:

2- n  | x | 1 -  2- n

定点整数是纯整数,约定的小数点位置在有效数值部分最低位之后。若数据 x 的形式为 x = x0 x1x2xn ( 其中x0为符号位,x1xn 是尾数, xn 为最低有效位 ),则在计算机中的表示形式为:



 

定点整数的表示范围是:

1 | x | 2n  -  1

当数据小于定点数能表示的最小值时,计算机将它们作0处理,称为下溢;大于定点数能表示的最大值时,计算机将无法表示,称为上溢,上溢和下溢统称为溢出

计算机采用定点数表示时,对于既有整数又有小数的原始数据,需要设定一个比例因子,数据按其缩小成定点小数或扩大成定点整数再参加运算,运算结果,根据比例因子,还原成实际数值。若比例因子选择不当,往往会使运算结果产生溢出或降低数据的有效精度。

用定点数进行运算处理的计算机被称为定点机   

(2)浮点数(floating-point number)

 

与科学计数法相似,任意一个J进制数N,总可以写成

N = J E × M

式中M称为数 N 尾数(mantissa),是一个纯小数;E 为数 N阶码(exponent),是一个整数,J称为比例因子 J E 底数。这种表示方法相当于数的小数点位置随比例因子的不同而在一定范围内可以自由浮动,所以称为浮点表示法。



 

 

若不对浮点数的表示作出明确规定同一个浮点数的表示就不是唯一的。例如 11.01 也可以表示成 0.011012-30.1101×2-2 等等。为了提高数据的表示精度,当尾数的值不为 0 时,其绝对值应大于等于 0.5,即尾数域的最高有效位应为 1,否则要以修改阶码同时左右移小数点的方法,使其变成这一要求的表示形式,这称为浮点数的规格化表示。

当一个浮点数的尾数为 0 时,不论其阶码为何值,或者当阶码的值遇到比它能表示的最小值还小时,不管其尾数为何值,计算机都把该浮点数看成 0 值,称为机器零

浮点数所表示的范围比定点数大。假设机器中的数由 8 位二进制数表示(包括符号位):在定点机中这 8 位全部用来表示有效数字(包括符号);在浮点机中若阶符、阶码占 3 位,尾符、尾数占 5 位,在此情况下,若只考虑正数值,定点机小数表示的数的范围是 0.0000000 0.1111111,相当于十进制数的 0127128,而浮点机所能表示的数的范围则是 2 - 11×0.0001 211×0.1111,相当于十进制数的 1128 7.5 。显然,都用 8 位,浮点机能表示的数的范围比定点机大得多。

尽管浮点表示能扩大数据的表示范围,但浮点机在运算过程中,仍会出现溢出现象。下面以阶码占 3 位,尾数占 5 (各包括 1 位符号位)为例,来讨论这个问题。图 2-1 给出了相应的规格化浮点数的数值表示范围。



 

图2-1  规格化浮点数分布示意图

图 2-1 中,“可表示的负数区域”和“可表示的正数区域”及“0”,是机器可表示的数据区域;上溢区是数据绝对值太大,机器无法表示的区域;下溢区是数据绝对值太小,机器无法表示的区域。若运算结果落在上溢区,就产生了溢出错误,使得结果不能被正确表示,要停止机器运行,进行溢出处理。若运算结果落在下溢区,也不能正确表示之,机器当 0 处理,称为机器零。

一般来说,增加尾数的位数,将增加可表示区域数据点的密度,从而提高了数据的精度;增加阶码的位数,能增大可表示的数据区域。

2.编码方式

补码:适合参与运算

移码:比较大小

3.中文编码

一个汉字的内码占两个字节。

区位码+2020H=>国际码

国际码+8080H=>机内码

4.奇偶校检

5.海明码

  • 大小: 4.3 KB
  • 大小: 4.3 KB
  • 大小: 4.4 KB
  • 大小: 4.6 KB
分享到:
评论

相关推荐

    【Logisim】汉字编码解码和流水传输实验

    而"GB2312数据编码转换.xlsx"可能包含了关于GB2312汉字编码的数据,我们可以利用这些数据进行编码和解码的实践。 总的来说,这个实验将使我们对汉字编码系统、错误检测与纠正策略以及计算机内部的数据传输方式有更...

    Unicode到GB2321汉字编码

    汉字编码是计算机处理汉字的关键技术,它涉及到如何在二进制的世界中表示和存储中文字符。本主题主要关注Unicode和GB2312这两种编码方式,以及它们之间的转换。 Unicode,全称统一码,是一种国际标准,旨在为全球...

    计算机科学导论\模块2 数据和数的表示

    输入码是用户在键盘上输入汉字时所用的编码,机内码是计算机内部存储和处理汉字时使用的编码,字型码则涉及到汉字的显示和打印,国标码是国家标准规定的汉字编码,用于规范化汉字的表示。 位运算在处理数据时也扮演...

    第1章数据的表示与编码习题与答案[文].pdf

    综上所述,本章内容涉及数制、数字表示、计算机内部数据存储、汉字编码、图像压缩、字符编码以及汉字输入方法等多个核心知识点,这些都是软件开发中必不可少的基础知识。理解和掌握这些内容有助于深入理解计算机系统...

    c系列中文机汉字字库内码表

    文件名"C系列中文机内码表"可能是一个文本文件或数据库文件,包含所有汉字和相关字符的内码信息。开发者可以参考这个文件来实现字符编码与解码的函数,确保在系统中正确处理汉字。 总的来说,"C系列中文机汉字字库...

    C#汉字与机内码互转

    在计算机科学领域,字符编码是处理和存储文本的关键部分,特别是在使用中文汉字的时候。C#是一种广泛用于开发桌面、Web及移动应用的编程语言,它提供了丰富的库和方法来处理汉字与机内码的转换。本文将深入探讨汉字...

    计算机组成原理数字化信息编码PPT课件.pptx

    本节重点讲解计算机内常用的信息编码方案,包括中西文字符编码、逻辑型数据的表示、数值型数据的表示与编码、不同进位数据间的转换、二进制数据算术与逻辑运算规则。 字符编码: 字符是计算机系统中使用最多的信息...

    机内码与汉字转换工具

    1. **机内码查看**:输入汉字,工具会显示该汉字对应的机内码值,帮助用户了解汉字在特定编码下的表示形式。 2. **机内码转换**:输入二进制的机内码,工具可以将其解码为对应的汉字,反之亦然。 3. **编码转换**:...

    批量修改TXT文档编码

    在IT领域,字符编码是一个非常重要的概念,尤其是在处理文本数据时。不同的编码方式会影响文本的显示和处理。本文将深入探讨“批量修改TXT文档编码”的主题,以及如何使用提供的“批量修改编码工具”来实现这一目标...

    易语言编码转换将任何编码转换到GB2312模块源码

    GB2312,全称为“汉字机内码扩展规范”,是1980年代中国制定的一种简体中文字符集,包含6763个常用汉字和符号。它是GBK编码的前身,而GBK又进一步扩展到了20902个字符,包含了更多的汉字和少数民族文字。 易语言...

    计算机的数据与编码(共27张PPT).pptx

    5. 汉字编码: - 输入码(外码):包括区位码、音码(如全拼、简拼、双拼)、形码(如五笔字型)和音形码。 - 国标码(GB2312-80):一级常用汉字3755个,二级汉字3008个,共7445个字法字符,每个汉字用2个字节...

    Delphi源码 - 汉字转16进制编码

    了解并掌握这种汉字转16进制编码的工具,对于在斯凯平台上开发涉及到汉字编码处理的应用程序是非常有价值的,可以帮助开发者更好地理解和处理汉字在不同环境下的编码问题。同时,这也是对Unicode和16进制编码基础...

    编码转换小工具(UTF-8转GB2312)

    GB2312,全称“汉字机内码扩展规范”,是中国大陆早期广泛使用的简体中文编码标准。它使用两个字节来表示一个汉字,但只能表示大约6763个常用汉字,对于繁体字和其他特殊字符则无法支持。在处理中文内容时,尤其是老...

    数据与计算第三课时编码的基本方式.docx

    - 随着计算机在中文环境的应用,汉字编码发展成熟。常见的输入法如微软拼音、智能ABC、紫光输入法和五笔字型等,其中五笔字型是形码输入,而微软拼音、智能ABC属于音码输入。 - 汉字在计算机内部处理时使用的代码...

    数据与计算第三课时编码的基本方式.pdf

    数据与计算的第三课时主要探讨了编码的基本方式,涵盖了字符编码、汉字编码以及图像编码等方面的知识。在字符编码中,特别提到了ASCII码,这是一个7位二进制数的标准,用于表示128个不同的字符,包括128个图形字符和...

    汉字内码查询器汉字内码查询器汉字内码查询器

    GB2312是中国大陆最早的标准汉字编码,它包含了6763个常用汉字。GBK是在GB2312基础上扩展的,支持更多的汉字和符号。Unicode则是一个全球通用的字符集,包含了世界上大部分语言的字符,包括全部的汉字。 汉字内码...

    数据与计算第三课时编码的基本方式(20211113220918).pdf

    数据与计算的第三课时主要探讨了编码的基本方式,涵盖了字符编码、汉字编码、图像编码以及量化采样等核心概念。 一、字符编码 1. ASCII码是美国国家信息交换标准代码,它包括128个图形字符和32个控制字符,共160个...

    计算机基础教材,包括计算机的软硬件基础知识、计算机的工作原理和机内信息编码

    汉字机内码、区位码和国标码则是中文字符的编码方式,字形码则涉及到字符的图形表示。此外,机器数的表示方式决定了数值在计算机中的存储形式,包括原码、反码和补码等。 掌握计算机基础对于理解计算机的工作原理至...

    php网页中utf-8编码转换gb2312实用类

    GB2312,全称为"汉字机内码扩展规范",是中国大陆早期的简体中文编码标准,主要用于存储中文文本。每个汉字在GB2312中占据两个字节,但只能表示6763个常用汉字,不支持繁体字和其他非汉语言文字。 在实际的PHP网页...

Global site tag (gtag.js) - Google Analytics