`
xpp02
  • 浏览: 1049255 次
社区版块
存档分类
最新评论

浮点数的存储

 
阅读更多
■ 现实生活中的小数
数学中的小数,又称为实数。一般用十进制表示

例如: 3.14159265


■ 科学计算法
数学中的科学计算法许多种表示法

3.14159265 = 0.314159265 × 101


■ 计算机中浮点数的表示

在计算机中的使用科学计数法是一种“规格化计数法”。

● 规格化计数法
用科学计数法表示实数时,如果最左边的第一个数字不是0,则被称为“规格化计数法”
0.1 × 10-2 不是规格化计数法
1.0 × 10-3 则是规格化计数法


● IEEE 754 标准
IEEE 754 标准成立于1985年,80年代起所有的计算机系统均支持IEEE 754
IEEE 754 对浮点数在计算机表示方法有三个主要的规定:


对于单精度(single precision):单精度浮点数位长:32位

(1) IEEE 754 标准规定:第1位为符号位,1 代表负,0代表正
(2) 接下来用8位来表示指数部分。
(3) 接下来的23位用来表示有效数位

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
- --------------- ---------------------------------------------
S 指数(8位) 有效数位 (23 位)


★ IEEE 754 考虑到利用现有的整数比较指充,对浮点数能进行快速的比较和排序,由于指数部分大小能快速反应出浮点数的大小,所以,在符号位接下来的8位用来表示指数,有效数位的大小反应出浮点数的精度。安排在最后的23位

★ 对于规格化二进制浮点示法而言,有效数位的第1位必定是1而不是0,因此,IEEE 754 规定:实际有效数位中的第1位被省去,因而,有效数位中默计含有1位。

★ 移码:除了将指数安排在有效数位前面,还不足以快速比较两个浮点数的大小,例如:

1.0 × 2 -1 在计算机中表示为:0 11111111 00000000000000000000000
这个数相当于整数的 0x7F800000

1.0 × 2 1 在计算机中表示为:0 00000001 00000000000000000000000
这个数相当于整数的 0x00800000

如果用整数比较指令,比较两个数,1.0 × 2 -1 竟然比 1.0 × 2 1 还大!

为了解决这个问题,IEEE 754 设计了一个方案:将指数加上一个常数 127
这个常数 127 被称为“移码”(biased notation)

我们再来看一看:
1.0 × 2 -1 将指数: -1 + 127 = 126 后,得出以下的二进制数:
0 01111110 00000000000000000000 也就是: 0x3F000000

1.0 × 2 1 将指数:1 + 127 = 128 后,得出以下的二进制数:
0 10000000 00000000000000000000 也就是:0x40000000

这样的话,就可以得出正确结果了。



对于双精度(double precision)浮点数来说:位长64 位
(1)IEEE 754 标准规定:第1位为符号位,1 代表负,0代表正。
(2)接下来用11位来表示指数部分。
(3)接下来的52位用来表示有效数位。

★ 双精度浮点数用52位来表示有效数位,11位表示指数位,这样提高浮点数的精度,也还提高了浮点数的取值范围。

★ 双精度的移码为 1023



例子:
1、将 -0.625 转化为计算机中的二进制数浮点数
解:
-0.625 = -5/8 = -5/23 = -101 × 2-3 = -1.01 × 2-1

符号位:1
指数位:-1 + 127 = 126
有效数位:1.01(在机器中要相应去掉默认位)

所以,在机器表示的二进制序列为:1 01111110 0100000000000000000000
相当于整数:0xBF200000


2、将如下二进制序列用十进制浮点数表示。
11000000101000000000000000000000

解:
符号位:1 是负数
指数位;10000001 = 129, 这个数要减去移码值,即:129 – 127 = 2
有效数位:01000000000000000000000 这个数要加上默认1,即得:1.01

整个序列结果为:- 1.01 × 22 = -101 = -5.0


下面的例子是按照二进制格式化输出整型、字符型以及单精度和双精度浮点型的例子:


  1. #include<stdio.h>
  2. /*
  3. *
  4. *fun1(char);
  5. fun2(int)
  6. fun3(float);
  7. fun4(double);
  8. *
  9. *
  10. *
  11. **/
  12. voidfun4(doublen)
  13. {
  14. inti;
  15. unsignedj=0;
  16. char*p=(char*)&n;
  17. putchar(10);
  18. printf("doublen:%lf\n",n);
  19. for(i=7;i>=0;i--)
  20. {
  21. for(j=0x80;j!=0;j>>=1)
  22. {
  23. if(*(p+i)&j)
  24. {
  25. putchar('1');
  26. }
  27. else{
  28. putchar('0');
  29. }
  30. if(i==7&&j==0x80||i==6&&j==0x10)
  31. {
  32. putchar('');
  33. }
  34. }
  35. }
  36. putchar(10);
  37. }
  38. voidfun3(floatn)
  39. {
  40. char*q=(char*)&n;
  41. inti;
  42. unsignedintj=0;
  43. putchar(10);
  44. printf("floatn:%f\n",n);
  45. for(i=3;i>=0;i--)
  46. {
  47. for(j=0x80;j!=0;j>>=1)
  48. {
  49. if(*(q+i)&j)
  50. {
  51. putchar('1');
  52. }
  53. else
  54. {
  55. putchar('0');
  56. }
  57. if(i==3&&j==0x80||i==2&&j==0x80)
  58. {
  59. putchar('');
  60. }
  61. }
  62. }
  63. putchar(10);
  64. }
  65. voidfun2(intn)
  66. {
  67. unsignedintj=0x80000000;
  68. putchar(10);
  69. printf("intn:%d\n",n);
  70. while(j!=0)
  71. {
  72. if(n&j)
  73. {
  74. putchar('1');
  75. }
  76. else
  77. {
  78. putchar('0');
  79. }
  80. if(j==0x80000000||j==0x00800000)
  81. {
  82. putchar('');
  83. }
  84. j>>=1;
  85. }
  86. putchar(10);
  87. }
  88. voidfun1(charn)
  89. {
  90. chari=0;
  91. unsignedcharj=0x80;
  92. putchar(10);
  93. printf("charn:%d\n",n);
  94. while(i<8)
  95. {
  96. if(n&j)
  97. {
  98. putchar('1');
  99. }
  100. else
  101. {
  102. putchar('0');
  103. }
  104. j>>=1;
  105. i++;
  106. }
  107. putchar(10);
  108. }
  109. intmain(void)
  110. {
  111. floatx1=4.25;
  112. floatx2=-4.25;
  113. doubley1=4.25;
  114. doubley2=-4.25;
  115. intz1=5;
  116. intz2=-5;
  117. charw1=13;
  118. charw2=-13;
  119. fun2(z1);
  120. fun2(z2);
  121. fun1(w1);
  122. fun1(w2);
  123. fun3(x1);
  124. fun3(x2);
  125. fun4(y1);
  126. fun4(y2);
  127. putchar(10);
  128. return0;
  129. }


执行结果:

分享到:
评论

相关推荐

    C语言中浮点数存储异常的研究与实践.pdf

    C语言中浮点数存储异常的研究与实践 本文主要讨论了C语言中浮点数存储异常的问题,通过对浮点数存储方式的分析,指出了浮点数在C语言编程过程中出现的不足,并采取了3种方法巧妙地进行弥补和解决,对C语言学习者有...

    关于C语言浮点数的存储

    总之,C语言中的浮点数存储和比较涉及到了计算机科学的基础原理和编程实践,理解并掌握这些知识,将有助于我们编写更加健壮和精确的代码。通过深入学习和实践,我们可以更好地应对浮点数带来的各种挑战。

    IEEE754浮点数存储.pdf

    标题中的“IEEE754浮点数存储”指的是在计算机科学中用于表示和存储浮点数的国际标准,由IEEE(电气和电子工程师协会)制定。这个标准详细规定了单精度(single-precision)和双精度(double-precision)浮点数的二...

    用浮点数存储方式表示整数数值

    用浮点数存储方式表示整数数值,用十六进制表示浮点数

    浮点数在计算机内存中的存储格式

    浮点数在计算机内存中的存储格式 浮点数在计算机内存中的存储格式对浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储。...符号位、指数位和尾数部分都是浮点数存储的必要组成部分。

    西门子STEP7中32位浮点数转换

    与32位浮点数类似,将一个实数转换为64位浮点数存储形式,也需要将指数部分减去偏移量1023,然后转换小数部分为52位二进制小数。 在实际应用中,用户可能需要将一个32位浮点数转换为64位浮点数,或者反过来进行。这...

    浮点数存储格式

    ### 浮点数存储格式详解 #### 一、引言 在编程中,尤其是在C语言这类广泛使用的编程语言中,浮点数是非常重要的数据类型之一。它们被用来表示那些具有小数部分的数字,这对于科学计算、金融计算以及其他需要高精度...

    浮点数在计算机中的存储方式

    #### 单精度浮点数存储格式 单精度浮点数(`float`)采用32位存储,具体分布如下: - **符号位**(1位):最高位。 - **指数位**(8位):次高位,采用偏移量127的补码存储方式。 - **尾数部分**(23位):剩余位...

    浮点数与16进制转换(含源代码)_单片机_浮点数_转换_十六进制_实数_

    1. **浮点数的表示**:浮点数在计算机内部通常按照IEEE 754标准存储,分为单精度(32位)和双精度(64位)两种格式。单精度浮点数由1位符号位、8位指数位和23位尾数组成;双精度则有1位符号位、11位指数位和52位尾数...

    关于浮点数的精度问题

    IEEE754 的浮点数存储格式对浮点数的表示方法进行了规定。浮点数可以分为三部分:符号位、指数位和尾数位。符号位用于表示浮点数的正负号,指数位用于表示浮点数的指数,尾数位用于表示浮点数的小数部分。 在 IEEE...

    浮点数的存储 我的一些心得

    从给定的文件信息中,我们可以提炼出关于浮点数存储的关键知识点,特别是单精度浮点数(通常称为float)的存储方式。以下是对标题、描述以及部分内容中提及的知识点的详细阐述: ### 浮点数存储原理 浮点数在...

    浮点数在内存中的存储格式.rar

    然而,浮点数在内存中的存储方式并非直观,而是遵循一套标准的规则,这就是我们常说的浮点数存储格式。这里我们将深入探讨这一主题。 首先,我们需要了解的是IEEE 754标准。这是国际电工委员会(IEEE)制定的一套...

    关于浮点数的存储格式的问题

    ### 浮点数存储格式详解 #### 一、引言 在计算机科学领域,浮点数的存储格式是一项至关重要的技术。随着计算机系统的不断发展和完善,浮点数的表示方法也经历了多次变革。其中,最广为人知的标准莫过于IEEE 754...

    汇编实现浮点数相乘

    `fstp`不仅将栈顶的浮点数存储到指定地址,还会弹出栈顶的浮点数,清理FPU的栈。 在实际编写代码时,还需要考虑以下几点: - **精度问题**:IA-32的FPU支持单精度(32位)和双精度(64位)浮点运算。选择哪种精度...

    QT/C++实现:四字节十六进制与浮点数相互转化——三种方法(亲自验证源码)

    本文将详细探讨如何实现四字节十六进制字符串与浮点数之间的相互转换,涵盖直接方法、强制类型转换法以及使用union和struct的方法。这三种方法都已通过实际验证,确保其正确性和有效性。 首先,我们来看直接方法。...

    C语言中浮点数精度问题分析.pdf

    在编程实践中,理解浮点数存储格式和C语言的运算规则对于编写准确可靠的程序至关重要。当涉及到需要高精度的浮点计算时,程序员应特别注意数据类型的转换,并使用适当的方法来确保精度。此外,了解IEEE754标准和...

    C语言浮点数运算

    - **9.87654321 &gt; 9.87654322不成立**:这是由于浮点数存储机制的原因,两个数在二进制表示下可能非常接近,以至于比较时出现了误差。 - **10.2 - 9的结果不是1.2而是1.1999998**:同样,这是因为10.2和9在二进制...

    S7-200PLC双精度浮点数转换为整形.pdf

    2. 双精度浮点数与PLC的数据处理能力:流量仪表等智能设备通常使用双精度浮点数存储数据,但由于S7-200 PLC只能处理单精度浮点数,因此无法直接使用这些双精度仪表数据,这限制了PLC进一步的数据处理及应用。...

    IEEE 和 IBM float介绍及转换

    IEEE 浮点数存储格式是计算机系统中最为常见的浮点数表示方法之一。IEEE 在 1985 年制定了 IEEE 754 二进制浮点运算规范,该规范定义了浮点数的存储格式和运算规则。IEEE 浮点数是计算机系统中最为广泛使用的浮点数...

    Java浮点数.pdf

    这两种类型在计算机内部的存储方式遵循IEEE 754浮点数表示标准,这是一种高效且广泛使用的浮点数存储格式。 1. float类型的存储结构 浮点数由三部分组成:符号位(1位)、指数部分(8位)和尾数部分(23位)。符号...

Global site tag (gtag.js) - Google Analytics