Java与IEEE754浅浅谈
作者:大飞
- 怎么用二进制来表示小数呢?
假设我们要用二进制来表示小数5.5,怎么搞?
按照常规思路,首先用二进制表示一下5,是101,那5.5岂不就是101.101(呵呵哒...)。
我们来看下分解过程,5=4+1,也就是1*22 + 0*21 + 1*20,即101。按照这个思路,0.101这个二进制表示的是1*2-1 + 0*2-2 + 1*2-3,也就是0.625。
所以,5.5表示成二进制就可以是101.1(并不是101.101)。
再明确下这个规则:
1···11.11···1 (中间的点表示小数点)
1*2k + ··· + 1*21 + 1*20 + . + 1*2-1 + 1*2-2 + 1*2-k
这种表示法也叫作定点表示法。
然而,我们也会发现定点表示法的一些问题:
首先,我们用定点表示法表示下0.1这个十进制小数试试看,
0.1 = 0*2-1 + 0*2-2 + 0*2-3 + 1*2-4 (0.0625) + 1*2-5 (0.03125) + 0*2-6 + 0*2-7 + 1*2-8 (0.00390625) + 0*2-9(0.001953125) + ... fuck!!!!
有编码长度限制的话,这种表示方式无法精确的表示0.1,只能随着编码长度的增加而越来越近似。
其次,这种表示方法没办法有效的表示很大的数,比如5 * 2100这个数(二进制表示的话,后面100个0怎么表示,就算双精度的话也才64个bit)。
- IEEE浮点表示法。
上面我们看了定点表示法,也大概了解了定点表示法存在的问题:1.不精确。2.无法有效表示大数。
这一节来看一下IEEE浮点表示法,这种表示法也是系统中普遍采用的表示小数的方式。
先看一下浮点表示标准形式: V = (-1)s×M×2E (可以当成一个公式来记!)
那具体怎么表示呢?假设是32位的话(比如Java的float、单精度),格式如下:
s e f
1 - 11111111 - 11111111111111111111111
s:1bit e:8bit f:23bit
64位的话(比如Java的double、双精度),格式如下:
s e f
1 - 11111111111 - 1111111111111111111111111111111111111111111111111111
s:1bit e:11bit f:52bit
知道了格式和公式,两者怎么对应起来呢?
根据格式中e值的不同,编码会分为三种情况:
1.规格化的值:
当e中所有bit的值既不全是0,又不全是1,这种情况就属于规格化的值。
规格化的值下
M=1+f,f是f所包含的bit组成的二进制小数。
E=e-Bias,e是e包含的bit组成的无符号数;Bias=2k-1-1,k是e的bit个数,比如32位下,k=8,64位下,k=11。
2.非规格化的值:
当e中所有bit的值全是0,这种情况就属于非规格化的值。
非规格化的值下
M=f,f是f所包含的bit组成的二进制小数。
E=1-Bias,Bias=2k-1-1,k是e的bit个数,比如32位下,k=8,64位下,k=11。
3.特殊值:
当e中所有bit的值全是1,f中所有bit的值全是0,表示无穷大。
当e中所有bit的值全是1,f中所有bit的值不全是0,表示NaN(Not a Number)。
可见,IEEE浮点表示方式,虽然解决了表示大数的问题(通过公式能看出可以表示M×2E这种形式的数),但还是没有解决精确问题。
- Java中怎么表示浮点数。
Java中提供了long和double来表示单精度浮点和双精度浮点的基本类型,就是按照IEEE754规范来的。也提供了对应的包装类。
我们按照上面的IEEE规则来看一下,就看看5.5这个数。
首先我们用单精度来表示5.5这个数:
float f = 5.5f;然后我们需要得到这个数二进制的格式,也就是上面IEEE格式,Float包装类中提供了floatToIntBits进行支持。
int intBits = Float.floatToIntBits(f);最后我们需要将这个intBits以二进制的形式打印出来看看。
System.out.println(Integer.toBinaryString(intBits));输出如下:
1000000101100000000000000000000
注意这里的打印结果会将bit位中前面的0省略(把符号位给省略了),我们补上0,然后调整成IEEE格式。
0 10000001 01100000000000000000000
注意到,这符合上面提到的规格化的值,套用一下规则:
s = 0
M=1+f,M=1.375
E=e-Bias,e=129,Bias=28-1-1=127,所以E=2
V = (-1)s×M×2E = (-1)0×1.375×22 = 1×1.375×4 = 5.5
结果就是5.5 对上了!!!
public static void main(String[] args) { int intBits1 = 0x7f800000;// 0 11111111 00000000000000000000000 float f1 = Float.intBitsToFloat(intBits1); int intBits2 = 0xff800000;// 1 11111111 00000000000000000000000 float f2 = Float.intBitsToFloat(intBits2); System.out.println("f1="+f1+",f2="+f2); int intBits3 = 0xff800001;// 1 11111111 00000000000000000000001 float nan = Float.intBitsToFloat(intBits3); System.out.println("nan="+nan); }输出如下:
f1=Infinity,f2=-Infinity nan=NaN
OK!可以自己多写几种例子来加深下印象。
如果之前不了解这部分的话,可以对Java中float和double的内存布局有一点点的直观认识了。
相关推荐
**IEEE754标准详解与LabVIEW实现** IEEE754是计算机科学中用于表示浮点数的标准,由国际电气和电子工程师协会(IEEE)于1985年制定,并在后续版本中进行了更新。这一标准对浮点数的存储格式、精度、运算规则以及...
### Java实现IEEE 754 Float类型数据解析 在计算机科学领域中,浮点数的表示方式至关重要,尤其是在处理科学计算、图形渲染等对精度有较高要求的应用场景中。IEEE 754标准定义了一种广泛使用的浮点数表示方法,它被...
本文将围绕“浮点数与IEEE754的转换”这一主题进行深入探讨,旨在帮助读者理解浮点数的基本概念、IEEE754标准以及如何在实际编程中实现浮点数与IEEE754格式之间的转换。 ### 浮点数基本概念 浮点数是一种用于表示...
[Java]IEEE754浮点数的转换方法,方法都写好了,直接复制过去就可以用了,就这么简单!
IEEE754标准 32位 包括了 16进制转浮点数 ,浮点数转4字节8个16进制
** IEEE754浮点数与十进制数互相转换原理 ** 在计算机科学中,IEEE754标准是用于表示浮点数的一种国际标准,它定义了浮点数的存储格式,使得不同计算机系统之间可以一致地表示和交换浮点数值。这个标准广泛应用于...
提供的C代码"Float_To_IEEE754"和"IEEE754_To_Float"应该包含了这些转换过程的实现。通过详细注释,用户可以理解每一步的具体操作,并能方便地将其移植到其他环境中。在VC6.0环境下可以直接运行,这对于学习和理解...
IEEE 754浮点数标准是计算机中表示浮点数的一种标准,最初由美国电气和电子工程师协会(IEEE)在1985年发布,并且成为了国际上广泛采纳的浮点数计算标准。该标准定义了浮点数的二进制表示、运算规则、异常处理以及舍...
**IEEE754浮点数乘法设计** 在计算机科学中,IEEE754标准是用于表示浮点数的一种广泛采用的格式,旨在确保不同计算机系统间的兼容性和精确度。这个标准定义了浮点数的存储布局、表示方法以及相关的运算,包括加法、...
本文将深入探讨浮点数与IEEE754格式之间的转换,以及如何使用C/C++语言进行这些转换。 首先,浮点数在计算机内部通常以IEEE7554格式存储。这种格式包括三个主要部分:符号位、指数部分和尾数(也称为小数部分)。...
通过上述内容的学习,我们了解到在C#中如何实现IEEE754浮点数的转换,这不仅有助于深入理解浮点数的内部表示机制,还能够在实际项目中高效地处理与浮点数相关的数据。无论是通过.NET框架提供的工具类还是自行编写...
C#版的IEEE754进制转换工具就是基于这一标准,提供了一种方便的方式来在不同的进制系统之间转换浮点数。 单精度浮点数(float)按照IEEE 754标准,占用32位二进制,其中包括1位符号位、8位指数位和23位尾数位。而双...
IEEE754标准是计算机科学领域中用于表示浮点数的一种广泛采用的国际标准,由电气和电子工程师协会(IEEE)制定。这个标准为单精度和双精度浮点数提供了统一的编码方式,使得不同计算机系统之间能够准确无误地交换...
IEEE754标准是一种广泛使用的浮点数表示方法,而32位IBM格式则是另一种历史上常用的浮点数表示方法。两者在数据结构和表示范围方面存在显著差异,理解这些差异有助于我们实现两者之间的转换。 首先,IEEE 754 32位...
IEEE 754 是一种广泛应用于计算机科学中的浮点数表示标准,由电气和电子工程师协会(IEEE)制定。它定义了如何在二进制系统中存储和操作浮点数,包括单精度(32位)和双精度(64位)格式。双精度浮点型是IEEE 754...
IEEE754 浮点数计算器 。。。。。。。。。。。。。。。。。。。。。。。
IEEE 754-2008 标准是关于计算机编程环境中二进制和十进制浮点数及其运算的格式与方法的规定。该标准详细地定义了如何处理浮点数,包括其格式、运算规则、异常处理等方面,从而确保了在不同的硬件和软件平台之间,...
IEEE二进制浮点数算术标准(IEEE 754)是1980年代以来最广泛使用的浮点数运算标准,为许多CPU与浮点运算器所采用。这个标准定义了表示浮点数的格式(包括负零-0)与反常值(denormal number)),一些特殊数值(无穷...
单精度ieee754浮点数和十进制数的双向转换程序。本人就读中北大学,毕业了,算是对母校的一点留恋。 QQ 30682981 Email:zhanmail@foxmail.com
十进制浮点数转IEEE754浮点数,利用C语言中的union