由于对float或double
的使用不当,可能会出现精度丢失的问题。问题大概情况可以通过如下代码理解:
得到的结果如下:
f=2.0015E7
d=2.0015E7
d2=2.0014999E7
从输出结果可以看出double
可以正确的表示20014999
,而float
没有办法表示20014999
,得到的只是一个近似值。这样的结果很让人讶异。20014999
这么小的数字在float下没办法表示。于是带着这个问
题,做了一次关于float和double学习,做个简单分享,希望有助于大家对java
浮
点数的理解。
关于
java
的
float
和
double
Java
语言支持两种基本的浮点类型: float
和 double
。java
的浮点类型都依据
IEEE 754
标准。IEEE
754
定义了32
位和
64
位双精度两种浮点二进制小数标准。
IEEE
754
用科学记数法以底数为 2
的小数来表示浮点数。32
位浮点数用 1
位表示数字的符号,用 8
位来表示指数,用 23
位来表示尾数,即小数部分。作为有符号整数的指数可以有正负之分。小数部分用二进制(底数
2
)小数来表示。对于64
位双精度浮点数,用
1
位表示数字的符号,用
11
位表示指数,52
位表示尾数。如下两个图来表示:
float(32位):
double(64位):
都是分为三个部分:
(1)
一
个单独的符号位s
直接编码符号s
。
(2)k
位
的幂指数E
,移
码表示
。
(3)n
位
的小数,原码表示
。
那么 20014999
为什么用
float
没有办法正确表示?
结合float和double的表示方法,通过分析
20014999
的二进制表示就可以知道答案了。
以下程序可以得出
20014999
在
double
和
float
下的二进制表示方式。
输出结果如下:
Double:100000101110011000101100111100101110000000000000000000000000000
Float:1001011100110001011001111001100
对于输出结果分析如下。对于都不
double
的二进制左边补上符号位
0
刚好可以得到
64
位的二进制数。根据double的表
示法,分为符号数、幂指数和尾数三个部分如下:
0
10000010111
0011000101100111100101110000000000000000000000000000
对于
float
左边补上符
号位
0
刚好可以得到
32
位的二进制数。
根据float的表示法,
也分为
符号数、幂指数和尾数三个部分如下
:
0
10010111
00110001011001111001100
绿色部分是符号位,红色部分是幂指数,蓝色部分是尾数。
对比可以得出:符号位都是
0
,幂指数为移码表示,两者刚好也相等。唯一不同的是尾数。
在
double
的尾数
为:
001100010110011110010111
0000000000000000000000000000
,省略后面的零,至少需要24位才能正确表示
。
而在
float
下面尾数
为:
00110001011001111001100
,共
23
位。
为什么会这样?原因很明显,因为
float尾数
最多只能表示
23
位,所以
24
位的
001100010110011110010111
在
float
下面经过四舍五入变成了
23
位的
00110001011001111001100
。所以
20014999
在
float
下面变成了
20015000
。
也就是说
20014999
虽然是在float的表示范围之内,但
在
IEEE
754
的
float
表示法精度长度没有办法表示出
20014999
,而只能通过四舍五入得到一个近似值。
总结:
浮点运算很少是精确的,只要是超过精度能表示的范围就会产生误差。往往产生误差不是
因为数的大小,而是因为数的精度。因此,产生的结果接近但不等于想要的结果。尤其在使用
float
和
double
作精确运
算的时候要特别小心。
可以考虑采用一些替代方案来实现。如通过
String
结合
BigDecimal
或
者通过使用
long
类型来转换。
分享到:
相关推荐
虽然 `double` 提供了相对较高的精度,但在涉及精确数学运算(特别是涉及到小数值)时,由于其内部采用二进制浮点数格式存储,仍会出现精度丢失的情况。这种精度丢失的现象对于需要高精度计算的应用来说是一个常见的...
### float与double精度详解 #### 一、浮点数的基础概念 在计算机科学中,`float` 和 `double` 是两种常用的浮点数类型,它们主要用于处理实数运算。这两种类型的区别主要体现在精度和范围上。 #### 二、浮点数的...
当我们使用`atof()`函数将字符串转换为`float`或`double`时,可能会遇到精度损失问题。例如,将字符串"8.2"转换为`float`时,结果为8.1999998,而转换为`double`时,结果为8.1999999999999993。这是因为浮点数在...
"关于浮点数的精度问题" 浮点数精度问题是一个经典的问题,对于了解和学习C语言有一定帮助。浮点数的精度问题是由于计算机对浮点数的存储方式和表示方法所致。 IEEE754 的浮点数存储格式对浮点数的表示方法进行了...
在 C++ 中,浮点数有六种:float(单精度)、unsigned float(单精度无符号)、double(双精度)、unsigned double(双精度无符号)、long double(高双精度)和 unsigned long double(高双精度无符号)。...
解决java数值范围以及float与double精度丢失的问题 Java中的数值范围和浮点数精度问题是许多开发者经常遇到的问题。下面我们将详细探讨Java中的数值范围、float和double类型的精度问题,并且提供解决方案。 一、...
float double 的浮点数类型转换
浮点数是一种可以表示小数的数值类型,分为单精度(Single-precision)和双精度(Double-precision)。单精度浮点数占用32位二进制空间,由1位符号位、8位指数位和23位尾数位组成。双精度浮点数则占据64位,包括1位...
浮点数精度问题在计算机科学中是一个至关重要的概念,尤其对于进行数值计算的开发者来说,理解和掌握浮点数的表示和精度误差至关重要。本文将详细阐述IEEE 754标准,这一标准对浮点数的表示和计算进行了规范,旨在...
float和double是两种常用的浮点数类型,它们的范围和精度是由其内部存储格式决定的。了解float和double的范围和精度对于编程和数据处理非常重要。 1. 范围 float和double的范围是由指数的位数来决定的。float的...
浮点数转化器,单精度浮点计算软件,FLOAT转HEX
Java 中的双精度浮点数(double)类型在进行运算时经常出现精度丢失的问题,这是由于双精度浮点数在计算机内部的存储方式所致。双精度浮点数使用 64 位二进制数来存储小数,然而这种存储方式会导致某些小数无法精确...
在IEEE 754标准中,单精度浮点数(float)使用32位存储,而双精度浮点数(double)则使用64位。这使得双精度浮点数具有更高的精度和更大的数值范围。 1. 双精度浮点数:双精度浮点数使用64位二进制表示,其中第一位...
在实践中,可能需要考虑错误处理,比如当输入的双精度浮点数超出单精度浮点数的表示范围时,转换可能会丢失信息或产生溢出。此外,根据实际应用需求,可能还需要进行性能优化,比如批量转换以提高效率。 7. **示例...
S7-200SMART 64位浮点数转换为32位浮点数指令库文件Double_to_Float
标题中的"Java 精确计算 - double-float-String"指向的是Java中处理浮点数(double和float)以及字符串表示的数值时可能遇到的精度问题,以及如何通过特定方法实现精确计算。描述中提到的链接指向了一个具体的博客...
浮点数在计算机内部是以二进制表示的,这与我们通常使用的十进制系统不同,因此在进行浮点数运算时可能会出现精度丢失的问题。这篇博客主要探讨了Java中浮点数(包括`float`和`double`类型)运算的特性、存在的问题...
本文将详细探讨如何使用Java语言来实现IEEE 754标准中的单精度浮点数(Float)的解析过程。 #### IEEE 754标准简介 IEEE 754标准定义了浮点数的二进制格式以及运算规则。对于单精度浮点数来说,它占用32位(4字节...
本篇文章主要探讨了如何在S7-200 PLC中处理双精度浮点数转换为单精度浮点数的问题,这对于管理智能电表、远传水表等远程抄表系统的数据一致性至关重要。双精度浮点数提供了更高的精度,但在处理能力有限的S7-200 PLC...