`
thihy
  • 浏览: 69829 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【讨论】为啥0.2+0.4 != 0.6(浮点数计算的精度问题)

阅读更多
网上有很多帖子讨论浮点数的精度问题,其中有如下命题:
  1. 0.2+0.4=0.600 000 000 000 000 1
  2. 0.58*10=5.8,但0.58*100=57.999 999 999 999 990.58*1000=580
 
首先,我们可以肯定的是:浮点数是不能完全表示实数集的(从信息论的角度很容易得出此结论),所以必然存在误差。
而对有误差的数据进行计算,会带来累加误差
 
这里讨论的都是二进制格式的浮点数表示,不包括十进制等其他进制的表示。
 

浮点数表示的误差

 

先简单介绍一下浮点数表示。大家不必自己计算,可以去http://babbage.cs.qc.cuny.edu/IEEE-754/http://babbage.cs.qc.cuny.edu/IEEE-754.old/Decimal.html。后者可以看到实际的值。
 
在IEEE标准中,浮点数用三元组 < 符号位s, 指数e, 有效数字t> 来表示 (-1)s×t×2e
 

整数的表示

 

对于十进制的整数,如果有效数字不太多,则是可以精确表示的。比如100 表示为(-1)0×1.1001×26
 

但是如果有效数字太多,则可能会出问题。比如对于12 345 678 901 234 567 000,即使使用了double(binary64)来表示,结果为1.010 101 101 010 100 101 010 011 000 110 011 101 011 000 111 110 000 1×263,但这个二进制表示其实代表的却是1.234 567 890 123 456 7e19。

 

小数0.6如何表示?

 

对于整数,二进制表示只会丢失有效数字,而不会有其他的编号。然而对于小数,则可能会很麻烦,因为小数的二进制表示可能是无限循环的。

 

比如,对于0.6,的binary64表示:

(0.6)10 = (0.100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 1...)2

            = (1.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001...)2×2-1

 

于是,符号位s=0,指数e为-1,有效数字为1.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001...

 

我们知道,binary64的有效数字最多有53位,也就是说

1.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001... 的黄色部分需要被抛弃。

 

那么我们应该如何抛弃这部分数据呢?在IEEE中规定了若干舍入方法,一般来说,普遍使用的是roundTiesToEven方式来舍入。

 

roundTiesToEven方法:round到相邻的浮点数据上。如果两个浮点数据都一样近,
则round到最后一位是偶数的浮点数据上。

 

由此,0.6~=(-1)0×1.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 1×2-1

 

再试试0.2和0.4

(0.2)10 =(0.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 1...)2

            =(1.100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 1...)2×2-3 。

(0.4)10 =(0.011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 0...)2

            =(1.100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 10...)2×2-2

 

使用roundTiesToEven方式舍入黄色部分后,前面的部分加1。也即

 

0.2 =(1.100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 101 0)2×2-3

0.4 =(1.100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 101 0)2×2-2

 

其实,0.2和0.4的有效位数是一样的,只是指数不同。

 

到现在,我们可以发现。0.2和0.4都是向上取整的,也即浮点数表示的值比实际值是要大那么一丢丢的。

浮点数计算误差

浮点数在计算时也是有误差的。
比如对于0.2+0.4,0.2对应的指数是-3, 0.4对应的指数是-2。IEEE要求结果应该优先使用-3作为指数(也即较小的指数值)

当采用-3作为指数时,0.2和0.4需要表示成

 

0.2 =(  1.100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 101 0)2×2-3

0.4 =(11.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 010   )2×2-3

 

可以看到,小数位后,0.4少了一位,我们需要用0补齐,然后计算加法。得到

 

0.2+0.4=(100.110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 100 111 0×2-3)2

 

规则化

 

0.2+0.4=(1.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 001 110)2×2-1

 

我们又需要舍弃黄色部分了,在这里,由于它离两边是一样近的,于是我们round到最后一位是偶数的浮点数上,于是有

 

0.2+0.4=(1.001 100 110 011 001 100 110 011 001 100 110 011 001 100 110 011 010 0__)2×2-1

 

请注意:这里我们又往上取整了,也即此处的结果是比实际值要大那么一丢丢的。

 

而这个结果到底是多少呢?精确结果是0.600 000 000 000 000 088 817 841 970 012 523 233 890 533 447 265 625

考虑到有效数字,小数点后只保留16位,所以需要舍弃黄色部分,其结果是0.600 000 000 000 000 1=0.600 000 000 000 000 0 + 1E-16。

 

0.2+0.4的最后那个1来自哪里?

  1. 对0.2舍入时,我们偏大了一丢丢。>=1.5 × 2-57
  2. 对0.4舍入时,我们偏大了一丢丢。>=1.5 × 2-56
  3. 对0.2+0.4舍入时,我们偏大了一丢丢。= 1 × 2-54
  4. 在输出时,我们又偏大了一丢丢。
哈,我们连续三次偏大了一丢丢,也是偏大发了,就多出了哪个1来了。总共偏差>=(1.5 + 1.5 × 2 + 1 × 2×2×2) * 2-57 = 1.5625 × 2-54 >8.6e-17。考虑到在输出因为四舍五入,从而会多出最后的那个1。
 

最后的总结

  1. 浮点数表示可能存在Round
  2. 浮点数计算可能存在Round
  3. 结果输出时可能存在Round
这些Round的累加可能会引起有效数字的最后一位偏大或偏小。
题外:对于0.2或0.4,如果采用其他的Round方法,则有可能0.2+0.4=0.6的。而具体采用何种Round,是由语言实现平台决定,或者程序指定的。
8
2
分享到:
评论
10 楼 thihy 2013-05-15  
jellyfish 写道

    浮点数表示可能存在Round
    浮点数计算可能存在Round
    结果输出时可能存在Round


The error bound is Math.ulp(), assuming operations are +/-/*//. So we are safe most of the time.

However, when dealing with Math.exp(), we are in big trouble for large numbers.


哈,刚发现Math下面还有这个方法 ,3ks。
9 楼 thihy 2013-05-15  
justjavac 写道
chenjinbo1983 写道
用BigDecimal不就可以了

BigDecimal确实可以精确表示数,但是在计算数时,也无能为力。所以,还是有必要了解一下IEEE754,昨天把那个工具汉化了一下,http://justjavac.com/tools/ieee-754-floating-point-conversion-from-floating-point-to-hexadecimal.html

赞。但是原来的页面有一个不好的地方,“有效数字”的部分的Input有些短,总看不到后面的部分。要是能长一些就好了。
8 楼 justjavac 2013-05-15  
chenjinbo1983 写道
用BigDecimal不就可以了

BigDecimal确实可以精确表示数,但是在计算数时,也无能为力。所以,还是有必要了解一下IEEE754,昨天把那个工具汉化了一下,http://justjavac.com/tools/ieee-754-floating-point-conversion-from-floating-point-to-hexadecimal.html
7 楼 justjavac 2013-05-15  
thihy 写道
chenjinbo1983 写道
用BigDecimal不就可以了

实际使用时,如果对结果要求不是完整精确的,没有必要使用BigDecimal。而对于某些无理数,BigDecimal也无济于事。

这里主要是指明浮点数存在误差,所以在对浮点数进行操作时,要小心。不要潜意识地认为它是“精确的”。

对。BigDecimal不是终极解决办法,否则就没有必要使用浮点数了。BigDecimal是用定点数表示数字,所以,在范围是是有限的。
6 楼 jellyfish 2013-05-14  

    浮点数表示可能存在Round
    浮点数计算可能存在Round
    结果输出时可能存在Round


The error bound is Math.ulp(), assuming operations are +/-/*//. So we are safe most of the time.

However, when dealing with Math.exp(), we are in big trouble for large numbers.
5 楼 thihy 2013-05-14  
chenjinbo1983 写道
用BigDecimal不就可以了

实际使用时,如果对结果要求不是完整精确的,没有必要使用BigDecimal。而对于某些无理数,BigDecimal也无济于事。

这里主要是指明浮点数存在误差,所以在对浮点数进行操作时,要小心。不要潜意识地认为它是“精确的”。
4 楼 chenjinbo1983 2013-05-14  
用BigDecimal不就可以了
3 楼 thihy 2013-05-13  
justjavac 写道
提点建议,<符号位s, 指数e, 有效数字t> 这行字加粗了。

我觉得,应该把文章中有用的,或者知识点加粗。那么长的010101串,最好按4位或者8位分隔开,这样容易看。

对于大串的0101,你在后面不一样的地方加黄色背景,很赞。希望其它的不利于阅读,不利于理解的格式也调整一下。让文章锦上添花。


这格式粘贴的。感觉HTML编辑器就是不如Word爽。有时间搞定一下。
2 楼 justjavac 2013-05-13  
提点建议,<符号位s, 指数e, 有效数字t> 这行字加粗了。

我觉得,应该把文章中有用的,或者知识点加粗。那么长的010101串,最好按4位或者8位分隔开,这样容易看。

对于大串的0101,你在后面不一样的地方加黄色背景,很赞。希望其它的不利于阅读,不利于理解的格式也调整一下。让文章锦上添花。
1 楼 justjavac 2013-05-13  
赞一个,比我写的详细。

相关推荐

    隐马尔科夫算法(HMM)的Java实现

    - 考虑到浮点数运算的精度问题,在计算概率时采用对数概率。 - 在实际应用中,还需要实现具体的算法来完成如预测、解码等功能。 #### 结论 通过上述分析,我们可以看到Java实现的HMM类是如何组织和封装关键信息...

    Aviator-2.3.0用户指南

    - **2013-05-18**: 完成0.6版本更新,新增了对大数和精度计算的支持,以适配Aviator 2.3.0版本。 - **2010-06-28**: 发布0.1版本。 - **2010-09-07**: 修改并完成0.2版本。 - **2011-07-13**: 完成0.3版本,适配...

    基于AT89S52 单片的频率计

    一般选择C3 为0.1uF 的独石电容,R1 为1K 的电阻,正脉冲有效宽度为: ln10*R1*C3=230&gt;2,即可以该电路可以产生有效复位。 ( 3 ) 程序下载线接口: AT89S52 自带有isp 功能,ISP 的全名为In System Programming,即...

    打造高效集成工具箱:基于Python与Tkinter的实战开发教程

    在日常的开发和使用中,我们经常需要借助各种小工具来提高工作效率,例如快速启动常用的应用程序、管理文件等。一个简单但功能强大的集成工具箱可以帮助用户快速访问、启动并管理程序。今天,我们将以Python为基础,结合Tkinter和Win32API,开发一个类似Windows快捷方式的工具箱应用,能够让你轻松集成各种常用程序并一键启动

    django自建博客app

    django自建博客app

    《基于YOLOv8的智慧校园实验室高压灭菌锅安全联锁系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip

    《基于YOLOv8的智慧校园实验室高压灭菌锅安全联锁系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计

    测试啊啊啊啊啊啊啊!!!!!

    测试啊啊啊啊啊啊啊!!!!!

    用于hifi测序数据的基因组组装程序

    用于hifi测序数据的基因组组装程序

    Microsoft Access 2010 数据库引擎可再发行程序包AccessDatabaseEngine-X64解压后的文件AceRedist

    Microsoft Access 2010 数据库引擎可再发行程序包AccessDatabaseEngine-X64解压后的文件AceRedist

    从大模型、智能体到复杂AI应用系统的构建-以产业大脑为例.pdf

    从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例

    自然语言处理之TF-IDF算法与TextRank算法的缠绵_textrank,tf-idf和两者的组合-CSDN博客.html

    自然语言处理之TF-IDF算法与TextRank算法的缠绵_textrank,tf-idf和两者的组合-CSDN博客.html

    科学智能2023版《科学智能 (AI4S)全球发展观察与展望》:AI4S驱动的跨领域技术创新与应用

    内容概要:2023版《科学智能 (AI4S)全球发展观察与展望》阐述了AI for Science(AI4S)在全球范围内的最新进展及其对科学和工业的深远影响。文章首先回顾了AI4S在过去一年中的快速发展,特别是在药物研发、材料科学、地质学、污染治理等多个领域的应用实例。AI4S通过结合深度学习、机器学习和其他AI技术,加速了从基础研究到实际应用的转化过程。例如,在药物研发中,AI4S帮助科学家克服了“反摩尔定律”的挑战,提高了新药研发的成功率;在材料科学中,AI4S实现了复杂材料的高效模拟,如人造钻石、石墨烯、碳纳米管等;在地质学中,AI4S通过模拟地球内部结构和物理过程,为地震学研究提供了新视角。此外,文章还探讨了大语言模型(LLMs)与科学方法的结合,指出LLMs不仅能辅助科学研究,还能生成新的科学假设并进行逻辑推理。 适合人群:具备一定科研背景或对AI技术感兴趣的科研人员、工程师、政策制定者及高校师生。

    个人健康与健身追踪数据集,包含了日常步数统计、睡眠时长、活跃分钟数以及消耗的卡路里,适用于数据分析、机器学习

    这个数据集包含了日常步数统计、睡眠时长、活跃分钟数以及消耗的卡路里,是个人健康与健身追踪的一部分。 该数据集非常适合用于以下实践: 数据清洗:现实世界中的数据往往包含缺失值、异常值或不一致之处。例如,某些天的步数可能缺失,或者存在不切实际的数值(如10,000小时的睡眠或负数的卡路里消耗)。通过处理这些问题,可以学习如何清理和准备数据进行分析。 探索性分析(发现日常习惯中的模式):可以通过分析找出日常生活中的模式和趋势,比如一周中哪一天人们通常走得最多,或是睡眠时间与活跃程度之间的关系等。 构建可视化图表(步数趋势、睡眠与活动对比图):将数据转换成易于理解的图形形式,有助于更直观地看出数据的趋势和关联。例如,绘制步数随时间变化的趋势图,或是比较睡眠时间和活动量之间的关系图。 数据叙事(将个人风格的追踪转化为可操作的见解):通过讲述故事的方式,把从数据中得到的洞察变成具体的行动建议。例如,根据某人特定时间段内的活动水平和睡眠质量,提供改善健康状况的具体建议。

    框架结构天城商业办公楼5200平米(建筑图 结构图 计算书 开题报告 任务书 文献翻.zip

    框架结构天城商业办公楼5200平米(建筑图 结构图 计算书 开题报告 任务书 文献翻.zip

    柴油机连杆加工工艺及夹具设计.zip

    柴油机连杆加工工艺及夹具设计.zip

    BeautifulSoup中的select方法汇总

    读书网首页的HTML信息

    渐变色文字生成工具 v1.0一款让文字生成渐变颜色代码的软件文字渐变颜色代码生成器.rar

    文字渐变颜色代码生成器:让文字绽放多彩魅力,演示:在信息交流日益丰富的今天,个性化的文字展示成为吸引目光的关键。这款文字渐变颜色代码生成器,便是为满足这一需求而生的绿色软件,无需安装,便捷实用。 它的操作极为简便。用户只需在软件界面中输入想要转换的文字内容,接着从丰富的色彩选项里挑选心仪的起始颜色与结束颜色,随后轻轻按下 “转换按钮”,神奇的事情就此发生 —— 适用于论坛、网页、QQ 空间等多种平台,以及自定义格式的渐变颜色代码便会即刻生成。不仅如此,生成的代码还能自动复制到剪切板,极大地节省了用户手动复制的时间。当你在论坛回帖、更新网页内容或是装扮 QQ 空间时,只需轻松粘贴代码,原本单调的文字瞬间就能拥有绚丽的渐变色彩,瞬间脱颖而出,为你的表达增添独特魅力,让文字不再平凡,轻松成为视觉焦点。 一款可以轻松把一段文字生成渐变颜色代码的绿色软件,当你在软件中输入完要转换的文字后,只需要挑选自己喜欢的起始颜色、结束颜色后,按一下―转换按钮即可生成相应的论坛/网页/QQ空间以及自定义格式代码,并且代码可以自动复制到剪切板中,回帖时直接粘贴代码即可不错得文字代码生成器,让你得文字更加漂亮.

    【锂电池剩余寿命预测】Transformer锂电池剩余寿命预测(Matlab完整源码和数据)

    1.【锂电池剩余寿命预测】Transformer锂电池剩余寿命预测(Matlab完整源码和数据) 2.数据集:NASA数据集,已经处理好,B0005电池训练、B0006测试; 3.环境准备:Matlab2023b,可读性强; 4.模型描述:Transformer在各种各样的问题上表现非常出色,现在被广泛使用。 5.领域描述:近年来,随着锂离子电池的能量密度、功率密度逐渐提升,其安全性能与剩余使用寿命预测变得愈发重要。本代码实现了Transformer在该领域的应用。 6.作者介绍:机器学习之心,博客专家认证,机器学习领域创作者,2023博客之星TOP50,主做机器学习和深度学习时序、回归、分类、聚类和降维等程序设计和案例分析,文章底部有博主联系方式。从事Matlab、Python算法仿真工作8年,更多仿真源码、数据集定制私信。

    《基于YOLOv8的船舶压载水违规排放监测系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip

    资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。

    《基于YOLOv8的港口船舶靠泊角度偏差预警系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计.zip

    资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。

Global site tag (gtag.js) - Google Analytics