在『代码之谜』系列的前几篇文章中,很多次出现了浮点数。 浮点数在很多编程语言中被称为简单数据类型,其实,浮点数比起那些复杂数据类型(比如字符串)来说, 一点都不简单。
单单是说明 IEEE浮点数 就可以写一本书了,我将用几篇博文来简单的说说我所理解的浮点数,算是抛砖引玉吧。
一次面试
记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试, 多年以后,他已经称为了一名很出色的程序员。 每次聚会他都会告诉我,“那次面试彻底改变了我的过去的学习方式, 我以前只是盲目接受知识,根本就没有自己思考过, 那次对话,比我大学四年学到的知识都多”。
我看他简历上写到读过《信息论》才谈了很多关于二分法以及编码的话题, 整个过程大概3个小时——这是我面试时间最长的一次。
因为时间久远,我把一些我能回忆起来的关于浮点数的内容整理在这篇博客中。
格式说明:
所有我说的话,都放在引用里面。他的话放在了引号(“”)里面。没有加引号的是我的心理活动或者说明。
浮点数个数
在 8 位计算机上,浮点数一共有多少个呢?
“8 位的好像太过时了,现在主流的是 32 位的,好像可以表示3 x 10^38。”
果然不出我所料,很多毕业生都把计算机学成了文科,他们不是在学习理论知识,而是接受/背诵这些知识。
8 位计算机可以表示的整数是多少个呢?
“这个简单,2的8次方,应该是 256 个。N 位计算机表示的整数就是 2 的 N 次方。”
他回答时显得很兴奋,因为他终于可以反驳我的观点了,他没有把计算机当作死记硬背的学科。
8 位计算机,或者说8bit 可以表示 2^8 个整数。 如果用这 8bit 来表示字符,可以表示多少个呢?
“呵呵,当然也是 2 的 8 次方了,否则就没有必要再发明16位或者32位的 unicode 去表示汉字了。”
如你刚才所说,8bit 可以表示 3^38 个浮点数。那么你估算一下,2bit 可以表示多少个浮点数呢?
“既然 2bit 可以表示 4 个整数,浮点数嘛肯定比这个多,最少也得能表示 10 几个浮点数吧。”
好吧,按照你的思路,我说几个数。
- 0总该有吧,用 00 表示。
-
- 1 用 01 表示
-
- 2 用 10 表示
-
- 3 用 11 表示
现在你把 0.4 给我表示出来?
『他思索了片刻』“哦。我明白了,2bit 可以表示 4 个数,不管是整数、小数或者字符,就算是用 2bit 表示苹果,我们也只能表示 4 个,如果想要表示更多,就得用更多的 bit 位。”
虽然他在简历中写到读过《信息论》,他对N bit可以表示的信息量是 2^N肯定没有完全理解,或者只是被动接受了这个定理。
过了一会儿他又继续说:“按照这个逻辑,8bit 只能表示 256 个浮点数了,这也太少了。 我有点糊涂了,浮点数的表示范围一般都得几万甚至几亿啊。”
浮点数精度
于是我在 firebug 里面写了几行代码(可以在本系列第一篇的序言部分找到这些代码)。
0.2 + 0.4
0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1
“这怎么可能呢?JS 居然这么不严格?”
显然他把这种现象归结于 js(谢天谢地,他没有把罪过加在 firebug 身上)。 于是我用 Java 重写了上面的代码,这回他只剩目瞪口呆了。
既然他已经开始惊讶,那么下一步就是思考。我又稍作了解释:
任何语言都宣称他们的浮点数的表示范围是 3 x 10^38,这个数到底多大呢?目前所知宇宙的年龄是 1.373 x 10^10 年。
但是 32bit 最多只能表示 2^32 个数,大约是 4 x 10^9。
对比一下你就会发现令人震惊的结果。 如果把浮点数的范围比做地球,那么可以精确表示的浮点数还不到一粒芝麻大。
“这么说,0.2+0.4 是因为他不能够精确表示,所以出现了计算错误的现象。那在编程中如何避免这种问题呢?”
用定点数表示小数。
浮点数等价于小数吗
“定点数不是整数吗?定点数怎么表示小数啊?”
很显然,有一个理论性概念错误。他没有真正理解什么是定点,什么是浮点。
浮点数可以表示整数吗?比如,float a = 2 可以吗?
“可以是可以,这个 2 在计算机里面应该存储的是 2.0 吧?”
计算机肯定没有存储 2.0。百分之一万的肯定。计算机存储的是0、1串。呵呵。
“我觉得浮点数应该不会存储整数的2,他存储的应该是小数的2.0,然后转换成0、1串,是这样吗?”
他一连问了我几个问题,使我感觉到,我不是在面试,而是在上课。
整数和小数是数学里面的概念,在计算机中,只有定点数和浮点数,没有整数和小数。
定点数在课本里如何定义的?
“忘了,只知道定点数就是整数,浮点数就是小数。好像老师也是这么讲的。”
那是因为你们老师不是我,如果我当老师,肯定不会这么教学生。『笑』
定点、浮点,“点”是什么意思?“点”就是小数点。 把小数点固定,通常固定在最右面,就是定点数。 把小数点浮动,就是浮点数。浮点在哪儿?这个在 IEEE 浮点数标准里面定义的。
回到前面话题,如何精确的表示小数呢?其中一种方案就是定点数。
拿 8bit 举例吧。我们可以把小数点定在中间,用 4bit 表示整数部分,4bit 表示小数部分。 这样构造方式(专业点我们称他为数据结构,一般语言把整数和小数称为简单数据类型,其实他们一点都不简单,而且比那些成了复合数据类型的字符串都要复杂的多),我们可以精确的表示256个小数。
在下一章,我们将构造一个 8bit 的浮点数表示形式,来深入探索浮点数不为人知的秘密。 我称它为 JJFN-134(JustJavac Float Notation,justjavac浮点数表示法),1bit符号,3bit指数,4bit尾数。
分享到:
相关推荐
代码之谜(四)讨论了浮点数的概念和应用,从惊讶到思考。该篇博客旨在让读者更好地理解代码中的浮点数。 7. 代码之谜(五)- 浮点数(谁偷了你的精度?) 代码之谜(五)讨论了浮点数的精度问题,谁偷了你的精度...
python学习资源
jfinal-undertow 用于开发、部署由 jfinal 开发的 web 项目
基于Andorid的音乐播放器项目设计(国外开源)实现源码,主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。
python学习资源
python学习资源
python学习一些项目和资源
【毕业设计】java-springboot+vue家具销售平台实现源码(完整前后端+mysql+说明文档+LunW).zip
HTML+CSS+JavaScarip开发的前端网页源代码
python学习资源
【毕业设计】java-springboot-vue健身房信息管理系统源码(完整前后端+mysql+说明文档+LunW).zip
成绩管理系统C/Go。大学生期末小作业,指针实现,C语言版本(ANSI C)和Go语言版本
1_基于大数据的智能菜品个性化推荐与点餐系统的设计与实现.docx
【毕业设计】java-springboot-vue交流互动平台实现源码(完整前后端+mysql+说明文档+LunW).zip
内容概要:本文主要探讨了在高并发情况下如何设计并优化火车票秒杀系统,确保系统的高性能与稳定性。通过对比分析三种库存管理模式(下单减库存、支付减库存、预扣库存),强调了预扣库存结合本地缓存及远程Redis统一库存的优势,同时介绍了如何利用Nginx的加权轮询策略、MQ消息队列异步处理等方式降低系统压力,保障交易完整性和数据一致性,防止超卖现象。 适用人群:具有一定互联网应用开发经验的研发人员和技术管理人员。 使用场景及目标:适用于电商、票务等行业需要处理大量瞬时并发请求的业务场景。其目标在于通过合理的架构规划,实现在高峰期保持平台的稳定运行,保证用户体验的同时最大化销售额。 其他说明:文中提及的技术细节如Epoll I/O多路复用模型以及分布式系统中的容错措施等内容,对于深入理解大规模并发系统的构建有着重要指导意义。
基于 OpenCV 和 PyTorch 的深度车牌识别
【毕业设计-java】springboot-vue教学资料管理系统实现源码(完整前后端+mysql+说明文档+LunW).zip
此数据集包含有关出租车行程的详细信息,包括乘客人数、行程距离、付款类型、车费金额和行程时长。它可用于各种数据分析和机器学习应用程序,例如票价预测和乘车模式分析。
把代码放到Word中,通过开发工具——Visual Basic——插入模块,粘贴在里在,把在硅基流动中申请的API放到VBA代码中。在Word中,选择一个问题,运行这个DeepSeekV3的宏就可以实现在线问答
【毕业设计】java-springboot+vue机动车号牌管理系统实现源码(完整前后端+mysql+说明文档+LunW).zip