请您先登录,才能继续操作
锁定老帖子 主题:代码之谜(四)- 浮点数(从惊讶到思考
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2012-11-15
最后修改:2012-11-15
在『代码之谜』系列的前几篇文章中,很多次出现了浮点数。 浮点数在很多编程语言中被称为简单数据类型,其实,浮点数比起那些复杂数据类型(比如字符串)来说, 一点都不简单。 单单是说明 IEEE浮点数 就可以写一本书了,我将用几篇博文来简单的说说我所理解的浮点数,算是抛砖引玉吧。 一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试, 多年以后,他已经称为了一名很出色的程序员。 每次聚会他都会告诉我,“那次面试彻底改变了我的过去的学习方式, 我以前 只是盲目接受知识,根本就没有自己思考过, 那次对话,比我大学四年学到的知识都多”。 我看他简历上写到读过《信息论》才谈了很多关于二分法以及编码的话题, 整个过程大概3个小时——这是我面试时间最长的一次。 因为时间久远,我把一些我能回忆起来的关于浮点数的内容整理在这篇博客中。 格式说明: 所有我说的话,都放在引用里面。他的话放在了引号(“”)里面。没有加引号的是我的心理活动或者说明。 浮点数个数
“8 位的好像太过时了,现在主流的是 32 位的,好像可以表示3 x 10^38。” 果然不出我所料, 很多毕业生都把计算机学成了文科,他们不是在学习理论知识,而是接受/背诵这些知识。
“这个简单,2的8次方,应该是 256 个。N 位计算机表示的整数就是 2 的 N 次方。” 他回答时显得很兴奋,因为他终于可以反驳我的观点了,他没有把计算机当作死记硬背的学科。
“呵呵,当然也是 2 的 8 次方了,否则就没有必要再发明16位或者32位的 unicode 去表示汉字了。”
“既然 2bit 可以表示 4 个整数,浮点数嘛肯定比这个多,最少也得能表示 10 几个浮点数吧。”
『他思索了片刻』“哦。我明白了, 2bit 可以表示 4 个数,不管是整数、小数或者字符,就算是用 2bit 表示苹果,我们也只能表示 4 个,如果想要表示更多,就得用更多的 bit 位。” 虽然他在简历中写到读过《信息论》,他对 N bit可以表示的信息量是 2^N 肯定没有完全理解,或者只是被动接受了这个定理。 过了一会儿他又继续说:“按照这个逻辑,8bit 只能表示 256 个浮点数了,这也太少了。 我有点糊涂了,浮点数的表示范围一般都得几万甚至几亿啊。” 浮点数精度于是我在 firebug 里面写了几行代码(可以在本系列第一篇的 序言 部分找到这些代码)。
“这怎么可能呢?JS 居然这么不严格?” 显然他把这种现象归结于 js(谢天谢地,他没有把罪过加在 firebug 身上)。 于是我用 Java 重写了上面的代码,这回他只剩目瞪口呆了。 既然他已经开始 惊讶,那么下一步就是 思考。我又稍作了解释:
“这么说,0.2+0.4 是因为他不能够精确表示,所以出现了计算错误的现象。那在编程中如何避免这种问题呢?”
浮点数等价于小数吗“定点数不是整数吗?定点数怎么表示小数啊?” 很显然,有一个理论性概念错误。他没有真正理解什么是定点,什么是浮点。
“可以是可以,这个 2 在计算机里面应该存储的是 2.0 吧?”
“我觉得浮点数应该不会存储整数的2,他存储的应该是小数的2.0,然后转换成0、1串,是这样吗?” 他一连问了我几个问题,使我感觉到,我不是在面试,而是在上课。
“忘了,只知道定点数就是整数,浮点数就是小数。好像老师也是这么讲的。”
拿 8bit 举例吧。我们可以把小数点定在中间,用 4bit 表示整数部分,4bit 表示小数部分。 这样构造方式(专业点我们称他为数据结构,一般语言把整数和小数称为简单数据类型,其实他们一点都不简单,而且比那些成了复合数据类型的字符串都要复杂的多), 在下一章,我们将构造一个 8bit 的浮点数表示形式,来深入探索浮点数不为人知的秘密。 我称它为 JJFN-134(JustJavac Float Notation,justjavac浮点数表示法),1bit符号,3bit指数,4bit尾数。 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2012-11-15
楼主终于更新了。期待很久了。一直在博客频道等,原来发到论坛了。
|
|
返回顶楼 | |