“我到底在想什么?!?”
凌晨1:30分,我正盯着不到一个月前我写的一段代码。当时它看起来像是件艺术品,全部是可理解的,优雅、简单、让人叹为观止。这一切都不再了,明天是我的最后期限,数小时前我发现了一个bug。当时看起来的简单和逻辑再也说不通了。可以肯定的是,如果我写代码,我应该足以聪明到理解代码?
经过了多次这种经历以后,我开始认真思考,为什么我的代码在我编写的时候很清楚、而当我数周或数月后回头看的时候,它们却那么费解。
问题1,过度复杂的心智模型
为了理解当你间隔一段时间返回到你的代码、却发现代码难以理解的第一步,就是理解我们如何从心智上建立问题模型。你写的几乎所有代码都是尽量解决现实世界的问题。在你写代码之前,你需要理解你正试图解决的问题。这常常是编程里最难的一步。
为了解决现实世界的问题,我们首先需要形成该问题的心智模型【注1】,以此作为编程意图。接下来你需要形成实现编程意图的方案模型,我们姑且称为语义模型(semantic model)。从来不要混淆你的编程意图和此意图的方案。我们倾向于主要考虑方案方面的东东,而常常忽略意图的模型。
你接下来的步骤是形成可能最简单的语义模型。这是容易搞错的第二步。如果你不花时间去真正理解你正试图解决的问题,你将在写代码时被绊倒在模型上。另一方面,如果你真正考虑了你正尽量做的事情,你经常得到一个非常简单的模型,这足以让你掌握最初的意图。 如果你想容易地维护简单的代码,就尽可能多些地消除意外的复杂性。我们正试图解决的问题是足够复杂的。如果你不必那么做,就不要把意外的复杂性增加进来。
问题2,语义模型到代码的糟糕转化
一旦你尽全力形成了最好的语义模型,那么就到了把它转化为代码的时候了。我们称之为句法模型(syntactic model)。你正试图把你的语义模型的意义转化为计算机能够理解的句法。
如果你有非常不错的语义模型、而在转化为代码时搞砸了,那么在你需要在以后某个阶段回头修改代码时,你将比较痛苦。当你脑子里还有语义模型时,把你代码映射到语义模型是容易的。回忆起变量“x”实际上代表一条记录被创建的日期、而“y”代码记录被删除的日期,这是不难的。当你3个月后再回来看代码,你的脑子里将没有这个语义模型了,因此无法理解同样的变量名字。
把语义模型转化为句法的任务就是尽量多地留下线索,让你在今后返回时,能够重建当初的语义模型。
好了,你该怎么做呢?
类结构和命名
如果你在使用面向对象语义,请尽量让你的类结构和命名靠近语义模型。领域驱动设计(Domain Driven Design)【注2】是在这种练习上投入了相当重要性的一种运动。即使你没有相信完全的DDD方法,你也应当非常小心地考虑类结构和命名。每个类都是你留给自己和其他人的线索,它帮助你在将来返回的时候重建你的心智模型。
变量、参数和方法命名
尽量避免普通的变量和方法命名。不要把方法命名为“Process”,因为“PaySalesCommision”更有意义。不要把变量命名为“x”,因为它应当是“currentContract”。不要把参数命名为“input”,因为“outstandingInvoices“更好。
单一功能原则(Single responsibility principle,简称SRP) SRP
【注3】是面对对象设计原则的核心之一,关联着好的类和变量命名。它认为,任何类或方法都应该完成一个单一的功能,只能是一个单一的功能。如果你想为类和方法给出有意义的名字,那么它们需要有一个唯一的较好定义的目的。如果一个单一类从数据库读和写、计算营业税、通知交易客户并生成账单,那么你就可能无法给出合适的名字。我常常停留在重构类上,因为我总是努力取一个足够短的名字,以描述它做的每个功能。为了更多地讨论SRP和其它面向对象原则,可以参考我的博文《面向对象设计》。
适当的注释
如果因为某种原因,你不能让代码变得清晰,你同情将来的自己,需要不得不做些事情,那就留下注释来说明你为什么不得不那样做。注释倾向于快速地变得陈旧,因此我宁愿尽可能让代码自描述,注释用来说明为什么你不得不那样做,而不是它如何做。
问题3,没有足够的组块
心理学上的组块被定义是,把信息组块定位为单一的实体。那么这该如何应用到编程上呢?作为一名开发者,在你积累经验时,你开始发现你解决方案里反复出现的模式。极具影响的设计模式:《可重用的面向对象软件》是第一本整理和解释一些模式的书。尽管如此,组块不仅仅用在设计模式和面向对象。在函数式编程(FP)里,存在大量的著名标准函数具备这同样的目的。算法是组块的另一种形式(后续会更多)。
当你合理地使用组块(设计模式、算法和标准函数)时,它让你停下来思考,你编写的代码是如何运行的、而不是考虑它做了什么。这缩短了你的语义模型(你的代码)和句法模型(你脑子里的模型)的距离。这个距离越短,你就越容易重建你的心智模型。
如果你有兴趣了解更多FP里的函数,请移步到我的文章面向web开发者的函数式编程。
问题4,费解的用法
目前,我们主要讨论了如何结构化你的类、方法和变量命名。心智模型的另一个重要部分是理解这些方法应该怎样被使用。再次强调,当你最初形成心智模型时,这是相当清晰的。当你后来返回时,就非常难以重建你的类和方法的、所有有意图的用法了。通常这是因为不同的用法散布在你的程序其它地方。有时候甚至出现在很多不同的项目中。
我就是在这种情况下发现测试用例是非常有用的。除了相应地知道一个修改是否破坏了代码的明显好处,测试为你的代码提供了一整套的用例。你不必搜遍100个文件,只需看测试就能得到引用的全景。
注意为了达到这个目的,你需要有一整套完整的测试用例。如果你的测试仅仅覆盖了一部分、而你认为测试是完整的,那么你后来将陷入困境。
问题5,不同的模型之间没有清晰的途径
你的代码从技术角度看,常常是优秀的、非常优雅,但是从程序意图到语义模型、再到代码存在非常不自然的跳跃。考虑你选择的一堆模型的透明性是重要的。从程序意图到语义模型、再到代码的过程需要尽可能平滑。你应当能够看透对应到问题的每个模型的所有方面。多数情况下,最好选择特定类结构或算法不是为了它在隔离方面的优雅,而是可以连接各种模型,为你重建的目的而留下 一条自然的途径。当你从抽象的编程意图走到具体的代码时,你做的选择应该受到 你能够表现更为抽象模型 的清晰度驱使。
问题6,发明算法
作为程序员,我们经常认为,我们在为了解决问题而发明着算法。事实很难是这样的。几乎所有情况下,已经有现成的算法可以被组合在一起解决你的问题了。像最短路径搜索法、字符串相似度算法、粒子群算法等。大部分编程是以正确的组合、选择现存算法来解决你的问题。如果你正在发明新算法,那么,要么你不知道合适的算法、要么你正忙于你的博士论文。
总结
最后总结:作为一名程序员,你的目标是建立能够解决你问题的、尽可能简单的语义模型。把语义模型尽可能靠近地转化为句法模型(代码),尽可能多地提供线索,便于你之后无论哪个人看你的代码,都能重建像你最初脑子里的、相同的语义模型。
设想一下,当你走过你代码的被照亮的森林时,你在身后留了面包屑。相信我,当你需要找到回去的路时,森林将充满了黑暗、朦胧和不详的预感。
听起来容易,实际做起来是很难的。
原文地址:https://medium.com/on-coding/why-your-code-is-so-hard-to-understand-83057c115a2b
注1:心智模型是用于解释个体为现实世界中之某事所运作的内在认知历程。http://zh.wikipedia.org/wiki/心智模型
注2:要通过创建领域模型来加速复杂的软件开发,就需要利用大量最佳实践和标准模式在开发团队中形成统一的交流语言;不仅重构代码,而且要重构代码底层的模型;同时采取反复迭代的敏捷开发方法,深入理解领域特点,促进领域专家与程序员的良好沟通。http://baike.baidu.com/view/3705331.htm
注3:马丁把功能(职责)定义为:“改变的原因”,并且总结出一个类或者模块应该有且只有一个改变的原因。一个具体的例子就是,想象有一个用于编辑和打印报表的模块。这样的一个模块存在两个改变的原因。第一,报表的内容可以改变(编辑)。第二,报表的格式可以改变(打印)。这两方面会的改变因为完全不同的起因而发生:一个是本质的修改,一个是表面的修改。单一功能原则认为这两方面的问题事实上是两个分离的功能,因此他们应该分离在不同的类或者模块里。把有不同的改变原因的事物耦合在一起的设计是糟糕的。http://zh.wikipedia.org/wiki/单一功能原则
相关推荐
一句话代码加密器便提供了这样的功能,它可以将源代码转换成难以理解的形式,使未经许可的人难以阅读和理解。 该工具的操作流程通常非常简洁。用户只需通过简单的命令行界面,指定待加密的源代码文件,然后运行加密...
#### 三、为什么遗留代码如此难以处理? - **难以理解和预测**:由于缺乏足够的文档和注释,开发者很难全面理解代码的功能和逻辑,从而难以准确评估修改所带来的影响。 - **潜在的风险高**:在没有充分测试的情况下...
分解大函数为小函数,每个函数负责单一职责,这样代码更易于理解和测试。避免重复代码(DRY原则),利用函数复用来减少冗余。 4. 使用模板字符串 当需要构建动态字符串时,使用模板字符串 (` `` `) 而不是字符串...
代码混淆是一种有效的程序转换手段,它通过使程序难以理解,来保护程序不被逆向工程手段破解。由于代码混淆在多种环境下的广泛应用,研究其效率成为研究的首要问题。当前的研究方法并没有考虑到语义信息的处理,因此...
其内存仅为4KB,而CPU的运算速度只有0.043MHz,这在今天看来简直难以想象。然而,就是这样的设备,成功地完成了登月任务中的导航、控制和通信等关键任务。 1. **汇编语言编程**:阿波罗11号的源代码主要用汇编语言...
需要注意的是,反编译并不总是完美的,尤其是当源代码经过混淆或者优化处理后,反编译的结果可能难以理解。尽管如此,这些工具仍然是对已编译Lua代码进行逆向工程的重要手段。 在实际应用中,了解Lua的编译和反编译...
JCGO,全称为Java to C Compiler,是一款由Ivan Maidanski开发的开源项目,旨在将Java源代码转换为C语言代码,从而使得Java程序能够在不依赖JVM(Java虚拟机)的情况下运行。这一工具的出现,为那些需要在嵌入式系统...
在数字化转型的大背景下,企业对于快速交付软件应用的需求日益增长,传统的软件开发模式难以满足,低代码技术因此应运而生。 低代码平台主要可以分为两种技术路径:表单驱动和模型驱动。表单驱动的低代码平台以高度...
本书的核心问题是:“为什么好的软件如此难以创造?”这一问题贯穿全书,试图揭示软件开发过程中存在的根本性难题。尽管计算机科学已经发展了半个世纪之久,但至今仍未找到一个完美的答案来解决这一问题。本书通过一...
它可能涵盖了为什么混淆和压缩对于现代Web开发如此重要的原因,以及如何选择和使用合适的工具来优化代码。 在实际开发中,开发者通常会在项目构建过程中自动化混淆和压缩过程,这通常由构建工具(如Webpack、Gulp或...
尽管如此,它仍然非常适合学习和理解GAN的工作原理。 关于标签"GAN",即Generative Adversarial Networks,其核心思想是生成器试图创建看起来像训练数据的新样本,而判别器则试图区分真实数据和生成器产生的假数据...
然而,尽管如此,编写易于理解和维护的汇编程序仍然是可能的,这仅仅需要程序员付出更多的努力。 本指南由著名的汇编语言专家Randall Hyde撰写,并由jhkdiy翻译成中文版。该指南旨在帮助程序员理解如何提高他们所...
尽管如此,我们仍可以从已有的信息中提取一些有价值的知识点。 ### 知识点一:HTML表格的基本结构 从提供的部分内容可以看出,这里使用了HTML表格来展示信息。以下是一个简化的HTML表格结构示例: ```html ...
尽管如此,为了代码的清晰性和防止意外错误,最好养成每条语句后都添加分号的习惯。 在实际开发中,还会涉及到变量声明、数据类型、运算符、流程控制(条件语句、循环)、函数、对象、数组、异常处理、事件处理等更...
太多的嵌套会使代码难以理解,这在 Python 中尤为如此,因为 Python 没有括号来帮助区隔不同的嵌套级别。 阅读深度嵌套的代码容易让人烦躁,因为你必须理清哪些条件属于哪一级。因此,我们应尽可能减少嵌套,如果两...
其中循环是重点内容,对个人的逻辑分析以及程序执行顺序的理解都要求较高。大家都懂得:有学无习难以提高能力。软件编程更是如此,听十遍,想十遍,不如动手练一遍。下面利用循环结构实现了几个C语言入门的小实例,...
8. **调试支持**:尽管加密使得代码难以阅读,但开发者可能需要在加密后仍然能进行一定程度的调试。因此,一些加密工具可能提供特殊的调试模式。 总的来说,“威盾PHP加密专家”作为一款专业的PHP代码加密软件,为...
总结来说,ChatGPT凭借强大的自然语言处理能力和代码生成能力,为非程序员提供了新的开发途径,但它不太可能完全取代低代码平台。两者各有优势,更可能的是在未来的软件开发领域中形成互补,共同推动技术进步。...
它不仅仅展示了软件开发的困境,更重要的是向读者提出了为什么好软件如此难做的问题。作者通过Chandler项目展示了软件开发的复杂性和不确定性,以及背后的各种挑战。书中对于软件开发的深入探讨和反思,对于那些有志...