`
buliedian
  • 浏览: 1254489 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

蔡学镛:编译、反编译、反反编译(转)

阅读更多

「盗版」的行为,天天都在我们的周遭上演,所以今年五月由BSA(商业软件联盟)和法务部发起的「反盗版」活动,着实让大家风声鹤唳了好一阵子。但是,即使在这样诡谲的气氛之下,由大专院校学生为主的「反反盗版」活动,到也振振有词,轰轰烈烈地攻占媒体版面。有「盗版」,就有「反盗版」;有「反盗版」,就有「反反盗版」,这个世界就是这么一回事。
  同样的道理,有「编译」(compile),就有「反编译」(decompile);有「反编译」,就有「反反编译」。对于Java和.NET这种虚拟机器的中间码来说,尤其明显。
  Java程序编译后的结果是Java Bytecode,而.NET编译后的结果是CIL(Common Intermediate Language),两者都具有下列的特性:
  -同为堆栈式(stack-based)指令集。
  -同为高阶面向对象机器语言
  -和平台无关
  -Code Validation
  -Symbolic Link
  上述任何一点特色,都可以让程序变得更容易反编译,全部五点结合起来更是不得了。所以要反编译Java和.NET可以说是相当容易的。网络上就到处流传着Java的反编译器(decompiler),可以把编译后的档案反推出原始码,相信不久之后.NET也会遇到一样的问题。(至少,喜欢搞破坏的我就正尝试着写一个.NET decompiler。)
  试想,如果你将辛辛苦苦开发出来的Java和.NET程序交给别人(蔡学镛?),他只要透过反编译器,就可以推出源码,你的智能财产很可能会受到侵犯。
  想要保护自己,你必须在Java或.NET软件出货前,进行反反编译,这个动作通常称为混淆(obfuscate)。被混淆过的程序代码,依然遵照原来的档案格式和指令集,所以依然可以执行,执行结果也和混淆前一样。只是被混淆过的程序代码变得更乱,更不容易被反编译成功。
  有的Java开发工具(例如JBuilder)有内附混淆器(obfuscator),或者你也可以购买功能更强大的混淆器。这些商业的混淆器通常只做三件事:
  -将每一个method内部用更乱的方式组织。
  -将Java Constant Pool,或.NET metadata内可以消除的Symbolic Data消除(例如private method的名字)。
  -将debug信息(例如Java的LocalVariableTable与LineNumberTable)全部删除。Obfuscator的作用如果只是如同上述一般,只有method局部的作用,效果不大。
  欲大幅度地增加反编译的难度,必须搭配下列的方式:
  -Class内的混淆:将class内的method互相混淆。
  -Class之间的混淆:将class之间的关系混淆,例如将父类别和子类别合并或拆解等。
  有一些学术论文有对上述两点做出研究,但成效仍然不大,而且必须手动调整,无法由软件自动处理。这方面值得大家投入更深入的研究。
  混淆过的程序会遇到下面的问题:
  -通常效率会变差
  -可能无法执行。我欲过这样的情况,有可能是混淆器的错,也有可能是JVM的错。如果进行「Class之间的混淆」,稍有不慎,就很可能会无法执行。例如:Java程序中如果有用到instanceof,或者C#程序中有用到is,就要很小心的进行[Class之间的混淆」,否则后果不堪设想。
  混淆的目的有两个层次:
  1.
  让程序无法被自动反编译:例如做出一些特殊的跳跃(goto),让程序区块(block)的关系无法被找出特定的pattern。
  2.
  让程序就算被反编译成功,也不容易被程序员阅读理解:想办法加入一些不易被识破的程序代码来欺骗程序员。


  Obfuscator不是万灵丹,如果遇上了一个精通obfuscating技术的人,佐以profiling工具,原始码还是会落入他的手中。所以,使用obfuscator时,你必须有这样的心理准备:「防君子,不妨小人;防笨蛋,不防聪明人」。尽可能将软件放在server改为提供service,而不将软件卖到客户手上,这才是上策。

分享到:
评论

相关推荐

    蔡学镛:进可攻退可守的Google Dart语言

    2012中国软件开发者大会(SDCC2012)的第五场分论坛“编程语言”中,创新工场首席架构师蔡学镛做了题为“认识Google Dart语言”的演讲,深入浅出地帮助研发人员建立了对于Dart的基本了解和判断,并对“Dart是进可攻...

    蔡学镛--香鸡排三部曲

    从蔡学镛的《香鸡排三部曲》中,我们可以提炼出一系列关于IT行业,尤其是程序员职业状态的深刻洞察,以及对台湾社会经济环境的反思。以下是对该系列文章中涉及的关键知识点的深入分析: ### 程序员的社会地位与薪酬...

    蔡学镛软件架构入门

    ### 蔡学镛软件架构入门 #### 一、软件架构定义及理解 软件架构是软件系统的基础骨架,它定义了软件系统的主要组件及其相互之间的关系。架构是软件设计的一个重要方面,它不仅决定了系统的组织结构,还影响着系统...

    超亢奋的ppt设计秘诀 蔡学镛

    蔡学镛在平安科技上课时的课件

    java蔡学镛的文章

    蔡学镛,又被称为Chia Heng Yung,是一位知名的Java技术专家,他撰写了多篇关于Java技术的文章,这些文章可能涵盖了Java的基础知识、进阶特性以及最佳实践。他的文章对于Java开发者来说是宝贵的资源,可以帮助他们...

    尼古丁+咖啡因(不瞌睡的简报設計模式 )蔡学镛

    本简报由蔡学镛老师制作,旨在分享一种能够让观众保持高度专注的简报设计方法——“不瞌睡的简报设计模式”。此模式融合了尼古丁和咖啡因的概念,寓意通过激发兴趣和活力的方式使简报更加吸引人。 #### 简报三要素...

    PPT制作技巧,不瞌睡的简报设计模式,支付宝蔡学镛

    《PPT制作技巧:不瞌睡的简报设计模式——支付宝蔡学镛》是一本深入浅出地探讨如何创建引人入胜、高效传递信息的PPT作品的专业指南。作者蔡学镛,作为支付宝的知名专家,他在书中分享了自己的经验与见解,帮助读者...

    Java夜未眠-蔡学镛--高手

    从给定的文件信息来看,我们探讨的主题是“Java夜未眠—蔡学镛”,一个在IT行业,尤其是Java领域有着深厚造诣的人物。蔡学镛,现任梦工厂首席技术总监兼框架师,以其对Java的深刻理解和独到见解,在业界享有盛誉。 ...

    蔡学镛架构设计方法

    蔡学镛架构设计方法强调在进行软件架构设计时,应当遵循一系列原则和步骤以简化设计过程、提高设计效率,并确保系统能够应对未来的业务扩展和变化。该方法提出首席架构师在系统架构老化后应当发起重构,以保持架构的...

    第五期 蔡学镛软件架构入门第二场 蔡学镛.pptx

    在《第五期 蔡学镛软件架构入门第二场 蔡学镛.pptx》这一材料中,作者首先对“软件架构”进行了定义与阐述。软件架构不仅仅是关于代码的组织方式,更是一种高层次的设计思路,它关注的是系统的结构和行为,以及它们...

    编程ING:人人都能学会程序设计 蔡学镛著 全彩

    现在是IT的时代,工作与生活都离不开IT。许多人都想了解软件原理,甚至编写一些简单的软件。通过《编程ING:人人都能学会程序设计》一书,你就能拥有这样的能力,甚至培养出对编程的兴趣。 本书在编写上采用了心理学...

    思考函数式编程_蔡学镛.pdf

    10. 类型系统:强类型系统和类型推导在函数式编程语言中十分常见,它们有助于在编译时捕捉错误,并减少运行时错误。 11. 并发编程:函数式编程通过其不可变性和无副作用的特性,简化了并发编程。在多核处理器和...

    蔡学镛架构设计方法入门培训资料

    软件架构入门培训资料,强烈推荐

    java夜未眠-蔡学镛著

    《Java夜未眠》是台湾知名程序员蔡学镛的一部专为Java工程师撰写的著作,旨在深入探讨Java编程语言的方方面面,帮助读者提升技术水平和理解深度。这本书在Java社区中享有较高的声誉,对于想要深入了解Java的开发者来...

    ScriptableAndDsl_蔡学镛

    根据给定文件的信息,我们可以提炼出以下几个核心知识点: ### 一、Scriptable Systems与Domain-Specific Languages (DSLs) 的介绍 #### Scriptable Systems **定义:** Scriptable Systems 指的是那些可以通过...

    中学生编程(蔡学镛)

    ### 中学生编程(蔡学镛) #### 知识点概览 1. **Red语言介绍** - Red语言概述 - Red语言的特点 - Red语言的应用领域 2. **Red语言环境搭建** - Windows操作系统的环境配置 - macOS操作系统的环境配置 - ...

    蔡洪平:制造业方面唯一的发展途径是机器人化.pdf

    蔡洪平:制造业方面唯一的发展途径是机器人化.pdf

    漫谈云计算 蔡学镛 云计算的前世今生 云计算商业模式

    ### 云计算的核心概念及其发展 #### 一、云计算的基本理解 云计算的概念最早源自于网络的象征,简单来说,云计算可以被定义为“网络计算”。这一定义反映了云计算的本质特征:通过互联网提供计算服务。...

Global site tag (gtag.js) - Google Analytics