`

java代码混淆技术保护你的java代码

 
阅读更多

Java 是一种跨平台的、解释型语言。 Java 源代码编译中间 字节码 存储于 class 文件中。 Class 文件是一种字节码形式的中间代码,该字节码中包括了很多源代码的信息,例如变量名、方法名等。因此, Java 中间代码的反编译就变得非常容易。目前市场上有许多免费的、商用的反编译软件,都能够生成高质量的反编译后的源代码。所以,对开发人员来说,如何保护 Java 程序就变成了一个非常重要的挑战。本文首先讨论了保护 Java 程序的基本方法,然后对代码混淆问题进行深入研究,最后结合一个实际的应用程序,分析如何在实践中保护 Java 程序。

  反编译成为保护 Java 程序的最大挑战

  通常 C C++ 等编程语言开发的程序都被编译成目标代码,这些目标代码都是本机器的二进制可执行代码。通常所有的源文件被编译、链接成一个可执行文件。在这些可执行文件中,编译器删除了程序中的变量名称、方法名称等信息,这些信息往往是由内存地址表示,例如如果需要使用一个变量,往往是通过这个变量的地址来访问的。因此,反编译这些本地的目标代码就是非常困难的。

   Java 语言的出现,使得反编译变得非常容易而有效。原因如下: 1. 由于跨平台的需求, Java 的指令集比较简单而通用,较容易得出程序的语义信息; 2.Java 编译器将每一个类编译成一个单独的文件,这也简化了反编译的工作; 3.Java Class 文件中,仍然保留所有的方法名称、变量名称,并且通过这些名称来访问变量和方法,这些符号往往带有许多语义信息。由于 Java 程序自身的特点,对于不经过处理的 Java 程序反编译的效果非常好。

  目前,市场上有许多 Java 的反编译工具,有免费的,也有商业使用的,还有的是开放源代码的。这些工具的反编译速度和效果都非常不错。好的反编译软件,能够反编译出非常接近源代码的程序。因此,通过反编译器,黑客能够对这些程序进行更改,或者复用其中的程序。因此,如何保护 Java 程序不被反编译,是非常重要的一个问题。

  常用的保护技术

  由于 Java 字节码的抽象级别较高,因此它们较容易被反编译。本节介绍了几种常用的方法,用于保护 Java 字节码不被反编译。通常,这些方法不能够绝对防止程序被反编译,而是加大反编译的难度而已,因为这些方法都有自己的使用环境和弱点。

  隔离 Java 程序

  最简单的方法就是让用户不能够访问到 Java Class 程序,这种方法是最根本的方法,具体实现有多种方式。例如,开发人员可以将关键的 Java Class 放在服务器端,客户端通过访问服务器的相关接口来获得服务,而不是直接访问 Class 文件。这样黑客就没有办法反编译 Class 文件。目前,通过接口提供服务的标准和协议也越来越多,例如 HTTP Web Service RPC 等。但是有很多应用都不适合这种保护方式,例如对于单机运行的程序就无法隔离 Java 程序。这种保护方式见图 1 所示。



  图 1 隔离 Java 程序示意图

  对 Class 文件进行加密

  为了防止 Class 文件被直接反编译,许多开发人员将一些关键的 Class 文件进行加密,例如对注册码、序列号管理相关的类等。在使用这些被加密的类之前,程序首先需要对这些类进行解密,而后再将这些类装载到 JVM 当中。这些类的解密可以由硬件完成,也可以使用软件完成。

  在实现时,开发人员往往通过自定义 ClassLoader 类来完成加密类的装载 ( 注意由于安全性的原因, Applet 不能够支持自定义的 ClassLoader) 。自定义的 ClassLoader 首先找到加密的类,而后进行解密,最后将解密后的类装载到 JVM 当中。在这种保护方式中,自定义的 ClassLoader 是非常关键的类。由于它本身不是被加密的,因此它可能成为黑客最先攻击的目标。如果相关的解密密钥和算法被攻克,那么被加密的类也很容易被解密。这种保护方式示意图见图 2



  图 2 Class 文件进行加密示意图

  转换成本地代码

  将程序转换成本地代码也是一种防止反编译的有效方法。因为本地代码往往难以被反编译。开发人员可以选择将整个应用程序转换成本地代码,也可以选择关键模块转换。如果仅仅转换关键部分模块, Java 程序在使用这些模块时,需要使用 JNI 技术进行调用。

  当然,在使用这种技术保护 Java 程序的同时,也牺牲了 Java 的跨平台特性。对于不同的平台,我们需要维护不同版本的本地代码,这将加重软件支持和维护的工作。不过对于一些关键的模块,有时这种方案往往是必要的。

  为了保证这些本地代码不被修改和替代,通常需要对这些代码进行数字签名。在使用这些本地代码之前,往往需要对这些本地代码进行认证,确保这些代码没有被黑客更改。如果签名检查通过,则调用相关 JNI 方法。这种保护方式示意图见图 3

  代码混淆



  图 3 转换成本地代码示意图

  代码混淆是对 Class 文件进行重新组织和处理,使得处理后的代码与处理前代码完成相同的功能 ( 语义 ) 。但是混淆后的代码很难被反编译,即反编译后得出的代码是非常难懂、晦涩的,因此反编译人员很难得出程序的真正语义。从理论上来说,黑客如果有足够的时间,被混淆的代码仍然可能被破解,甚至目前有些人正在研制反混淆的工具。但是从实际情况来看,由于混淆技术的多元化发展,混淆理论的成熟,经过混淆的 Java 代码还是能够很好地防止反编译。下面我们会详细介绍混淆技术,因为混淆是一种保护 Java 程序的重要技术。图 4 是代码混淆的示意图。



  图 4 代码混淆示意图

  几种技术的总结

  以上几种技术都有不同的应用环境,各自都有自己的弱点,表 1 是相关特点的比较。

  混淆技术介绍

  表 1 不同保护技术比较表



  到目前为止,对于 Java 程序的保护,混淆技术还是最基本的保护方法。 Java 混淆工具也非常多,包括商业的、免费的、开放源代码的。 Sun 公司也提供了自己的混淆工具。它们大多都是对 Class 文件进行混淆处理,也有少量工具首先对源代码进行处理,然后再对 Class 进行处理,这样加大了混淆处理的力度。目前,商业上比较成功的混淆工具包括 JProof 公司的 1stBarrier 系列、 Eastridge 公司的 JShrink 4thpass.com SourceGuard 等。主要的混淆技术按照混淆目标可以进行如下分类,它们分别为符号混淆 (Lexical Obfuscation) 、数据混淆 (Data Obfuscation) 、控制混淆 (Control Obfuscation) 、预防性混淆 (Prevent Transformation)

  符号混淆

  在 Class 中存在许多与程序执行本身无关的信息,例如方法名称、变量名称,这些符号的名称往往带有一定的含义。例如某个方法名为 getKeyLength() ,那么这个方法很可能就是用来返回 Key 的长度。符号混淆就是将这些信息打乱,把这些信息变成无任何意义的表示,例如将所有的变量从 vairant_001 开始编号;对于所有的方法从 method_001 开始编号。这将对反编译带来一定的困难。对于私有函数、局部变量,通常可以改变它们的符号,而不影响程序的运行。但是对于一些接口名称、公有函数、成员变量,如果有其它外部模块需要引用这些符号,我们往往需要保留这些名称,否则外部模块找不到这些名称的方法和变量。因此,多数的混淆工具对于符号混淆,都提供了丰富的选项,让用户选择是否、如何进行符号混淆。

  数据混淆



  图 5 改变数据访问

  数据混淆是对程序使用的数据进行混淆。混淆的方法也有多种,主要可以分为改变数据存储及编码 (Store and Encode Transform) 、改变数据访问 (Access Transform)

  改变数据存储和编码可以打乱程序使用的数据存储方式。例如将一个有 10 个成员的数组,拆开为 10 个变量,并且打乱这些变量的名字;将一个两维数组转化为一个一维数组等。对于一些复杂的数据结构,我们将打乱它的数据结构,例如用多个类代替一个复杂的类等。

  另外一种方式是改变数据访问。例如访问数组的下标时,我们可以进行一定的计算,图 5 就是一个例子。

  在实践混淆处理中,这两种方法通常是综合使用的,在打乱数据存储的同时,也打乱数据访问的方式。经过对数据混淆,程序的语义变得复杂了,这样增大了反编译的难度。

  控制混淆

  控制混淆就是对程序的控制流进行混淆,使得程序的控制流更加难以反编译,通常控制流的改变需要增加一些额外的计算和控制流,因此在性能上会给程序带来一定的负面影响。有时,需要在程序的性能和混淆程度之间进行权衡。控制混淆的技术最为复杂,技巧也最多。这些技术可以分为如下几类:

  增加混淆控制 通过增加额外的、复杂的控制流,可以将程序原来的语义隐藏起来。例如,对于按次序执行的两个语句 A B ,我们可以增加一个控制条件,以决定 B 的执行。通过这种方式加大反汇编的难度。但是所有的干扰控制都不应该影响 B 的执行。图 6 就给出三种方式,为这个例子增加混淆控制。



  图 6 增加混淆控制的三种方式

  控制流重组 重组控制流也是重要的混淆方法。例如,程序调用一个方法,在混淆后,可以将该方法代码嵌入到调用程序当中。反过来,程序中的一段代码也可以转变为一个函数调用。另外,对于一个循环的控制流,为可以拆分多个循环的控制流,或者将循环转化成一个递归过程。这种方法最为复杂,研究的人员也非常多。

  预防性混淆

  这种混淆通常是针对一些专用的反编译器而设计的,一般来说,这些技术利用反编译器的弱点或者 Bug 来设计混淆方案。例如,有些反编译器对于 Return 后面的指令不进行反编译,而有些混淆方案恰恰将代码放在 Return 语句后面。这种混淆的有效性对于不同反编译器的作用也不太相同的。一个好的混淆工具,通常会综合使用这些混淆技术。

  案例分析

  在实践当中,保护一个大型 Java 程序经常需要综合使用这些方法,而不是单一使用某一种方法。这是因为每种方法都有其弱点和应用环境。综合使用这些方法使得 Java 程序的保护更加有效。另外,我们经常还需要使用其它的相关安全技术,例如安全认证、数字签名、 PKI 等。

  本文给出的例子是一个 Java 应用程序,它是一个 SCJP(Sun Certificate Java Programmer) 的模拟考试软件。该应用程序带有大量的模拟题目,所有的题目都被加密后存储在文件中。由于它所带的题库是该软件的核心部分,所以关于题库的存取和访问就成为非常核心的类。一旦这些相关的类被反编译,则所有的题库将被破解。现在,我们来考虑如何保护这些题库及相关的类。

  在这个例子中,我们考虑使用综合保护技术,其中包括本地代码和混淆技术。因为该软件主要发布在 Windows 上,因此转换成本地代码后,仅仅需要维护一个版本的本地代码。另外,混淆对 Java 程序也是非常有效的,适用于这种独立发布的应用系统。

  在具体的方案中,我们将程序分为两个部分,一个是由本地代码编写的题库访问的模块,另外一个是由 Java 开发的其它模块。这样可以更高程度地保护题目管理模块不被反编译。对于 Java 开发的模块,我们仍然要使用混淆技术。该方案的示意图参见图 7



  图 7 SCJP 保护技术方案图

  对于题目管理模块,由于程序主要在 Windows 下使用,所以使用 C++ 开发题库访问模块,并且提供了一定的访问接口。为了保护题库访问的接口,我们还增加了一个初始化接口,用于每次使用题库访问接口之前的初始化工作。它的接口主要分为两类:

   1 初始化接口

  在使用题库模块之前,我们必须先调用初始化接口。在调用该接口时,客户端需要提供一个随机数作为参数。题库管理模块和客户端通过这个随机数,按一定的算法同时生成相同的 SessionKey ,用于加密以后输入和输出的所有数据。通过这种方式,只有授权 ( 有效 ) 的客户端才能够连接正确的连接,生成正确的 SessionKey ,用于访问题库信息。非法的客户很难生成正确的 SessionKey ,因此无法获得题库的信息。如果需要建立更高的保密级别,也可以采用双向认证技术。

   2 数据访问接口

  认证完成之后,客户端就可以正常的访问题库数据。但是,输入和输出的数据都是由 SessionKey 所加密的数据。因此,只有正确的题库管理模块才能够使用题库管理模块。图 8 时序图表示了题库管理模块和其它部分的交互过程。

 

 

分享到:
评论

相关推荐

    很强大的java代码混淆工具 Jocky

    Jockey跟其他混淆工具不同的是:它是直接对编译过程做文章,也就是在把java文件编译为class文件的过程中对代码进行混淆,混淆后的代码中包含很多JVM 指令,大家知道JVM指令是面向机器的,人类一般很难看懂!...

    一种基于源代码的Java代码混淆器的设计与实现.pdf

    Java代码混淆器是一种用于保护Java源代码安全的技术,通过让源代码变得难以理解和反编译,从而达到防止源代码泄露和被恶意利用的目的。在目前Java字节码反编译变得十分容易的背景下,源代码的混淆显得尤为重要。 ...

    java代码混淆器proGuard

    Java代码混淆器ProGuard是Java开发中用于保护和优化应用程序的重要工具。它的主要功能是对Java字节码进行混淆,使得代码难以被逆向工程解析,从而提高代码的安全性。混淆过程中,函数变量、类和方法名会被重命名为...

    Allatori java 代码混淆

    Java代码混淆是一种安全措施,主要用于保护Java应用程序的源代码不被未经授权的人员逆向工程解析。Allatori就是一款专门用于Java代码混淆的工具,它能够将可读性强的Java字节码转换为难以理解的形式,以此增加逆向...

    java 代码混淆 proguard

    Java代码混淆是保护软件知识产权的重要手段,特别是在开源或者发布商业应用时,为了防止恶意用户反编译源码,理解并篡改程序逻辑,开发者通常会采用代码混淆技术。ProGuard是一款广泛使用的Java代码混淆工具,它能...

    java代码混淆工具proguard及教程讲解

    java代码混淆工具 简单使用docx 字典文件 生成的配置示例

    Java代码混淆工具proguard

    经典的Java代码混淆工具,可以混淆class,jar类型的文件,防止被反编译,对需要进行源码保护的代码很有用。

    java代码混淆工具

    两款java代码混淆工具 1:jocky是eclipse的插件 2:Allatori-4.6

    ProGuard工具包,Java代码混淆

    **ProGuard工具包详解——Java代码混淆** 在Java开发中,为了提高应用程序的安全性和保护知识产权,开发者常常会使用一种称为“代码混淆”的技术。ProGuard是Android和Java平台上的一个强大的开源工具,它能实现...

    java代码双重混淆

    1,当项目具备商业价值要对外销售的时候,代码混淆是一个必不可少的环节; 2,混淆的目的就是为了不能把class还原成java源码,保护自己的利益; 3,不混淆时,可以被轻而易举的还原,容易泄露商业机密是很不安全的;...

    yGuard---java代码混淆工具

    总的来说,yGuard作为一款强大的Java代码混淆工具,它提供了丰富的混淆策略和高度的可定制性,能够有效保护你的Java应用免受恶意攻击和逆向工程。通过合理地使用和配置yGuard,可以为你的软件安全提供坚实的保障。

    java 代码混淆,网上可以找到的demo

    Java代码混淆是保护Java应用程序源代码安全的一种技术手段,它通过改变代码的可读性来增加逆向工程的难度,防止恶意用户分析和篡改代码。在这个“java 代码混淆,网上可以找到的demo”中,我们可以探讨一些关键概念...

    java代码混淆工具(Allatori)

    Allatori 是第二代 Java 混淆器,可为您的知识产权提供全方位的保护。 尽管大多数第二代混淆器都提供了值得保护的级别,但我们已经在Allatori中开发了许多附加功能,以使对代码进行逆向工程几乎不可能。 Allatori ...

    Jocky混淆JAVA代码(保护你的JAVA项目)[参照].pdf

    【Jocky混淆JAVA代码(保护你的JAVA项目)】 Jocky是一款专为Java开发者设计的混淆编译器,它的主要目标是保护Java代码不被轻易反编译,以确保软件的知识产权。Java源代码(.java文件)编译成.class文件后,由于其...

    Jocky混淆JAVA代码(保护你的JAVA项目).pdf

    【Jocky混淆JAVA代码(保护你的JAVA项目).pdf】主要介绍了Jocky这款Java代码混淆工具,旨在保护Java项目的源代码,防止反编译。混淆编译的主要目的是打乱类文件中的符号信息,使反向工程变得困难,从而保护知识产权。...

    Java源代码混淆器

    敏创Java混淆器是广州市敏创信息科技有限公司在保护自己的Java源代码过程中积累的一套实用工具,可以有效地对Java代码进行混淆,达到保护自己知识产权的目的。 工具可以去除空格,回车,注释,有效地减小Java文件...

    Allatori Java 代码混淆

    Allatori 是一个功能强大的Java代码混淆器,它提供了多种混淆策略,包括变量名、类名、方法名的重命名,控制流混淆,字符串加密等,使得阅读混淆后的代码变得极其困难。在保护源代码的同时,Allatori 确保混淆过程...

    基于Java的代码混淆算法研究.pdf

    代码混淆技术是一种保护软件知识产权的方法,通过对代码进行混淆变换,使得代码的分析难度增加,从而防止恶意主机对软件的篡改。 知识点1:代码混淆技术的定义和分类 代码混淆技术是指对软件代码进行混淆变换,以...

Global site tag (gtag.js) - Google Analytics