`
deepinmind
  • 浏览: 452215 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
1dc14e59-7bdf-33ab-841a-02d087aed982
Java函数式编程
浏览量:41679
社区版块
存档分类
最新评论

Java字节码浅析(二)

阅读更多
条件语句

像if-else, switch这样的流程控制的条件语句,是通过用一个指令进行两个值的比较,然后根据结果跳转到另一条字节码来实现的。

循环语句包括for循环,while循环,它们的实现方式也很类似,但除了一点,它们通常都会包含一条goto指令,以便字节码实现循环执行。do-while循环不需要goto指令,因为它的条件分支是在字节码的末尾。更多细节请参考循环语句一节。

有一些指令可以用来比较两个整型或者两个引用,然后执行某个分支,这些操作都能在单条指令里面完成。而像double,float,long这些值需要两条指令。首先得去比较两个值,然后根据结果,会把1,0或者-1压到栈里。最后根据栈顶的值是大于,等于或者小于0来判断应该跳转到哪个分支。

我们先来介绍下if-else语句,然后再详细介绍下分支跳转用到的几种不同的指令。

if-else

下面的这个简单的例子是用来比较两个整数的:

public int greaterThen(int intOne, int intTwo) {
    if (intOne > intTwo) {
        return 0;
    } else {
        return 1;
    }
}


方法最后会编译成如下的字节码:

0: iload_1
1: iload_2
2: if_icmple     7
5: iconst_0
6: ireturn
7: iconst_1
8: ireturn


首先,通过iload_1, iload_2两个指令将两个入参压入操作数栈中。if\_icmple会比较栈顶的两个值的大小。如果intOne小于或者等于intTwo的话,会跳转到第7条字节码处执行。可以看到这里和Java代码里的if语句的条件判断正好相反,这是因为在字节码里面,判断条件为真的话会跑到else分支里面去执行,而在 Java代码里,判断为真会进入if块里面执行。换言之,if\_icmple判断的是如果if条件不为真,然后跳过if块。if代码块里对应的代码是第5,6条字节码,而else块对应的是第7,8条。



下面的代码则稍微复杂了一点,它需要进行两次比较。

public int greaterThen(float floatOne, float floatTwo) {
    int result;
    if (floatOne > floatTwo) {
        result = 1;
    } else {
        result = 2;
    }
    return result;
}



编译后会是这样:

0: fload_1
 1: fload_2
 2: fcmpl
 3: ifle          11
 6: iconst_1
 7: istore_3
 8: goto          13
11: iconst_2
12: istore_3
13: iload_3
14: ireturn



在这个例子中,首先两个参数会被fload_1和fload_2指令压入栈中。和上面那个例子不同的是,这里需要比较两回。fcmple先用来比较栈顶的floatOne和floatTwo,然后把比较的结果压入操作数栈中。


        * floatOne > floatTwo –> 1
        * floatOne = floatTwo –> 0
        * floatOne < floatTwo –> -1
        * floatOne or floatTwo = NaN –> 1




然后通过ifle进行判断,如果前面fcmpl的结果是<=0的话,则跳转到11行处的字节码去继续执行。

这个例子还有一个地方和前面不同的是,它只在方法末有一个return语句,因此在if代码块的最后,会有一个goto语句来跳过else块。goto语句会跳转到第13条字节码处,然后通过iload_3将存储在局部变量区第三个位置的结果压入栈中,然后就可以通过return指令将结果返回了。




除了比较数值的指令外,还有比较引用是否相等的(==),以及引用是否等于null的(== null或者!=null),以及比较对象的类型的(instanceof)。

if_icmp<cond> 这组指令用来比较操作数栈顶的两个整数,然后跳转到新的位置去执行。<cond>可以是:eq-等于,ne-不等于,lt-小于,le-小于等于,gt-大于, ge-大于等于。
if_acmp<cond> 这两个指令用来比较对象是否相等,然后根据操作数指定的位置进行跳转。
ifnonnull ifnull  这两个指令用来判断对象是否为null,然后根据操作数指定的位置进行跳转。
lcmp  这个指令用来比较栈顶的两个长整型,然后将结果值压入栈中: 如果value1>value2,压入1,如果value1==value2,压入0,如果value1<value2压入-1.
fcmp<cond>  l g dcomp<cond> 这组指令用来比较两个float或者double类型的值,然后然后将结果值压入栈中:如果value1>value2,压入1,如果value1==value2,压入0,如果value1<value2压入-1. 指令可以以l或者g结尾,不同之处在于它们是如何处理NaN的。fcmpg和dcmpg指令把整数1压入操作数栈,而fcmpl和dcmpl把-1压入操作数栈。这确保了比较两个值的时候,如果其中一个不是数字(Not A Number, NaN),比较的结果不会相等。比如判断if x > y(x和y都是浮点数),就会用的fcmpl,如果其中一个值是NaN的话,-1会被压入栈顶,下一条指令则是ifle,如果分支小于0则跳转。因此如果有一个是NaN的话,ifle会跳过if块,不让它执行。
instanceof   如果栈顶对象的类型是指定的类的话,则将1压入栈中。这个指令的操作数指定的是某个类型在常量池的序号。如果对象为空或者不是对应的类型,则将0压入操作数栈中。
if<cond>                    将栈顶值和0进行比较,如果条件为真,则跳转到指定的分支继续执行。这些指令通常用于较复杂的条件判断中,在一些单条指令无法完成的情况。比如验证方法调用的返回值。 


switch语句

Java switch表达式的类型只能是char,byte,short,int,Character, Byte, Short,Integer,String或者enum。JVM为了支持switch语句,用了两个特殊的指令,叫做tableSwitch和lookupswitch,它们都只能操作整型数值。只能使用整型并不影响,因为char,byte,short和enum都可以提升成int类型。Java7开始支持String类型,下面我们会介绍到。tableswitch操作会比较快一些,不过它消耗的内存会更多。tableswitch会列出case分支里面最大值和最小值之间的所有值,如果判断的值不在这个范围内则直接跳转到default块执行,case中没有的值也会被列出,不过它们同样指向的是default块。拿下面的这个switch语句作为例子:

public int simpleSwitch(int intOne) {
    switch (intOne) {
        case 0:
            return 3;
        case 1:
            return 2;
        case 4:
            return 1;
        default:
            return -1;
    }
}



编译后会生成如下的字节码

0: iload_1
 1: tableswitch   {
         default: 42
             min: 0
             max: 4
               0: 36
               1: 38
               2: 42
               3: 42
               4: 40
    }
36: iconst_3
37: ireturn
38: iconst_2
39: ireturn
40: iconst_1
41: ireturn
42: iconst_m1
43: ireturn


tableswitch指令的0,1,4的值都对应case语句里面的值,它们指向的是对应的代码码的字节码。tableswitch指令同样有2,3的值,它们并不在case语句中,它们指向的是default代码块。当这条指令执行的时候,会判断操作数栈顶的值是否在最大值和最小值之间。如果不在的话,直接跳去default分支,也就是上面的第42行的字节码处。为了确保能找到default分支,它都是出现在tableswitch指令的第一个字节(如果需要内存对齐的话,则在补齐了之后的第一个字节)。如果栈顶的值在最大最小值的范围内,则用它作为tableswtich内部的索引,定位到应该跳转的分支。比如1的话,就会跳转至38行处继续执行。下图会演示这条指令是如何执行的:


如果case语句里面的值范围太广了(也就是太分散了)这个方法就不太好了,因为它使用的内存太多了。因此当switch的case条件里面的值比较分散的时候,就会使用lookupswitch指令。这个指令会列出case语句里的所有跳转的分支,但它没有列出所有可能的值。当执行这条指令的时候,栈顶的值会和lookupswitch里的每个值进行比较,来确定要跳转的分支。执行lookupswitch指令的时候,JVM会在列表中查找匹配的元素,这和tableswitch比起来要慢一些,因为tableswitch直接用索引就定位到正确的位置了。当switch语句编译的时候,编译器必须去权衡内存的使用和性能的影响,来决定到底该使用哪条指令。下面的代码,编译器会生成lookupswitch语句:


public int simpleSwitch(int intOne) {
    switch (intOne) {
        case 10:
            return 1;
        case 20:
            return 2;
        case 30:
            return 3;
        default:
            return -1;
    }
}



生成后的字节码如下:

0: iload_1
 1: lookupswitch  {
         default: 42
           count: 3
              10: 36
              20: 38
              30: 40
    }
36: iconst_1
37: ireturn
38: iconst_2
39: ireturn
40: iconst_3
41: ireturn
42: iconst_m1
43: ireturn



为了确保搜索算法的高效(得比线性查找要快),这里会提供列表的长度,同时匹配的元素也是排好序的。下图演示了lookupswitch指令是如何执行的。




未完待续。

原创文章转载请注明出处:http://it.deepinmind.com

英文原文链接


3
0
分享到:
评论

相关推荐

    java字节码框架ASM操作字节码的方法浅析

    Java字节码是JVM(Java虚拟机)能够理解的二进制指令集,它是Java源代码编译后的结果。每条字节码指令对应一个特定的操作,如加载或存储变量,调用方法等。字节码的表示方式通常使用类型签名,这是JVM用来表示方法...

    20201210技术分享--java动态追踪技术浅析.pptx

    BTrace 使用了前面提到的 Java.lang.instrument 包中的 API,允许开发者在运行时安全地添加或修改类的字节码,以便进行动态追踪。BTrace 的设计目标是提供一种简单、安全的方式来监控和诊断 Java 应用程序,而无需...

    浅析Java卡应用执行机制及虚拟机能效优化.pdf

    Java卡应用执行机制主要是将class文件的字节码转换成可以被Java虚拟机识别并执行的虚拟机代码。由于Oracle公司在JCVMSpecification中明确规定了Java虚拟机所支持的所有指令集,因此这是一个标准的转换过程。 二、B...

    class文件结构浅析

    ### Class文件结构浅析 ...通过深入理解Class文件的结构,开发人员可以更好地掌握Java字节码层面的操作,这对于编写高性能的Java程序具有重要意义。此外,对于进行Java字节码级别的调试和分析也非常有帮助。

    浅析Java智能卡的应用与开发.zip

    3. 编译与打包:使用Java Card开发工具,如Oracle的Java Card SDK,将Applet编译成字节码,并打包成CAP文件。 4. 个人化:将CAP文件加载到智能卡,完成卡片的个性化过程。 5. 测试验证:进行功能测试和安全性测试,...

    浅析计算机软件JAVA编程的特点及应用.zip

    在性能上,Java通过即时编译(JIT)技术将字节码转化为机器码,提升了运行效率。并且,Java内存管理的垃圾回收机制自动处理不再使用的对象,减少了内存泄漏的问题,让开发者可以更专注于业务逻辑。 Java在计算机...

    浅析android手游lua脚本的加密与解密(番外篇之反编译的对抗)

    4. **Luajit-decomp**:专门针对LuaJIT字节码进行反编译的工具,通过先将LuaJIT字节码转换为汇编语言,再转换为Lua源代码的方式进行反编译。 #### 五、结论 综上所述,Lua脚本的加密与解密是一个复杂而多变的过程...

    [浅析J2EE应用服务器的JAVA类装载器]python回朔异常的模块.docx

    类装载器负责从源(如.class或.jar文件,或其它来源如内存、网络)获取字节码并将其转化为可执行的形式。 类装载器的主要功能包括: 1. 提供对类的请求服务:当JVM需要一个类时,类装载器负责找到并返回这个类。 2....

    浅析JSP、ASP与PHP技术.pdf

    另外,Servlet 编译后的 Java 字节码只有在被请求时才执行,同时服务器会缓存运行的 Servlet,所以尽管当首次调用 Servlet 时会有几秒钟的加载时间,但对后续的客户端请求响应会非常快。 本文对 JSP、ASP 和 PHP 三...

    JavaScript 和 Java 的区别浅析

    - Java 代码需要先通过 Java 编译器编译成字节码(.class 文件),然后在 Java 虚拟机(JVM)上运行,这使得 Java 程序能跨平台运行,但需要客户端安装相应的 JVM。 - JavaScript 代码则是解释执行的,无需预先...

    浅析JVM

    - **跨平台性**:通过将Java源代码编译为中间代码(字节码),JVM可以在多种不同的平台上解释执行这些字节码,实现了“一次编写,到处运行”的理念。 - **安全性**:JVM提供了沙盒执行环境,可以防止恶意代码对...

    浅析java class 文件

    JVM将字节码转换为特定平台的机器指令执行,实现了Java的“一次编写,到处运行”特性。 5)与Java语言的关联性:虽然Class文件主要由Java源代码编译而来,但理论上其他编程语言也可以生成符合Class文件格式的二进制...

    浅析Java、C/C++、JavaScript、PHP、Python分别用来开发什么?

    此外,Java的虚拟机(JVM)使得它可以在不同的操作系统上运行相同的字节码,这也是其跨平台特性的体现。 C/C++语言因其高效性和对硬件的控制能力,被认为是开发系统底层软件、嵌入式系统和游戏开发的首选。C语言在...

    java与php的区别浅析

    Java编译器将源代码转换为字节码,然后java解释器生成机器代码,该机器代码由运行java程序的机器直接执行。它可靠,分布式,便携。它可用于开发独立应用程序或基于Web的应用程序。 PHP被称为超文本预处理器,它是一...

    浅析Java内存模型与垃圾回收

    如果线程执行的是Java方法,计数器记录字节码的下一条指令;如果是Native方法,计数器值为空。 2. **Java虚拟机栈**:同样为线程私有,用于存储栈帧,每个栈帧包含局部变量表、操作数栈、动态链接和方法出口等信息...

    基于Linux的Android OS平台应用浅析.pdf

    - **Android Runtime**:Dalvik虚拟机是Android运行时的核心,它执行.dex格式的字节码文件,这些文件经过Java编译器编译并通过dx工具转换。Dalvik虚拟机基于寄存器,优化了内存使用,并且每个应用都有自己的进程...

    App检测的静态逆向分析思路浅析.pdf

    - **jadx**: 是一款强大的Java字节码反编译器,能够将DEX格式的文件(如Android APK中的主类文件)转换成易于阅读的Java源代码。通过这种方式,开发者和安全研究人员可以更轻松地理解应用程序的行为。 - **frida**: ...

    Android嵌入式系统架构及内核浅析

    - **Dalvik Virtual Machine (DVM)**:这是一个专门为Android设计的虚拟机,用于执行应用程序中的.dex格式的字节码文件。 - **Core Libraries**:这些核心库包含了一系列的标准Java库,以及一些专为Android设计的...

    Java互联网架构多线程并发编程原理及实战 视频教程 下载.zip

    3-2 从字节码角度剖析线程不安全操作.mp4 3-3 原子性操作.mp4 3-4 深入理解synchronized.mp4 3-5 volatile关键字及其使用场景.mp4 3-6 单例与线程安全.mp4 3-7 如何避免线程安全性问题.mp4 4-1 锁的分类.mp4 ...

Global site tag (gtag.js) - Google Analytics