`
nirvana1988
  • 浏览: 137587 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类
最新评论

Java二进制指令代码解析 【转】

    博客分类:
  • JVM
 
阅读更多

         Java源码在运行之前都要编译成为字节码格式(如.class文件),然后由ClassLoader将字节码载入运行。在字节码文件中,指令代码只是其中的一部分,里面还记录了字节码文件的编译版本、常量池、访问权限、所有成员变量和成员方法等信息(详见Java字节码格式详解)。本文主要简单介绍不同Java指令的功能以及在代码中如何解析二进制指令。

        Java指令是基于栈的体系结构,大部分的指令默认的操作数在栈中。映像中ARM是基于寄存器的操作指令,而x86好像是混合寄存器和存储器的,发现基于栈的操作指令确实简单,学起来很快。不过不知道这种操作的效率怎么样,以我自己的推测应该是不太好的。对这方面不太了解,随便扯几句。

Java总共有200多条指令,不过很多都是重复的。我的理解,网络是Java一个非常重要的特性,而且Java在设计之初就认为字节码是要在网络中传输的,为了减少网络传输流量,字节码就要尽量设计精简、紧凑。因而Java增加了很多重复指令,比如尽量减少操作数,因而我们会发现Java的很多指令都是没有操作数的;并且指令中的操作数基本上都是当无法将值放到栈中的数据,比如局部变量的索引号和常量池中的索引号。

还有一点需要注意的是,在运行过程中,所有booleanbytecharshort都是以int类型值存在,因而对这些类型的指令操作很少。然而好像sun实现的虚拟机中。这些类型的数组据说不是以int类型的形式保存的,这个很奇怪。我的理解,以字对齐方式的操作效率会比较高,因而做了这种转换,以空间换时间。

Java指令集(按功能分类)

常量入栈指令

操作码(助记符)

操作数

描述(栈指操作数栈)

aconst_null

 

null值入栈。

iconst_m1

 

-1(int)值入栈。

iconst_0

 

0(int)值入栈。

iconst_1

 

1(int)值入栈。

iconst_2

 

2(int)值入栈。

iconst_3

 

3(int)值入栈。

iconst_4

 

4(int)值入栈。

iconst_5

 

5(int)值入栈。

lconst_0

 

0(long)值入栈。

lconst_1

 

1(long)值入栈。

fconst_0

 

0(float)值入栈。

fconst_1

 

1(float)值入栈。

fconst_2

 

2(float)值入栈。

dconst_0

 

0(double)值入栈。

dconst_1

 

1(double)值入栈。

bipush

valuebyte

valuebyte值带符号扩展成int值入栈。

sipush

valuebyte1

valuebyte2

(valuebyte1 << 8) | valuebyte2 值带符号扩展成int值入栈。

ldc

indexbyte1

常量池中的常量值(int, float, string reference, object reference)入栈。

ldc_w

indexbyte1

indexbyte2

常量池中常量(int, float, string reference, object reference)入栈。

ldc2_w

indexbyte1

indexbyte2

常量池中常量(long, double)入栈。

 

局部变量值转载到栈中指令

操作码(助记符)

操作数

描述(栈指操作数栈)

(wide)aload

indexbyte

从局部变量indexbyte中装载引用类型值入栈。

aload_0

 

从局部变量0中装载引用类型值入栈。

aload_1

 

从局部变量1中装载引用类型值入栈。

aload_2

 

从局部变量2中装载引用类型值入栈。

aload_3

 

从局部变量3中装载引用类型值入栈。

(wide)iload

indexbyte

从局部变量indexbyte中装载int类型值入栈。

iload_0

 

从局部变量0中装载int类型值入栈。

iload_1

 

从局部变量1中装载int类型值入栈。

iload_2

 

从局部变量2中装载int类型值入栈。

iload_3

 

从局部变量3中装载int类型值入栈。

(wide)lload

indexbyte

从局部变量indexbyte中装载long类型值入栈。

lload_0

 

从局部变量0中装载int类型值入栈。

lload_1

 

从局部变量1中装载int类型值入栈。

lload_2

 

从局部变量2中装载int类型值入栈。

lload_3

 

从局部变量3中装载int类型值入栈。

(wide)fload

indexbyte

从局部变量indexbyte中装载float类型值入栈。

fload_0

 

从局部变量0中装载float类型值入栈。

fload_1

 

从局部变量1中装载float类型值入栈。

fload_2

 

从局部变量2中装载float类型值入栈。

fload_3

 

从局部变量3中装载float类型值入栈。

(wide)dload

indexbyte

从局部变量indexbyte中装载double类型值入栈。

dload_0

 

从局部变量0中装载double类型值入栈。

dload_1

 

从局部变量1中装载double类型值入栈。

dload_2

 

从局部变量2中装载double类型值入栈。

dload_3

 

从局部变量3中装载double类型值入栈。

aaload

 

从引用类型数组中装载指定项的值。

iaload

 

int类型数组中装载指定项的值。

laload

 

long类型数组中装载指定项的值。

faload

 

float类型数组中装载指定项的值。

daload

 

double类型数组中装载指定项的值。

baload

 

boolean类型数组或byte类型数组中装载指定项的值(先转换为int类型值,后压栈)。

caload

 

char类型数组中装载指定项的值(先转换为int类型值,后压栈)。

saload

 

short类型数组中装载指定项的值(先转换为int类型值,后压栈)。

 

将栈顶值保存到局部变量中指令

操作码(助记符)

操作数

描述(栈指操作数栈)

(wide)astore

indexbyte

将栈顶引用类型值保存到局部变量indexbyte中。

astroe_0

 

将栈顶引用类型值保存到局部变量0中。

astore_1

 

将栈顶引用类型值保存到局部变量1中。

astore_2

 

将栈顶引用类型值保存到局部变量2中。

astore_3

 

将栈顶引用类型值保存到局部变量3中。

(wide)istore

indexbyte

将栈顶int类型值保存到局部变量indexbyte中。

istore_0

 

将栈顶int类型值保存到局部变量0中。

istore_1

 

将栈顶int类型值保存到局部变量1中。

istore_2

 

将栈顶int类型值保存到局部变量2中。

istore_3

 

将栈顶int类型值保存到局部变量3中。

(wide)lstore

indexbyte

将栈顶long类型值保存到局部变量indexbyte中。

lstore_0

 

将栈顶long类型值保存到局部变量0中。

lstore_1

 

将栈顶long类型值保存到局部变量1中。

lstore_2

 

将栈顶long类型值保存到局部变量2中。

lstroe_3

 

将栈顶long类型值保存到局部变量3中。

(wide)fstore

indexbyte

将栈顶float类型值保存到局部变量indexbyte中。

fstore_0

 

将栈顶float类型值保存到局部变量0中。

fstore_1

 

将栈顶float类型值保存到局部变量1中。

fstore_2

 

将栈顶float类型值保存到局部变量2中。

fstore_3

 

将栈顶float类型值保存到局部变量3中。

(wide)dstore

indexbyte

将栈顶double类型值保存到局部变量indexbyte中。

dstore_0

 

将栈顶double类型值保存到局部变量0中。

dstore_1

 

将栈顶double类型值保存到局部变量1中。

dstore_2

 

将栈顶double类型值保存到局部变量2中。

dstore_3

 

将栈顶double类型值保存到局部变量3中。

aastore

 

将栈顶引用类型值保存到指定引用类型数组的指定项。

iastore

 

将栈顶int类型值保存到指定int类型数组的指定项。

lastore

 

将栈顶long类型值保存到指定long类型数组的指定项。

fastore

 

将栈顶float类型值保存到指定float类型数组的指定项。

dastore

 

将栈顶double类型值保存到指定double类型数组的指定项。

bastroe

 

将栈顶boolean类型值或byte类型值保存到指定boolean类型数组或byte类型数组的指定项。

castore

 

将栈顶char类型值保存到指定char类型数组的指定项。

sastore

 

将栈顶short类型值保存到指定short类型数组的指定项。

 

wide指令

操作码(助记符)

操作数

描述(栈指操作数栈)

wide

 

使用附加字节扩展局部变量索引(iinc指令特殊)。

 

通用(无类型)栈操作指令

操作码(助记符)

操作数

描述(栈指操作数栈)

nop

 

空操作。

pop

 

从栈顶弹出一个字长的数据。

pop2

 

从栈顶弹出两个字长的数据。

dup

 

复制栈顶一个字长的数据,将复制后的数据压栈。

dup_x1

 

复制栈顶一个字长的数据,弹出栈顶两个字长数据,先将复制后的数据压栈,再将弹出的两个字长数据压栈。

dup_x2

 

复制栈顶一个字长的数据,弹出栈顶三个字长的数据,将复制后的数据压栈,再将弹出的三个字长的数据压栈。

dup2

 

复制栈顶两个字长的数据,将复制后的两个字长的数据压栈。

dup2_x1

 

复制栈顶两个字长的数据,弹出栈顶三个字长的数据,将复制后的两个字长的数据压栈,再将弹出的三个字长的数据压栈。

dup2_x2

 

复制栈顶两个字长的数据,弹出栈顶四个字长的数据,将复制后的两个字长的数据压栈,再将弹出的四个字长的数据压栈。

swap

 

交换栈顶两个字长的数据的位置。Java指令中没有提供以两个字长为单位的交换指令。

 

类型转换指令

操作码(助记符)

操作数

描述(栈指操作数栈)

i2f

 

将栈顶int类型值转换为float类型值。

i2l

 

将栈顶int类型值转换为long类型值。

i2d

 

将栈顶int类型值转换为double类型值。

f2i

 

将栈顶float类型值转换为int类型值。

f2l

 

将栈顶float类型值转换为long类型值。

f2d

 

将栈顶float类型值转换为double类型值。

l2i

 

将栈顶long类型值转换为int类型值。

l2f

 

将栈顶long类型值转换为float类型值。

l2d

 

将栈顶long类型值转换double类型值。

d2i

 

将栈顶double类型值转换为int类型值。

d2f

 

将栈顶double类型值转换为float类型值。

d2l

 

将栈顶double类型值转换为long类型值。

i2b

 

将栈顶int类型值截断成byte类型,后带符号扩展成int类型值入栈。

i2c

 

将栈顶int类型值截断成char类型值,后带符号扩展成int类型值入栈。

i2s

 

将栈顶int类型值截断成short类型值,后带符号扩展成int类型值入栈。

 

整数运算

操作码(助记符)

操作数

描述(栈指操作数栈)

iadd

 

将栈顶两int类型数相加,结果入栈。

isub

 

将栈顶两int类型数相减,结果入栈。

imul

 

将栈顶两int类型数相乘,结果入栈。

idiv

 

将栈顶两int类型数相除,结果入栈。

irem

 

将栈顶两int类型数取模,结果入栈。

ineg

 

将栈顶int类型值取负,结果入栈。

ladd

 

将栈顶两long类型数相加,结果入栈。

lsub

 

将栈顶两long类型数相减,结果入栈。

lmul

 

将栈顶两long类型数相乘,结果入栈。

ldiv

 

将栈顶两long类型数相除,结果入栈。

lrem

 

将栈顶两long类型数取模,结果入栈。

lneg

 

将栈顶long类型值取负,结果入栈。

(wide)iinc

indexbyte

constbyte

将整数值constbyte加到indexbyte指定的int类型的局部变量中。

 

浮点运算

操作码(助记符)

操作数

描述(栈指操作数栈)

fadd

 

将栈顶两float类型数相加,结果入栈。

fsub

 

将栈顶两float类型数相减,结果入栈。

fmul

 

将栈顶两float类型数相乘,结果入栈。

fdiv

 

将栈顶两float类型数相除,结果入栈。

frem

 

将栈顶两float类型数取模,结果入栈。

fneg

 

将栈顶float类型值取反,结果入栈。

dadd

 

将栈顶两double类型数相加,结果入栈。

dsub

 

将栈顶两double类型数相减,结果入栈。

dmul

 

将栈顶两double类型数相乘,结果入栈。

ddiv

 

将栈顶两double类型数相除,结果入栈。

drem

 

将栈顶两double类型数取模,结果入栈。

dneg

 

将栈顶double类型值取负,结果入栈。

 

逻辑运算——移位运算

操作码(助记符)

操作数

描述(栈指操作数栈)

ishl

 

左移int类型值。

lshl

 

左移long类型值。

ishr

 

算术右移int类型值。

lshr

 

算术右移long类型值。

iushr

 

逻辑右移int类型值。

lushr

 

逻辑右移long类型值。

 

逻辑运算——按位布尔运算

操作码(助记符)

操作数

描述(栈指操作数栈)

iand

 

int类型按位与运算。

land

 

long类型的按位与运算。

ior

 

int类型的按位或运算。

lor

 

long类型的按位或运算。

ixor

 

int类型的按位异或运算。

lxor

 

long类型的按位异或运算。

 

控制流指令——条件跳转指令

操作码(助记符)

操作数

描述(栈指操作数栈)

ifeq

branchbyte1

branchbyte2

若栈顶int类型值为0则跳转。

ifne

branchbyte1

branchbyte2

若栈顶int类型值不为0则跳转。

iflt

branchbyte1

branchbyte2

若栈顶int类型值小于0则跳转。

ifle

branchbyte1

branchbyte2

若栈顶int类型值小于等于0则跳转。

ifgt

branchbyte1

branchbyte2

若栈顶int类型值大于0则跳转。

ifge

branchbyte1

branchbyte2

若栈顶int类型值大于等于0则跳转。

if_icmpeq

branchbyte1

branchbyte2

若栈顶两int类型值相等则跳转。

if_icmpne

branchbyte1

branchbyte2

若栈顶两int类型值不相等则跳转。

if_icmplt

branchbyte1

branchbyte2

若栈顶两int类型值前小于后则跳转。

if_icmple

branchbyte1

branchbyte2

若栈顶两int类型值前小于等于后则跳转。

if_icmpgt

branchbyte1

branchbyte2

若栈顶两int类型值前大于后则跳转。

if_icmpge

branchbyte1

branchbyte2

若栈顶两int类型值前大于等于后则跳转。

ifnull

branchbyte1

branchbyte2

若栈顶引用值为null则跳转。

ifnonnull

branchbyte1

branchbyte2

若栈顶引用值不为null则跳转。

if_acmpeq

branchbyte1

branchbyte2

若栈顶两引用类型值相等则跳转。

if_acmpne

branchbyte1

branchbyte2

若栈顶两引用类型值不相等则跳转。

 

控制流指令——比较指令

操作码(助记符)

操作数

描述(栈指操作数栈)

lcmp

 

比较栈顶两long类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈。

fcmpl

 

比较栈顶两float类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。

fcmpg

 

比较栈顶两float类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。

dcmpl

 

比较栈顶两double类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。

dcmpg

 

比较栈顶两double类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。

 

控制流指令——无条件跳转指令

操作码(助记符)

操作数

描述(栈指操作数栈)

goto

branchbyte1

branchbyte2

无条件跳转到指定位置。

goto_w

branchbyte1

branchbyte2

branchbyte3

branchbyte4

无条件跳转到指定位置(宽索引)。

 

控制流指令——表跳转指令

操作码(助记符)

操作数

描述(栈指操作数栈)

tableswitch

<0-3bytepad>

defaultbyte1

defaultbyte2

defaultbyte3

defaultbyte4

lowbyte1

lowbyte2

lowbyte3

lowbyte4

highbyte1

highbyte2

highbyte3

highbyte4

jump offsets...

通过索引访问跳转表,并跳转。

lookupswitch

<0-3bytepad>

defaultbyte1

defaultbyte2

defaultbyte3

defaultbyte4

npairs1

npairs2

npairs3

npairs4

match offsets

通过键值访问跳转表,并跳转。

 

控制流指令——异常和finally

操作码(助记符)

操作数

描述(栈指操作数栈)

athrow

 

抛出异常。

jsr

branchbyte1

branchbyte2

跳转到子例程序。

jsr_w

branchbyte1

branchbyte2

branchbyte3

branchbyte4

跳转到子例程序(宽索引)。

(wide)ret

indexbyte

返回子例程序。

 

对象操作指令

操作码(助记符)

操作数

描述(栈指操作数栈)

new

indexbyte1

indexbyte2

创建新的对象实例。

checkcast

indexbyte1

indexbyte

类型强转。

instanceof

indexbyte1

indexbyte2

判断类型。

getfield

indexbyte1

indexbyte2

获取对象字段的值。

putfield

indexbyte1

indexbyte2

给对象字段赋值。

getstatic

indexbyte1

indexbyte2

获取静态字段的值。

putstatic

indexbyte1

indexbyte2

给静态字段赋值。

 

数组操作指令

操作码(助记符)

操作数

描述(栈指操作数栈)

newarray

atype

创建type类型的数组。

anewarray

indexbyte1

indexbyte2

创建引用类型的数组。

arraylength

 

获取一维数组的长度。

multianewarray

indexbyte1

indexbyte2

dimension

创建dimension维度的数组。

 

方法调用指令

操作码(助记符)

操作数

描述(栈指操作数栈)

invokespecial

indexbyte1

indexbyte2

编译时方法绑定调用方法。

invokevirtual

indexbyte1

indexbyte2

运行时方法绑定调用方法。

invokestatic

indexbyte1

indexbyte2

调用静态方法。

invokeinterface

indexbyte1

indexbyte2

count

0

调用接口方法。

 

方法返回指令

操作码(助记符)

操作数

描述(栈指操作数栈)

ireturn

 

返回int类型值。

lreturn

 

返回long类型值。

freturn

 

返回float类型值。

dreturn

 

返回double类型值。

areturn

 

返回引用类型值。

return

 

void函数返回。

 

线程同步指令

操作码(助记符)

操作数

描述(栈指操作数栈)

monitorenter

 

进入并获得对象监视器。

monitorexit

 

释放并退出对象监视器。

分享到:
评论

相关推荐

    X86指令解析-java实现

    在IT领域,X86指令集是Intel和AMD等处理器制造商设计的一种用于32位和...它要求开发者具备深厚的X86指令集知识、理解二进制数据处理和熟练的Java编程能力。这个项目的结果不仅有助于提升个人技能,也有实际的应用价值。

    Bz1621.lzh二进制编译器

    首先,它会解析输入的二进制数据,理解其中的指令和数据结构。由于二进制代码是机器语言,编译器需要精确地知道每一段数据的含义,这通常涉及到对特定处理器架构或指令集的深入理解。例如,对于X86架构,编译器需要...

    Java实现斑马打印机ZPL指令打印,源码,可运行

    2. **ZPL语言**:ZPL是斑马打印机的二进制指令集,它包含一系列预定义的命令,如^FO(定位)、^A(字体设置)、^B(条形码设置)等。开发者需要理解这些指令的含义和用法,才能正确生成ZPL字符串。 3. **网络通信**...

    BinVerter:一个开源的二进制到文本、十进制到二进制等的转换器,用 Java 制作

    二进制转换是计算机科学的基础,因为计算机内部所有的数据和指令都是以二进制(0和1)的形式表示的。二进制到文本的转换通常涉及到将二进制序列解析为ASCII或Unicode字符,这对于理解二进制数据的含义至关重要。另一...

    进制转换器源码

    - **二进制(Binary)**:计算机内部的所有数据和指令都是以二进制形式表示的,因为电路的开和关状态可以对应0和1。 - **八进制(Octal)**:早期的计算机系统中,八进制用于简化二进制的表示,因为8是2的幂,每三...

    ESC/POS指令集完整版

    本篇文章将根据提供的部分指令内容进行深入解析,包括水平制表符(Horizontal Tab, HT)、打印并换行(Print and Line Feed, LF)以及在页面模式下打印并返回标准模式(Print and Return to Standard Mode in Page ...

    汇编进制转换 8到十 十到16

    常见的进制包括二进制、八进制、十进制和十六进制等。进制转换的基本原理是利用基数的概念。例如,将一个八进制数转换为十进制数时,可以将每个位上的数字乘以相应的权重(即该位对应的8的幂次方),然后相加得到...

    Android-Java代码解析class文件

    class文件是Java源代码经过JVM(Java Virtual Machine)编译后的二进制格式,它包含了类的结构、方法、变量等信息。本篇文章将详细探讨如何解析这些class文件,以及在Android开发中可能遇到的相关问题。 1. **Java...

    十六进制编辑器程序

    源代码是程序的基础,它是由程序员编写的,用特定编程语言(如C、C++、Java等)书写的指令集合。"十六进制编辑器程序源代码"意味着我们可以看到这个编辑器是如何被构建的,包括其内部逻辑、数据结构和算法。通过研究...

    从二进制到数据结构

    在计算机内存中,所有的信息——无论是文本、图像还是程序指令——都被转化为二进制形式存储和处理。 数据结构是组织和管理数据的一种方式,它定义了数据的逻辑结构以及操作这些数据的方法。常见的数据结构包括数组...

    Java字节码(.class文件)格式详解((转载)

    三、Java二进制指令代码解析 `.docx`文档可能详细解析了Java字节码中的各个指令,包括它们的编码、含义、操作数和实际应用。通过阅读这份文档,你可以深入理解JVM如何执行字节码,以及如何通过反编译工具如jad、 ...

    CLASS转JAVA

    "CLASS转JAVA"工具就是这样的一个反编译器,它能解析.class文件,理解其中的指令和常量池,并将其转换为接近原始的.java源代码。 3. **.jar文件的处理**: `.jar`文件是Java的归档文件格式,它包含了一个或多个`....

    Java版DLT645-2007电能表协议解析源码(串口协议解析)

    2. **数据帧解析**:解析接收到的原始二进制数据,根据协议规定将它们拆分成各个字段。这通常涉及位操作和字节序转换,因为电能表返回的数据可能是大端或小端格式。 3. **命令编码与解码**:协议中定义了一系列的...

    Java-JVM指令手册(2022最新版,中文全解析)

    1. **字节码**:Java源代码被编译成一种平台无关的二进制格式,称为字节码。这种中间表示允许JVM在任何支持它的操作系统上运行Java程序。 2. **类加载机制**:JVM通过类加载器将类的字节码加载到内存中。这包括启动...

    java类库源码-Java-Decompiler:我正在编写一个库,用于从已编译的二进制Java代码中检索源代码。目前适用于基本领域和类结构。

    在Java编程中,有时我们可能需要查看或理解已编译的二进制类文件的源代码,特别是在处理第三方库或者遇到没有提供源代码的jar文件时。Java Decompiler(JD)就是这样一个工具,它能够从字节码反编译出接近原始的Java...

    java代码反编译器

    总的来说,Java代码反编译器是Java开发和调试工具箱中的重要组成部分,它们帮助开发者在缺乏源代码的情况下理解二进制代码,或者用于研究和学习已编译的库和框架。尽管反编译的代码可能无法完全恢复到原始的编写形式...

    java代码-11,张国富,十进制二

    在提供的文件`main.java`中,可能包含了使用上述方法之一进行十进制到二进制转换的Java代码实现。同时,`README.txt`文件很可能是对代码的解释或使用说明,包括如何运行程序以及程序预期的结果。 在学习和理解这段...

    电子-hex2bin.rar

    - 在编程中,开发者可能需要将十六进制字符串解析为二进制数据,用于内存操作、网络通信或文件读写。 - 在硬件设计中,十六进制代码常用来表示微处理器的指令集,hex2bin工具可以帮助将这些指令转换为实际的机器码...

    rtcm2.3解码器

    它可能包含解析二进制数据的方法,因为RTCM信息通常是二进制格式,以及处理不同类型的RTCM消息结构的代码。 而`RtcmH.java`可能代表"RTCM Header"或者"Handler",它专注于处理RTCM消息头和具体的数据内容。RTCM消息...

    bin-kon:二进制转换器

    二进制能够表示任何数字、字符甚至指令,是计算机内部运算的基本单位。 **转换基础知识** 二进制转换器通常支持以下几种转换: 1. **二进制转十进制**: 十进制是我们日常生活中使用的数制,有0-9十个数字。将二...

Global site tag (gtag.js) - Google Analytics