`
wangzl2222
  • 浏览: 150911 次
  • 性别: Icon_minigender_1
  • 来自: 苏州
社区版块
存档分类
最新评论

java字节码

    博客分类:
  • java
阅读更多
这一两年,在JVM上使用其他替代语言越来越热门了。现在至少有三门语言有幸在Java Community Process中得到了官方认可:JRubyGroovyBean-Shell。另外,代号为野马(Mustang)Java 6发布了包含了一个专为封装不同脚本引擎的API层,就像JDBC访问数据库的模式一样。再加上Java版本5也在语言本身上做了很大的调整。总之,就像我之前翻译的一篇BLOG一样,Java平台的编程语言的前景已经发生了巨大的改变。虽然如此,只有一样东西没有变,它是所有这些语言的基础,无论这些语言有多么吸引人的特性和功能,最终都会在JVM的混合语言中运行,即JVM字节码。这又提起了我在JVM/Java字节码方面的兴趣。所以书写本文,在其中将介绍JVM字节码集合,用一些代码来描述它的工作方式,也将介绍一些可以直接操纵字节码的工具。
 
首先我要说明的是,直接了解JVM字节码感觉是奇怪的事情,因为我们总不可能自己来书写字节码。但是,我们如果知道编译器干了些什么可能会更好一点。比如,你肯定想知道编译后的StringBufferString的区别、编译器到底有没有给你加上默认构造函数……当你了解了JVM字节码——这是我看见过的最简单的“可装配语言”——你就能够验证你的这些假设是否正确。
 
 
分解Java
考虑到大家对Java都已经比较熟悉了,所以我们这样开始可能比较容易:我们从编译后的Java代码开始,然后对其进行分解。这样可能比一开始就直接讲述Java字节码的规则要好一些。我们先从最简单的Hello World程序开始。
 
public class HelloWorld
{
        public static void main(String[] args)
        {
               System.out.println("Hello, world!");
        }
}
 
我们通过两种方式来一起研究Java字节码。第一个是太久时间都没有见到过的javapjavap是字节码分解器,意思就是它编译.class文件并将文件结构输出到控制台,其中包括组成方法的字节码。如下例:
 
$ javap -verbose -c -private HelloWorld
Compiled from "HelloWorld.java"
public class HelloWorld extends java.lang.Object
        SourceFile: "HelloWorld.java"
        minor version: 0
        major version: 50
        Constant pool:
const #1 = Method #6.#15; // java/lang/Object."<init>":()V
const #2 = Field #16.#17; // java/lang/System.out:Ljava/io/PrintStream;
const #3 = String #18; // Hello, world!
const #4 = Method #19.#20; // java/io/PrintStream.println:(Ljava/lang/String;)V
const #5 = class #21; // HelloWorld
const #6 = class #22; // java/lang/Object
const #7 = Asciz <init>;
const #8 = Asciz ()V;
const #9 = Asciz Code;
const #10 = Asciz LineNumberTable;
const #11 = Asciz main;
const #12 = Asciz ([Ljava/lang/String;)V;
const #13 = Asciz SourceFile;
const #14 = Asciz HelloWorld.java;
const #15 = NameAndType #7:#8;// "<init>":()V
const #16 = class #23; // java/lang/System
const #17 = NameAndType #24:#25;// out:Ljava/io/PrintStream;
const #18 = Asciz Hello, world!;
const #19 = class #26; // java/io/PrintStream
const #20 = NameAndType #27:#28;// println:(Ljava/lang/String;)V
const #21 = Asciz HelloWorld;
const #22 = Asciz java/lang/Object;
const #23 = Asciz java/lang/System;
const #24 = Asciz out;
const #25 = Asciz Ljava/io/PrintStream;;
const #26 = Asciz java/io/PrintStream;
const #27 = Asciz println;
const #28 = Asciz (Ljava/lang/String;)V;
 
{
public HelloWorld();
        Code:
               Stack=1, Locals=1, Args_size=1
               0: aload_0
               1: invokespecial #1; //Method java/lang/Object."<init>":()V
               4: return
 
        LineNumberTable:
               line 1: 0
 
public static void main(java.lang.String[]);
        Code:
               Stack=2, Locals=1, Args_size=1
               0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
               3: ldc #3; //String Hello, world!
               5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
               8: return
        LineNumberTable:
               line 5: 0
               line 6: 8
}
 
 
在刚才讲述的.class文件实际并不准确,JVM无所谓输入的二进制流从哪儿来,只不过因为我们的习惯和JDK 1.0的发布所以我们说成是.class文件。所以,所谓的“.class文件”应该被理解为符合JVM标准的二进制格式流。
 
上面我们使用了javap。其中,-c指示需要显示方法字节码;-private指示无论可访问性显示所有成员;-verbose是需要显示类的常量池。检查HelloWorld分解后的内容,会觉得非常有趣,我们立马就可以验证一些假设。例如,第一,如果类没有显式声明其父类的话,它将继承于java.lang.Object。第二,javap也验证了如果类中没有显式声明构造函数的话,编译器会插入一个缺省无参的构造函数(构造函数在JVM级别是显示成<init>的普通函数)
 
加上了-verbose选项的javap输出中一个重要的部分就是常量池。每个类都会有个常量池,所有的常量——比如字符串、类名、方法名、属性名——都是保存在类的中心位置,通过对该池的索引进行参照访问。通常,这些特殊的细节内容都是由工具来处理的,这也是javap通过注释来显示这些常量值的原因。但是这些内容对我们认识常量池非常有用,也能够简化我们对分解代码的理解。例如,第5行代码System.out.println("Hello, world!");它调用了println方法,显示在常量池的编号为4的分片(const #4),它依次由编号为19的分片和编号为20的分片组成(const #4 = Method #19.#20;),这样就最终解决了java.io.PrintStream.println(String[])的问题。你可以参照JVM标准来了解所有不同的常量类型以及他们在.class文件中的格式。
 
在这里,我们主要来分析自动生成的HelloWorld构造函数:
 
public HelloWorld();
        Code:
               Stack=1, Locals=1, Args_size=1
               0: aload_0
               1: invokespecial #1; //Method java/lang/Object."<init>":()V
               4: return
        LineNumberTable:
               line 1: 0
 
JVM中,所有字节码都是通过一个基本的原则来进行堆栈操作的:每个操作符可能会消费一个或多个操作计数,并可能最后将一个操作计数推送到执行堆栈。需要注意的是,每个分片(slot)都是32位的,这就意味着long或者是double的值会消耗两个分片(slot)(很多人认为这个是JVM实现中的最大缺憾)。另外,每个方法都会有一个本地的结合,本地变量和参数都在此保存。因此,例如“aload_0”指示符将第一个参数带入方法,并将其推送至执行堆栈。“invokespecial”指示符,不言而喻,它将调用实例的方法,但是忽略传统的动态绑定(因为我们显示调用基类版本的覆盖方法,该特殊的操作符用在父“super”调用)。因为Object的构造函数需要一个参数(this指针),所以它将消耗执行堆栈中的一个分片(记住,这是我们刚才推送的参数——this指针,指向我们自己的实例的this指针),而且它不返回任何值(最后有一个V),当方法返回时它将不往堆栈内推送任何内容。此时,HelloWorld的构造函数已完成任务,所以它通过“return”操作符进行简单返回。
 
我们接下来在看看写在HelloWorld里面的主方法(main)
 
public static void main(java.lang.String[]);
        Code:
               Stack=2, Locals=1, Args_size=1
               0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
               3: ldc #3; //String Hello, world!
               5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
               8: return
        LineNumberTable:
               line 5: 0
               line 6: 8
 
因为它是静态方法,所以最显著的区别就是第一个参数并不是this指针,除此之外,它和HelloWorld的构造函数看起来都差不多。第一个操作符“getstatic”将获取一个static区域并将其值推送至堆栈中,在本例中是System.out的引用,由#2常量池分片描述,并在操作符后使用注释显示。接下来,就对字符串“Hello, World!”进行加载,它在#3常量池分片中存储。通过堆栈上的两个引用,我们就可以调用“invokevirtualPrintStream.println(String[])方法了。因其需要一个参数,再加上调用该方法需要的初始this引用,我们刚才推送至堆栈的这两项就被消费了,println(String[])不返回任何值,所以完成后堆栈上就为空了。一个简单的“return”操作符中止了该方法,任务完成了。

from http://blog.csdn.net/BU_BetterYou/archive/2008/06/16/2553108.aspx

 

分享到:
评论

相关推荐

    轻松看懂Java字节码.pdf

    标题《轻松看懂Java字节码.pdf》中隐藏的知识点是理解Java字节码的重要性及如何轻松掌握。描述中提到Java字节码是实现“一次编写,到处运行”(Write Once, Run Anywhere)这一Java承诺的核心技术之一。而标签“Java...

    Java字节码转换工具—Retrotranslator

    Java字节码转换工具Retrotranslator是一个用于解决软件兼容性问题的实用工具,尤其是在Java版本升级带来的不兼容性上。随着Java技术的不断迭代,新版本的特性常常不能在旧版本的JDK环境下运行,而Retrotranslator的...

    class运行器v6(可以运行java字节码文件的工具 含代码)

    标题中的“class运行器v6”是一个用于执行Java字节码文件的应用程序,它允许用户在没有完整Java环境的情况下运行单个.class文件。这个工具可能是由开发者为了方便测试或教学目的而创建的,特别是对于那些不熟悉或者...

    java字节码文件查看工具,查看class文件

    Java字节码文件查看工具,如JD-GUI,是开发者们深入理解Java应用程序内部机制的重要辅助工具。这类工具能够帮助我们查看并分析.class文件,这些文件是Java源代码经过编译后的二进制形式,包含了运行时所需的所有指令...

    java字节码加密

    Java字节码加密是保护Java应用程序源代码安全的重要技术手段,主要是为了防止恶意用户逆向工程分析、篡改或盗取程序的核心逻辑。在Java中,字节码(Bytecode)是程序经过编译后的中间表示,可以直接由Java虚拟机...

    java字节码编辑器

    Java字节码编辑器是一种工具,它允许开发者直接编辑Java程序编译后的`.class`文件,而不是反编译后再重新编译。这种编辑器对于理解、调试和优化Java代码非常有用,尤其是对于那些无法访问源代码或者需要进行底层操作...

    Java 字节码概述

    Java 字节码概述 Java 字节码是 Java 虚拟机(JVM)执行 Java 语言编译后的结果。Java 字节码是一种平台无关的中间形式,能够在不同的操作系统和硬件平台上运行。Java 字节码的执行是由 JVM 负责的,它将字节码翻译...

    Java字节码优化框架

    Java字节码优化框架,如Soot,是用于提升Java程序性能的重要工具。Soot作为一个独立的工具,能够对Java字节码进行优化和检查,同时也为开发者提供了一个框架,以便于在字节码级别设计和实现优化策略。这个框架支持...

    java字节码分析工具

    Java字节码分析工具,系统分析了java字节码文件,即java class类文件,对该文件中的各种成分以树的形式描述出来,只能针对未加密的class文件,一般由标准java编译器编译生成的class文件都未加密,该系统在vs2003下面...

    Java字节码简单说明.docx

    Java 字节码简单说明 Java 字节码是 Java 跨平台的基础,它使得 Java 程序可以在不同的平台上运行,而不需要重新编译。Java 字节码是平台无关性的基石,也是语言无关性的基础。 Class 文件结构是 Java 字节码的...

    JByteMod-1.6.1(java字节码编辑器)简介及下载

    使用JByteMod需要一定的Java字节码知识,但它的直观界面和丰富的功能使得这个过程相对平易近人。无论是开发、调试还是研究,JByteMod都是一个强大的工具,能够帮助开发者更深入地理解和操作Java程序。

    Java字节码(.class文件)格式详解((转载)

    Java字节码是Java程序在运行时被JVM(Java虚拟机)解释执行的一种中间语言。每个Java类都由一个`.class`文件表示,其中包含了编译后的字节码指令。`.class`文件的结构非常严谨,它不仅包含了类的信息,如类名、方法...

    JAVA字节码JAVA字节码.doc

    Java 字节码编程 Java 字节码是 Java 程序的中间表示形式,它可以被 Java 虚拟机(JVM)解释执行。了解 Java 字节码可以帮助开发者更好地理解 Java 程序的执行机制,提高程序的执行效率和排除错误。 一、Java 类...

    java字节码.docx

    Java 字节码解读 Java 字节码是一种中间形式的代码,它是 Java 源代码编译后的结果。Java 字节码是平台独立的,可以在任何支持 Java 的设备上运行。Java 字节码的结构主要包括魔数、主版本号、次版本号、常量池、...

    javassist, Java字节码工程工具包.zip

    javassist, Java字节码工程工具包 Java字节码工程工具包 版本 3版权所有( C ) 1999 -2017按 Shigeru Chiba,保留所有权利。Javassist ( Java编程助手) 使Java字节码操作简单。 它是一个类库,用于在Java中编辑字节码

    从一个class文件深入理解Java字节码结构

    【Java字节码结构解析】 Java程序在执行时,首先需要通过Java编译器将源代码(.java文件)编译成二进制的字节码文件(.class文件),这些字节码由Java虚拟机(JVM)解析并执行。深入理解字节码结构有助于我们了解...

    Java 字节码简单说明.zip

    Java字节码是Java编程语言的一个重要特性,它在Java程序执行过程中扮演着核心角色。本文将深入探讨Java字节码的基本概念、作用以及其在Java虚拟机(JVM)中的运行机制。 Java字节码是一种低级的、平台无关的指令集...

    JAVA字节码操作库 BCEL

    **JAVA字节码操作库 BCEL** BCEL(Byte Code Engineering Library)是Java开发的一个重要工具,主要用于处理Java字节码。它为开发者提供了一种深入理解与操作Java类文件的底层机制,允许分析、创建、修改和优化字节...

    一种有效保护Java字节码的方法

    Java字节码保护方法知识点总结: 1. Java语言的安全性问题:Java程序的源代码首先被编译成字节码,再由Java虚拟机(JVM)执行。这种特性虽然方便了跨平台的运行,但同时也使得字节码文件相对容易被反编译,暴露出源...

Global site tag (gtag.js) - Google Analytics