`
xfxlch
  • 浏览: 168360 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

开始使用JAVAP(转自网络)

    博客分类:
  • jvm
 
阅读更多
链接:http://www.boyunjian.com/do/article/snapshot.do?uid=net.csdn.blog%2Fjava169%2Farticle%2Fdetails%2F2460659

大多Java程序员知道他们的程序通常不会被编译为本机代码而是被编译为由java虚拟机(JVM)执行的字节码格式。然而,很少有java程序员曾经看过字节码因为他们的工具不鼓励他们去看。大多Java 调试工具不允许单步执行字节码,它们要么显示源代码行,要么什么也不显示。
幸运的是JDK提供了javap,一个命令行工具,它使得查看字节码很容易。让我们看一个范例: public class ByteCodeDemo {
public static void main(String[] args) {
System.out.println("Hello world");
}
} 在编译这个类后,你可以用十六进制编辑器打开.class文件然后参照虚拟机规范翻译字节码。幸运的是有更简单的方法。JDK包含一个命令行的反汇编器:javap,它可以转换字节码为一种可读的助记符形式,可以像下面这样通过传递'-c'参数给javap得到字节码列表: javap -c ByteCodeDemo

你应该会看到输出类似这样: public class ByteCodeDemo extends java.lang.Object {
public ByteCodeDemo();
public static void main(java.lang.String[]);
}
Method ByteCodeDemo()
0 aload_0
1 invokespecial #1 <Method java.lang.Object()>
4 return
Method void main(java.lang.String[])
0 getstatic #2 <Field java.io.PrintStream out>
3 ldc #3 <String "Hello world">
5 invokevirtual #4 <Method void println(java.lang.String)>
8 return 仅仅从这个短小的列表你可以学到很多字节码的知识。从main方法的第一个指令开始: 0 getstatic #2 <Field java.io.PrintStream out> 开始的整数是方法中的指令的偏移值,因此第一个指令以0开始。紧随偏移量是指令的助记符(mnemonic)。在这个范例中,'getstatic' 指令将一个静态成员压入一个称为操作数堆栈的数据结构,后续的指令可以引用这个数据结构中的成员。getstatic 指令后是要压入的成员。在这个例子中,要压入的成员是"#2 <Field java.io.PrintStream out>" 。如果你直接检查字节码,你会看到成员信息没有直接嵌入指令而是像所有由java类使用的常量那样存储在一个共享池中。将成员信息存储在一个常量池中可以减小字节码指令的大小,因为指令只需要存储常量池中的一个索引而不是整个常量。在这个例子中,成员信息位于常量池中的#2处。常量池中的项目的顺序是和编译器相关的,因此在你的环境中看到的可能不是'#2' 。

分析完第一个指令后很容易猜到其它指令的意思。'ldc' (load constant) 指令将常量"Hello, World."压入操作数栈。'invokevirtual'指令调用println方法,它从操作数栈弹出它的两个参数。不要忘记一个像println这样的实例方法有两个参数:上面的字符串,加上隐含的'this'引用。
字节码如何预防内存错误

Java语言经常被吹捧为开发互联网软件的"安全的"语言。表面上和c 如此相似的代码如何体现安全呢?它引入的一个重要的安全概念是防止内存相关的错误。计算机罪犯利用内存错误在其它情况下安全的程序中插入自己的恶意的代码。Java字节码是第一个可以预防这种攻击的,像下面的范例展示的: public float add(float f, int n) {
return f n;
} 如果你将这个方法加入上面的范例中,重新编译它,然后运行javap,你将看到的字节码类似这个: Method float add(float, int)
0 fload_1
1 iload_2
2 i2f
3 fadd
4 freturn 在方法的开始,虚拟机将方法的参数放入一个称为局部变量表的数据结构中。将像名字暗示的那样,局部变量表也包含了你声明的任何局部变量。在这个例子中,方法以三个局部变量表的项开始,这些都是add方法的参数,位置0保存this引用,而位置1和2分别保存float和int参数。

为了实际的操作这些变量,它们必须被加载(压入)到操作数栈。第一个指令fload_1将位置1处的float压入操作数栈,第二个指令iload_2将位置2处的int压入操作数栈。这些指令的一个引起注意的事情是指令中的'i'和'f'前缀,这说明Java字节码指令是强类型的。如果参数的类型和字节码的类型不匹配,VM将该字节码作为不安全的而加以拒绝。更好的是,字节码被设计为只需在类被加载时执行一次这样的类型安全检查。

这个类型安全是如何加强安全的?如果一个攻击者能够欺骗虚拟机将一个int作为一个float或者相反,它就可以很容易的以一个预期的的方法破坏计算。如果这些计算涉及银行结余,那么隐含的安全性是很明显的。更危险的是欺骗VM将一个int作为一个Object引用。在大多情况下,这将导致VM崩溃,但是攻击者只需要找到一个漏洞。不要忘记攻击者不会手工搜索这个漏洞--写出一个程序产生数以亿计的错误字节码的排列是相当容易的,这些排列试图找到危害VM的幸运的那个。

字节码的另一个内存安全防护是数组操作。'aastore' 和 'aaload' 字节码操作Java数组并且它们总是检查数组边界。如果调用程序越过了数组尾,这些字节码将抛出一个ArrayIndexOutOfBoundsException。也许所有最重要的检查都使用分支指令,例如,以if开始的字节码。在字节码中,分支指令只能转移到同一方法中的其它指令。在方法外可以传递的唯一控制是使它返回:抛出一个异常或者执行一个'invoke'指令。这不仅关闭了很多攻击,同时也防止由于摇荡引用(dangling reference)或者堆栈冲突而引发的令人厌恶的错误。如果你曾经使用系统调试器打开你的程序并定位到代码中的一个随机的位置,那么你会很熟悉这些错误。

所有这些检查中需要记住的重要的一点是它们是由虚拟机在字节码级进行的而不是仅仅由编译器在源代码级进行的。一个例如c 这样的语言的编译器可能在编译时预防上面讨论的某些内存错误,但是这些保护只是在源代码级应用。操作系统将很乐意加载执行任何机器码,无论这些代码是由精细的c 编译器产生的还是心怀恶意的攻击者产生的。简单的讲,C 仅仅是在源代码级上面向对象而Java的面向对象的特性扩展到编译过的代码级。

分析字节码提升代码质量

Java字节码的内存和安全保护无论我们是否注意都是存在地,那么我们为什么还费心查看字节码呢?在很多情况下,知道编译器如何将你的代码转换为字节码可以帮助你写出更高效的代码,而且在某些情况下可以防止不易发觉的错误。考虑下面的例子: //返回 str1 str2 的串连
String concat(String str1, String str2) {
return str1 str2;
}

//将 str2 附加到 str1
void concat(StringBuffer str1, String str2) {
str1.append(str2);
} 猜猜每个方法需要多少个方法调用。现在编译这些方法并且运行javap,你会得到类似下面的输出: Method java.lang.String concat1(java.lang.String, java.lang.String)
0 new #5 <Class java.lang.StringBuffer>
3 dup
4 invokespecial #6 <Method java.lang.StringBuffer()>
7 aload_1
8 invokevirtual #7 <Method java.lang.StringBuffer append(java.lang.String)>
11 aload_2
12 invokevirtual #7 <Method java.lang.StringBuffer append(java.lang.String)>
15 invokevirtual #8 <Method java.lang.String toString()>
18 areturn

Method void concat2(java.lang.StringBuffer, java.lang.String)
0 aload_1
1 aload_2
2 invokevirtual #7 <Method java.lang.StringBuffer append(java.lang.String)>
5 pop
6 return concat1方法执行了5个方法调用s: new, invokespecial和三个invokevirtuals,这比concat2方法执行了更多的工作,后者只执行了一个invokevirtual调用。大多Java程序员已经得到过警告,因为String是不可变的,而使用StringBuffer进行字符串连接效率更高。使用javap分析这个使得这点变得很生动。如果你不能肯定两个语言构造在性能上是否相等,你应该使用javap分析字节码。然而,对just-in-time (JIT)编译器要小心,因为JIT编译器将字节码重新编译为本机代码而能执行一些javap不能揭示的附加优化。除非你有你的虚拟机的源代码,否则你应该补充你的字节码的基准性能分析。

最后的一个范例展示了检查字节码如何帮助防止程序中的错误。像下面那样创建两个类,确保它们在独立的文件中。 public class ChangeALot {
public static final boolean debug=false;
public static boolean log=false;
}

public class EternallyConstant {
public static void main(String [] args) {
System.out.println("EternallyConstant beginning execution");
if (ChangeALot.debug)
System.out.println("Debug mode is on");
if (ChangeALot.log)
System.out.println("Logging mode is on");
}
} 如果你运行EternallyConstant,你会得到信息:

EternallyConstant beginning execution.

现在试着编辑ChangeALot,修改debug和log变量的值为true(两个都为true)。只重新编译ChangeALot。再次运行EternallyConstant,你将看到下面的输出: EternallyConstant beginning execution
Logging mode is on debug变量怎么了?即使你将debug设置为true,信息"Debug mode is on"并没有出现。答案在字节码中。对 EternallyConstant运行javap你会看到: Method void main(java.lang.String[])
0 getstatic #2 <Field java.io.PrintStream out>
3 ldc #3 <String "EternallyConstant beginning execution">
5 invokevirtual #4 <Method void println(java.lang.String)>
8 getstatic #5 <Field boolean log>
11 ifeq 22
14 getstatic #2 <Field java.io.PrintStream out>
17 ldc #6 <String "Logging mode is on">
19 invokevirtual #4 <Method void println(java.lang.String)>
22 return 惊奇吧!在log成员上有一个'ifeq'检查,而代码根本没有检查debug成员。因为debug成员被标记为final类型,编译器知道debug成员在运行时永远不会改变,因此它通过移除'if'声明进行优化。这确实是一个非常有用的优化,因为它允许你在程序中嵌入调试代码而在将它设置为false时不用付出运行时的代价。不幸的是这个优化能够导致主要的编译时混乱。如果你改变一个final成员,你必须记住重新编译任何可能引用该成员的类。这是因为这个'reference'可能已经经过优化了。Java开发环境不能总是发现这个微妙的相关性,一些能导致非常奇怪的错误。因此,古老的C 格言对于java环境仍然有效:"When in doubt, rebuild all."(有疑问,重新编译所有的代码)。

知道一些字节码的知识对于使用java编程的程序员都是有价值的。javap工具使得查看字节码很容易。有时候,使用javap检查你的代码以期提高性能和捕获特殊的不易察觉的错误时是没有用的。

字节码和VM是相当的复杂的,这已经超过这个技巧可以涵盖的范围。要知道更多东西,看看Bill Venners写的《Inside the Java Virtual Machine》(译者注: http://www.artima.com/insidejvm/ed2/ 有该书的1、2、3、4、5、7、8、9和20章的免费html版,英文。)
分享到:
评论

相关推荐

    jdk1.6 windows 64位

    这个是系统的基础类,比如String等都是这里面的,这个package是唯一一个可以不用import就可 以使用的Package java.io: 这里面是所有输入输出有关的类,比如文件操作等 java.net: 这里面是与网络有关的类,比如URL...

    java常量变量表达式

    Java SDK(软件开发工具包)包括Javac编译器、Java解释器、Jdb调试器、Javap反编译器、Javadoc文档生成器以及Appletviewer等工具,用于编写、编译、调试和运行Java程序。 10. 示例代码: ```java public class ...

    Java资源包01

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    21天学通JAVA高清版(护眼绿豆沙底色版)

    要熟练使用Java进行网络编程,还需要掌握Java的网络通信机制,如使用Socket编程。对于企业级应用,需要了解Java EE相关技术,包括Servlet、JSP、JDBC以及企业级的框架如Spring和Hibernate等。而对于移动设备开发,则...

    Java开发环境JDK安装包

    Java开发环境JDK(Java Development Kit)是Oracle公司提供的用于开发和运行Java应用...通过不断学习和实践,你可以掌握更高级的Java技术,如多线程、网络编程、数据库连接、框架使用等,从而在Java开发领域游刃有余。

    Java Development Kit.doc

    自Java发布以来,JDK已经成为全球开发者广泛使用的软件开发工具包(SDK)。JDK包含了一系列必要的工具和库,使得Java程序员能够编写、编译、调试和运行Java程序。 JDK的主要版本包括: 1. **Java Standard Edition...

    java压缩包不用安装

    综上所述,"java压缩包不用安装"意味着用户无需复杂的安装过程,只需解压后配置环境变量,即可开始使用Java开发或运行程序。这使得Java成为开发者和用户友好型的选择,尤其适合跨平台的开发需求。

    21天学通JAVA(高清版PDF)

    Java语言的这些特性为网络编程提供了极大的便利,具有良好的移植性和安全性。Java平台可以根据不同的应用范围分为三个主要版本:JavaSE、JavaEE和JavaME。 JavaSE(Java Standard Edition)是标准版,主要面向桌面...

    21天学通JAVA(高清版)

    整本书的结构和内容编排适合初学者,从零基础开始,逐步引导读者了解Java编程语言的基本概念、语法结构,并通过实例加深理解。对于希望在短时间内快速掌握Java编程的读者来说,这是一本很好的教材。在学习过程中,...

    java开源包8

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    Java2程序设计基础第1章 Java语言入门.ppt

    3. 使用java命令运行编译后的.class文件,程序将开始执行。 1.4 Java语言的跨平台性 Java的跨平台性源于其“一次编写,到处运行”的理念,这得益于Java虚拟机(JVM)。JVM负责解析字节码并将其转换为特定平台的机器...

    2021-2022计算机二级等级考试试题及答案No.14367.docx

    【知识点详解】 ...请注意,这些知识点涵盖了计算机二级考试中的一些常见主题,包括操作系统、编程语言(Java、VBA)、数据库管理(MySQL)、网络协议(TCP)、Web开发(JSP)以及编程概念(面向对象)。

    21天学通JAVA

    《21天学通JAVA》一书旨在为JAVA初学者提供一条清晰的学习路径,通过详细的指导和实践,帮助读者从零开始掌握JAVA编程基础。本书不仅涵盖了JAVA的基础知识,还深入介绍了开发环境的搭建、简单程序的编写与运行,以及...

    java开源包1

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包11

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包2

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包3

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    21天学通java 很好的入门教材,讲解开发环境

    - **简述**:Java是一种广泛应用于网络编程的新一代编程语言,以其简洁性、面向对象特性、平台独立性及安全性著称。Java的设计旨在适应互联网环境的需求,使得开发者能够在不同平台上无缝运行代码。 - **平台分类**...

    java开源包6

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

Global site tag (gtag.js) - Google Analytics