`
zhaohaolin
  • 浏览: 1011413 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Java虚拟机的研究与实现(图文)

    博客分类:
  • JVM
阅读更多

引言

Java 虚拟机本质是就是一个程序,当它在命令行上启动的时候,就开始执行保存在某字节码文件中的指令。Java 语言的可移植性正是建立在Java 虚拟机的基础上。任何平台只要装有针对于该平台的Java 虚拟机,字节码文件(.class)就可以在该平台上运行。这就是“一次编译,多次运行”。

kaffe虚拟机的简要分析

kaffe虚拟机采用了模块化的程序设计思想,它由多个独立的子系统组成。从功能模块上来分它主要分为:虚拟机总体驱动模块,类装载器模块,类执行模块, 数据区管理模块,内存管理模块,本地支持模块等等。kaffe虚拟机简要的程序流程图如图1所示。

 

图1:kaffe虚拟机简要的程序流程图

Java 虚拟机的实现

Java 源程序的执行过程为: Java 源程序(.java)经过Java 编译器编译生成字节码文件(.class),然后由类装载器将字节码文件装载到方法区中,然后进行连接验证,由Java 虚拟机读取字节码,转换为特定平台的指令,并且在对应的CPU中执行。

本实现中采用的流程框架如下图所示:

 

图2:本实现的主要框架

1、类装载、连接及初始化

类文件包括:魔数(magic),次、主版本号,常量池,类或接口访问修饰符,常量池索引(this_class和super_class),接口表,域表,方法表,类或接口的属性信息。其中最复杂的内容是常量池,它类似于传统语言编译过程中用到的符号表。

从原始的class文件到可以被Java 虚拟机执行的内部数据格式,需要经过装载、连接和初始化这3个阶段。

装载是将class文件通过类装载器装载到在逻辑上被称为方法区的内存单元中的过程。

连接又分为三个步骤:验证,准备和解析。验证是对字节码的验证,可根据具体情况来确定被装载的类是否符合Java 虚拟机规范中规定的class文件格式,并确保它不会破坏Java 虚 拟机的完整性。包括(1)类装载过程中的验证; (2) 检查class文件内部的连贯性,一旦发现class文件格式存在一处错误,则抛出VerifyError异常或ClassFormatError异常。 确保每个final类不含有子类,final方法不能被覆盖,以及常量池中所有的域引用和方法引用有有效的名字和类型描述符号;(3) 对字节码流使用一个数据流分析器进行验证。准备步骤的任务是创建域表,并设置域初值。解析步骤是将类中的常量池中的类、接口、字段和方法的符号引用替换成 直接引用,以达到更快地访问数据的目的。

在初始化阶段,Java 虚拟机设计者需要将类变量赋予正确的初始值。

class文件经过上述三个阶段的处理,虚拟机就获得了该类的所有信息并且表示成能够容易操作的内部数据格式,从而为方法的运行作好了充分的准备。

2、及时编译器

任何Java 虚 拟机实现的核心都是它的执行引擎。在由软件实现的虚拟机中,执行引擎主要有一次性解释字节码、及时编译器、自适应优化编译器三种方式。本实现采用了及时编 译的方式,它的特点是第一次被执行的机器码会被编译成本地机器码。及时编译器将引入的字节码翻译成本地机器码,然后直接执行机器码指令而不是解释字节码。 机器码指令保存在内存中,由于在运行过程中编译的结果不被保存, 所以程序下一次运行时,字节码将再一次被翻译成机器码。

如果一装载完字节码文件中的Java 方 法后,就对其进行编译,则有点处理不恰当,因为还不清楚是否需要执行该方法。编译一个不需要执行的方法,将带来不必要的空间和时间上的损失。 因此虚拟机设计者需要采用一种优化方案,即只有需要被执行的方法才能被JIT编译,这个问题可以参照kaffe虚拟机中的trampoline来解决。

JIT实现步骤:(1)对字节码进行验证并且划分基本块;(2)产生四元式;(3)根据四元式生成本地机器码;(4)操作数地址回填。

图3:及时编译器的流程图

在字节码指令模拟操作的时候,按其语义动作生成指令属性四元式序列,指令属性四元式的结构为:(目的操作数,源操作数1,源操作数2,语义动作),四元式数据结构如下:

typedef struct Sequence{ void (*func)(struct Sequence*); //语义动作 union{  jvalue value;  struct _label_ *labconst; //标号类型操作数  Method *methconst; //方法地址操作数  struct slotData **smask;  struct slotData *slot; //槽操作数 }u[3]; uint8 type; //Sequence类型 uint8 refered; //该四元式的引用 struct Sequence *next; //下一个四元式}Sequence; 


其中目的操作数为Sequence.u[0],源操作数1为Sequence.u[1],源操作数2为Sequence.u[2]。

Sequence.func则代表语义动作,它主要用于生成该Sequence语义的本地机器码。

指令属性四元组建立后就进入代码生成阶段,属性四元组在形式上已经非常接近本地机器指令,只需要遍历该属性序列,执行相应的语义动作函数,即可生成机器指令。语义动作函数的功能包括操作数寻址、寄存器分配、建立指令连接以及本地机器码生成等。

在及时编译过程中要经常使用到操作数栈,虚拟机把操作数栈作为它的工作区。大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。而操作数栈区,局部变量区和帧数据区被包含在方法帧中。方法帧的数据结构如下:

typedef struct Frame{ struct Frame *prev; // 上一帧 struct Frame *next; // 下一帧 value_t *sp; // 栈槽指针 uint8 *pc; // 程序计数器 method_t *method; //指向正在被执行的方法 class_t *class_ptr; // 指向包含该方法的类 value_t locals[1]; //方法的局部变量的起始}Frame; 


本实现中的及时编译器的优点表现在:(1)大大提高了Java 应用程序运行的速度;(2)编译过程只在运行时进行,不会改动Java 字节码,不会影响Java 程序的可移植性;(3)对字节码的编译,使得许多优化手段的采用成为可能。缺点表现在:(1)如果对所有方法进行编译,则会占用大量的内存空间;(2)及时编译的结果在虚拟机终止运行时不被保存,这意味着下一次运行同样的程序仍需要重复编译。
3、垃圾收集

垃圾收集器主要的任务是检测出垃圾对象,然后回收垃圾对象使用的堆空间并还给程序。kaffe采用了增量垃圾收集的算法,而本实现中采用了三色标记并清除算法。

在 标记之前先将堆中所有的分配单元置成白色,然后按深度优先算法遍历每一个单元。当垃圾收集器遍历一个分支的时候,如果一个分配单元及与之相关联的单元都被 遍历到,则将其标记成黑色。 如果一个单元被遍历到,但是与之相关联的单元尚未被遍历,则将该单元标记成灰色。这时,垃圾收集器将继续遍历与该灰色单元相关联的单元,直到这些相关联的 单元全部被遍历到,才能将这个灰色单元标记成黑色。

最后当所有被遍历到的单元都被标记成黑色的时候, 将堆中被标记成白色的分配单元回收。

 

图4:三色标记并清除算法的中间过程图

最后是对堆碎块进行压缩处理。是通过快速地移动对象来减少堆碎块。即把当前活动的对象移动到堆的一端,在此过程中,堆的另外一端出现一块大的连续的内存单元。所有被移动的对象的引用也被更新,指向新的内存单元。

4、线程同步

Java 虚拟机中存在着以下两种线程:虚拟机系统线程和用户Java 线程。虚拟机系统线程是指虚拟机运行过程中执行其特殊功能的线程,比如垃圾收集器线程等。用户Java 线程是指用户编写的Java 应用程序中明确表示要启动的线程,并且至少有一个Java 线程,即main方法。

Java 语言的一大优势是支持多线程,这种支持主要表现在同步上。在java应用程序中使用synchronized关键字简单地使方法同步,而在Java 虚拟机指令中则使用monitorenter和monitorexit指令显式地支持方法同步。Java 虚 拟机为每个对象都关联一个锁。当当前线程访问共享资源的时候,会执行monitorenter指令来弹出该对象引用,从而获取该对象引用相关联的锁。如果 该对象已经被另一线程占用则当前线程就需要进入锁的等待队列,等待释放对象上的锁;已经获取共享资源的线程在释放资源的时候,执行monitorexit 指令来弹出对象引用,并且释放与该资源相关联的锁,并让等待队列中的第一个线程获取该对象锁。

当然线程thread也可以根据需要对某对象obj多次上锁,上锁的次数放在计数器counter中。只有当counter为0的时候,即thread加在该对象上的锁被完全释放,其它线程才有机会使用 object。对象的数据结构为:

typedef struct Obj{ uint32 size; //堆中对象的大小 uint16 counter; //对象被上锁的数量 uint16 flag; //对象的状态标志 uint16 thread_id; //对该对象进行加锁的 //线程的ID} Obj; 


而在实际Java 编程中, 程序员并不需要动手加锁,对象锁只是在Java 虚拟机内部使用的。程序员只需要编写同步语句就可以标志一监视区域,当Java 虚拟机运行程序的时候,每次进入一个监视区域,它每次都会给对象上锁。

5、线程调度

在本实现中,还需要考虑到在上述等待线程队列中如何选择下一个线程来执行,即线程调度问题。

哪 个线程将获取notify命令,这一点在很大程度上取决于虚拟机的设计者,既可以通过使用FIFO队列来调度,也可以根据所有等待线程的优先级来调度,比 如唤醒等待队列中优先级最高的线程获取刚刚释放的资源。而Bill Venners则从平台无关和执行效率这两个角度出发,提倡Java 虚拟机的设计者应使用java.lang.Object类中的notifyAll()方法来代替notify()方法去唤醒等待队列中的线程。

处理好线程调度问题,就可以节省程序的执行时间,这对于提高Java 虚拟机的执行性能是很有帮助的。

总结

本文在研究kaffe的基础上,实现了一虚拟机。并且对Java 虚拟机中的关键技术及时编译器、垃圾收集器、线程同步和线程调度等做了分析。本文中所实现的及时编译器虽然在执行速度上比解释型的Java 虚拟机快得多,但是不如自适应优化编译器,因为自适应优化编译器具有程序启动快,占用内存少的特点。

如果要明显地提高虚拟机的性能,应该更多的从执行引擎着手。另外在Java 应用程序的执行过程中许多时间是花费在多线程处理和垃圾收集上,如果在线程同步和线程调度上有所创新,也可以提高虚拟机的执行性能。

研究Java 虚拟机的实现过程有重要的意义,程序员可以编写针对于不同平台下的裁减了的Java 虚拟机,这样它就可以在实时嵌入式系统得到广泛地应用。相信Java 虚拟机将在更多的领域得到不断的完善和发展。

分享到:
评论

相关推荐

    win7下Java虚拟机的配置(图文教程).pdf

    在Windows 7操作系统中配置Java开发环境,主要是为了设置Java虚拟机(JVM),以便能够运行和编译Java程序。这个过程涉及到环境变量的设置,包括`JAVA_HOME`, `Path`和`CLASSPATH`。以下是详细的步骤和相关知识点: ...

    一个牛人给java初学者的建议(图文完整版)

    Java程序可以在不同的操作系统上运行,只要这些操作系统支持Java虚拟机(JVM)。这种能力极大地扩展了Java的应用范围,使其不仅能够在Windows上开发,还可以在Unix/Linux等其他操作系统上运行。 #### 三、Java的应用...

    Java环境搭建图文

    - `CLASSPATH`变量用于指定Java类库的路径,使得Java虚拟机能够找到所需的类文件。 4. **验证环境变量配置**: - 重新打开命令行工具,输入`javac`或`java -version`命令,如果没有任何错误信息出现,并且能够...

    java安装教程图文说明

    解决方法:可能因为系统安全权限过高,不允许 Java 虚拟机操作 C 盘,可将 java 文件放到其他盘符中运行。 通过本教程,用户可以轻松地安装和配置 Java 环境,开始学习和应用 Java 编程语言。同时,教程还提供了...

    eclipse_failed_to_create_the_java_virtual_machine_问题图文解析_收藏

    "Eclipse Failed to Create the Java Virtual Machine 问题图文解析" Eclipse 是一个功能强大的集成开发环境(IDE),广泛应用于软件开发、测试和维护中。然而,在使用 Eclipse 时,可能会遇到 "Failed to create ...

    Java详细图文教程

    - **JVM(Java虚拟机)**:Java程序需要通过JVM来执行,JVM是Java平台的核心组成部分,负责将字节码转换为机器码。 - **类和对象**:Java是面向对象的语言,一切皆为对象。类是创建对象的模板,对象则是类的实例。...

    jvm-core-learning-example:关于Java虚拟机核心知识点学习积累的例子,是初学者及虚拟机核心知识巩固的最佳实践

    作者与学习乐园原始码地址:我的作者:项目结构src目录Java虚拟机核心知识点学习代码并测试案例test目录(测试包名与src目录保持一致)对应学习代码包的详细测试案例包目录: ├── org.jvmcore.classloader// 类...

    VirtualBox虚拟机安装CentOS 7图文教程

    在IT行业中,熟悉虚拟化技术如VirtualBox以及Linux系统管理是必备技能,特别是对于Java Web开发者,了解Linux环境有助于提升服务器管理和应用部署的能力。 首先,新建虚拟机是整个过程的第一步。在VirtualBox中,...

    Java图解教程

    Java的跨平台特性得益于Java虚拟机(JVM),它能够解释并执行这些字节码。 在Java中,一切皆为对象。对象是类的实例,类是对象的蓝图。我们定义类来描述对象的属性(字段)和行为(方法)。继承、封装和多态是面向...

    java工程师信产部认证考试部分答案 - 图文-.doc

    8. **JVM与内存管理**:Java虚拟机(JVM)是Java程序的运行环境,包括堆内存(如D选项的内存分配)、栈内存和方法区等。垃圾回收机制(GC)负责自动释放不再使用的内存空间。 9. **设计模式**:在Java开发中,设计...

    [图文]Java语言基础-.doc

    Java程序运行在Java虚拟机(JVM)上,使得它能够在任何支持JVM的平台上执行。 二、Java语法基础 1. **变量与数据类型**:Java支持基本数据类型(如int、float、boolean等)和引用数据类型(类、接口和数组)。声明...

    图文解说教你如何把java源代码变成可执行文件exe

    将Java程序转换为可执行文件的另一种方法是创建一个批处理文件(.bat),该文件可以调用Java虚拟机(JVM)来执行JAR文件。 1. **创建批处理文件**: - 在Eclipse导出JAR文件所在的目录中新建一个文本文件,例如命名...

    [图文]第二讲 Java语言基础-.doc

    Java是由Sun Microsystems公司(现已被Oracle收购)在1995年推出的面向对象的编程语言,以其“一次编写,到处运行”的特性闻名,通过Java虚拟机(JVM)实现了跨平台的执行能力。Java的设计目标是简洁、健壮、安全,...

    【图文】java第一章.doc

    `main`方法是程序的入口点,Java虚拟机(JVM)从这里开始执行代码。`public`意味着任何其他类都可以访问它,`static`表示该方法属于类,而不是类的实例,`void`表示方法不返回任何值,`String[] args`是方法的参数,...

    Java编程环境搭建和变量基本使用图文教程

    1. 安装JDK:JDK是Java开发环境的核心组件,包含了Java编译器、Java虚拟机、Java类库等工具。 2. 配置环境变量:环境变量是操作系统中的一种设置,用于指定Java的安装路径、类库路径等信息。正确地配置环境变量可以...

    Java教程ppt

    12. **JVM与内存管理**:Java虚拟机(JVM)是Java程序的运行环境,负责垃圾回收和内存管理。理解JVM的工作原理有助于优化程序性能。 13. **Java应用程序与Web应用**:Java可以用来开发桌面应用程序,也可以用于构建...

    JAVA PPT

    10. **JVM原理**:简述Java虚拟机的工作原理,包括类加载、字节码执行、内存区域和JVM优化。 11. **Java开发工具**:如Eclipse、IntelliJ IDEA等IDE的使用,以及Maven、Gradle等构建工具的介绍。 12. **Java应用...

    JAVA/JSP基础教程(彩色图文PDF)

    它包含了Java编译器、Java虚拟机(JVM)以及各种开发工具,如JConsole、JVisualVM等。安装JDK后,开发者可以编写、编译和运行Java代码。在JDK安装过程中,需要设置环境变量,例如JAVA_HOME,以便系统能够找到Java...

Global site tag (gtag.js) - Google Analytics