类加载是java语言提供的最强大的机制之一。尽管类加载并不是讨论的热点话题,但所有的编程人员都应该了解其工作机制,明白如何做才能让其满足我们的需要。这能有效节省我们的编码时间,从不断调试ClassNotFoundException, ClassCastException的工作中解脱出来。
这篇文章从基础讲起,比如代码与数据的不同之处是什么,他们是如何构成一个实例或对象的。然后深入探讨java虚拟机(JVM)是如何利用类加载器读取代码,以及java中类加载器的主要类型。接着用一个类加载的基本算法看一下类加载器如何加载一个内部类。本文的下一节演示一段代码来说明扩展和开发属于自己的类加载器的必要性。紧接着解释如何使用定制的类加载器来完成一个一般意义上的任务,使其可以加载任意远端客户的代码,在JVM中定义,实例化并执行它。本文包括了J2EE关于类加载的规范——事实上这已经成为了J2EE的标准之一
一.
类与数据
一个类代表要执行的代码,而数据则表示其相关状态。状态时常改变,而代码则不会。当我们将一个特定的状态与一个类相对应起来,也就意味着将一个类事例化。尽管相同的类对应的实例其状态千差万别,但其本质都对应着同一段代码。在JAVA中,一个类通常有着一个.class文件,但也有例外。在 JAVA的运行时环境中(Java runtime),每一个类都有一个以第一类(first-class)的Java对象所表现出现的代码,其是java.lang.Class的实例。我们编译一个JAVA文件,编译器都会嵌入一个public, static, final修饰的类型为java.lang.Class,名称为class的域变量在其字节码文件中。因为使用了public修饰,我们可以采用如下的形式对其访问:
java.lang.Class klass = Myclass.class;
一旦一个类被载入JVM中,同一个类就不会被再次载入了(切记,同一个类)。这里存在一个问题就是什么是“同一个类”?正如一个对象有一个具体的状态,即标识,一个对象始终和其代码(类)相关联。同理,载入JVM的类也有一个具体的标识,我们接下来看。
在JAVA中,一个类用其完全匹配类名(fully qualified class name)作为标识,这里指的完全匹配类名包括包名和类名。但在JVM中一个类用其全名和一个加载类ClassLoader的实例作为唯一标识。因此,如果一个名为Pg的包中,有一个名为Cl的类,被类加载器KlassLoader的一个实例kl1加载,Cl的实例,即C1.class在JVM中表示为 (Cl, Pg, kl1)。这意味着两个类加载器的实例(Cl, Pg, kl1) 和 (Cl, Pg, kl2)是不同的,被它们所加载的类也因此完全不同,互不兼容的。那么在JVM中到底有多少种类加载器的实例?下一节我们揭示答案。
类加载器
在JVM中,每一个类都被java.lang.ClassLoader的一些实例来加载.类ClassLoader是在包中java.lang里,开发者可以自由地继承它并添加自己的功能来加载类。
无论何时我们键入java MyMainClass来开始运行一个新的JVM,“引导类加载器(bootstrap class loader)”负责将一些关键的Java类,如java.lang.Object和其他一些运行时代码先加载进内存中。运行时的类在JRE\lib \rt.jar包文件中。因为这属于系统底层执行动作,我们无法在JAVA文档中找到引导类加载器的工作细节。基于同样的原因,引导类加载器的行为在各 JVM之间也是大相径庭。
同理,如果我们按照如下方式:
log(java.lang.String.class.getClassLoader());
来获取java的核心运行时类的加载器,就会得到null。
接下来介绍java的扩展类加载器。扩展库提供比java运行代码更多的特性,我们可以把扩展库保存在由java.ext.dirs属性提供的路径中。
(编辑注:java.ext.dirs属性指的是系统属性下的一个key,所有的系统属性可以通过 System.getProperties()方法获得。在编者的系统中,java.ext.dirs的value是” C:\Program Files\Java\jdk1.5.0_04\jre\lib\ext”。下面将要谈到的如java.class.path也同属系统属性的一个 key。)
类ExtClassLoader专门用来加载所有java.ext.dirs下的.jar文件。开发者可以通过把自己的.jar文件或库文件加入到扩展目录的classpath,使其可以被扩展类加载器读取。
从开发者的角度,第三种同样也是最重要的一种类加载器是AppClassLoader。这种类加载器用来读取所有的对应在java.class.path系统属性的路径下的类。
Sun的java指南中,文章“理解扩展类加载”(Understanding ExtensionClass Loading)对以上三个类加载器路径有更详尽的解释,这是其他几个JDK中的类加载器
●java.net.URLClassLoader
●java.security.SecureClassLoader
●java.rmi.server.RMIClassLoader
●sun.applet.AppletClassLoader
java.lang.Thread,包含了public ClassLoader getContextClassLoader()方法,这一方法返回针对一具体线程的上下文环境类加载器。此类加载器由线程的创建者提供,以供此线程中运行的代码在需要加载类或资源时使用。如果此加载器未被建立,缺省是其父线程的上下文类加载器。原始的类加载器一般由读取应用程序的类加载器建立。
类加载器如何工作?
除了引导类加载器,所有的类加载器都有一个父类加载器,不仅如此,所有的类加载器也都是java.lang.ClassLoader类型。以上两种类加载器是不同的,而且对于开发者自订制的类加载器的正常运行也至关重要。最重要的方面是正确设置父类加载器。任何类加载器,其父类加载器是加载该类加载器的类加载器实例。(记住,类加载器本身也是一个类!)
使用loadClass()方法可以从类加载器中获得该类。我们可以通过java.lang.ClassLoader的源代码来了解该方法工作的细节,如下:
protected synchronized Class loadClass
(String name, boolean resolve)
throws ClassNotFoundException{
// First check if the class is already loaded
Class c = findLoadedClass(name);
if (c == null) {
try {
if (parent != null) {
c = parent.loadClass(name, false);
} else {
c = findBootstrapClass0(name);
}
} catch (ClassNotFoundException e) {
// If still not found, then invoke
// findClass to find the class.
c = findClass(name);
}
}
if (resolve) {
resolveClass(c);
}
return c; } 我们可以使用ClassLoader的两种构造方法来设置父类加载器:
public class MyClassLoader extends ClassLoader{
public MyClassLoader(){
super(MyClassLoader.class.getClassLoader());
} } 或
public class MyClassLoader extends ClassLoader{
public MyClassLoader(){
super(getClass().getClassLoader());
} } 第一种方式较为常用,因为通常不建议在构造方法里调用getClass()方法,因为对象的初始化只是在构造方法的出口处才完全完成。因此,如果父类加载器被正确建立,当要示从一个类加载器的实例获得一个类时,如果它不能找到这个类,它应该首先去访问其父类。如果父类不能找到它(即其父类也不能找不这个类,等等),而且如果findBootstrapClass0()方法也失败了,则调用findClass()方法。findClass()方法的缺省实现会抛出ClassNotFoundException,当它们继承java.lang.ClassLoader来订制类加载器时开发者需要实现这个方法。findClass()的缺省实现方式如下:
protected Class findClass(String name)
throws ClassNotFoundException {
throw new ClassNotFoundException(name);
}
在findClass()方法内部,类加载器需要获取任意来源的字节码。来源可以是文件系统,URL,数据库,可以产生字节码的另一个应用程序,及其他类似的可以产生java规范的字节码的来源。你甚至可以使用BCEL (Byte Code Engineering Library:字节码工程库),它提供了运行时创建类的捷径。BCEL已经被成功地使用在以下方面:编译器,优化器,混淆器,代码产生器及其他分析工具。一旦字节码被检索,此方法就会调用defineClass()方法,此行为对不同的类加载实例是有差异的。因此,如果两个类加载实例从同一个来源定义一个类,所定义的结果是不同的。
JAVA语言规范(Java language specification)详细解释了JAVA执行引擎中的类或接口的加载(loading),链接(linking)或初始化(initialization)过程。
图一显示了一个主类称为MyMainClass的应用程序。依照之前的阐述,MyMainClass.class会被 AppClassLoader加载。 MyMainClass创建了两个类加载器的实例:CustomClassLoader1 和 CustomClassLoader2,他们可以从某数据源(比如网络)获取名为Target的字节码。这表示类Target的类定义不在应用程序类路径或扩展类路径。在这种情况下,如果MyMainClass想要用自定义的类加载器加载Target类,CustomClassLoader1和 CustomClassLoader2会分别独立地加载并定义Target.class类。这在java中有重要的意义。如果Target类有一些静态的初始化代码,并且假设我们只希望这些代码在JVM中只执行一次,而这些代码在我们目前的步骤中会执行两次——分别被不同的 CustomClassLoaders加载并执行。如果类Target被两个CustomClassLoaders加载并创建两个实例Target1和 Target2,如图一显示,它们不是类型兼容的。换句话说,在JVM中无法执行以下代码:
Target target3 = (Target) target2;
以上代码会抛出一个ClassCastException。这是因为JVM把他们视为分别不同的类,因为他们被不同的类加载器所定义。这种情况当我们不是使用两个不同的类加载器CustomClassLoader1 和 CustomClassLoader2,而是使用同一个类加载器CustomClassLoader的不同实例时,也会出现同样的错误。这些会在本文后边用具体代码说明。
关于类加载、定义和链接的更多解释,请参考Andreas Schaefer的"Inside Class Loaders."
为什么我们需要我们自己的类加载器
原因之一为开发者写自己的类加载器来控制JVM中的类加载行为,java中的类靠其包名和类名来标识,对于实现了 java.io.Serializable接口的类,serialVersionUID扮演了一个标识类版本的重要角色。这个唯一标识是一个类名、接口名、成员方法及属性等组成的一个64位的哈希字段,而且也没有其他快捷的方式来标识一个类的版本。严格说来,如果以上的都匹配,那么则属于同一个类。
但是让我们思考如下情况:我们需要开发一个通用的执行引擎。可以执行实现某一特定接口的任何任务。当任务被提交到这个引擎,首先需要加载这个任务的代码。假设不同的客户对此引擎提交了不同的任务,凑巧,这些所有的任务都有一个相同的类名和包名。现在面临的问题就是这个引擎是否可以针对不同的用户所提交的信息而做出不同的反应。这一情况在下文的参考一节有可供下载的代码样例,samepath 和 differentversions,这两个目录分别演示了这一概念。在samepath 中,类version.Version保存在v1和v2两个子目录里,两个类具有同样的类名和包名,唯一不同的是下边这行:
public void fx(){
log("this = " this "; Version.fx(1).");
}
V1中,日志记录中有Version.fx(1),而在v2中则是Version.fx(2)。把这个两个存在细微不同的类放在一个classpath下,然后运行Test类:
set CLASSPATH=.;%CURRENT_ROOT%\v1;%CURRENT_ROOT%\v2
%JAVA_HOME%\bin\java Test再次运行,类路径做如下微小改动。
set CLASSPATH=.;%CURRENT_ROOT%\v2;%CURRENT_ROOT%\v1
%JAVA_HOME%\bin\java Test根据以上例子可以很明显地看出,类加载器加载在类路径中被首先找到的元素。如果我们在v1和v2中删除了version.Version,做一个非version.Version形式的.jar文件,如myextension.jar,把它放到对应java.ext.dirs的路径下,再次执行后看到version.Version不再被AppClassLoader加载,而是被扩展类加载器加载
继续这个例子,文件夹differentversions包含了一个RMI执行引擎,客户端可以提供给执行引擎任何实现了 common.TaskIntf接口的任务。子文件夹client1 和 client2包含了类client.TaskImpl有个细微不同的两个版本。两个类的区别在以下几行:
static{
log("client.TaskImpl.class.getClassLoader
(v1) : " TaskImpl.class.getClassLoader());
}
public void execute(){
log("this = " this "; execute(1)");
}
在client1和client2里分别有getClassLoader(v1) 与 execute(1)和getClassLoader(v2) 与 execute(2)的的log语句。并且,在开始执行引擎RMI服务器的代码中,我们随意地将client2的任务实现放在类路径的前面。
CLASSPATH=%CURRENT_ROOT%\common;%CURRENT_ROOT%\server;
%CURRENT_ROOT%\client2;%CURRENT_ROOT%\client1
%JAVA_HOME%\bin\java server.Server在客户端VM,各自的client.TaskImpl类被加载、实例化,并发送到服务端的VM来执行。从服务端的控制台,可以明显看到client.TaskImpl代码只被服务端的VM执行一次,这个单一的代码版本在服务端多次生成了许多实例,并执行任务。服务端的控制台,加载并执行两个不同的客户端的请求,如图7,8所示。需要注意的是,代码只被加载了一次(从静态初始化块的日志中也可以明显看出),但对于客户端的调用这个方法被执行了两次。客户端VM加载了含有client.TaskImpl.class.getClassLoader(v1)的日志内容的类 TaskImpl的代码,并提供给服务端的执行引擎。图8的客户端VM加载了另一个TaskImpl的代码,并发送给服务端。 在客户端的VM中,类 client.TaskImpl被分别加载,初始化,并发送到服务端执行。图6还揭示了client.TaskImpl的代码只在服务端的VM中加载了一次,但这“唯一的一次”却在服务端创造了许多实例并执行。或许客户端1该不高兴了因为并不是它的client.TaskImpl(v1)的方法调用被服务端执行了,而是其他的一些代码。如何解决这一问题?答案就是实现定制的类加载器。
定制类加载器
要较好地控制类的加载,就要实现定制的类加载器。所有自定义的类加载器都应继承自java.lang.ClassLoader。而且在构造方法中,我们也应该设置父类加载器。然后重写findClass()方法。differentversionspush文件夹包含了一个叫做 FileSystemClassLoader的自订制的类加载器。定制类加载器关系
以下是在common.FileSystemClassLoader实现的主方法:
public byte[] findClassBytes(String className){
try{
String pathName = currentRoot
File.separatorChar className.
replace('.', File.separatorChar)
".class";
FileInputStream inFile = new
FileInputStream(pathName);
byte[] classBytes = new
byte[inFile.available()];
inFile.read(classBytes);
return classBytes;
}
catch (java.io.IOException ioEx){
return null;
}
}
public Class findClass(String name)throws
ClassNotFoundException{
byte[] classBytes = findClassBytes(name);
if (classBytes==null){
throw new ClassNotFoundException();
}
else{
return defineClass(name, classBytes,
0, classBytes.length);
}
}
public Class findClass(String name, byte[]
classBytes)throws ClassNotFoundException{
if (classBytes==null){
throw new ClassNotFoundException(
"(classBytes==null)");
}
else{
return defineClass(name, classBytes,
0, classBytes.length);
}
}
public void execute(String codeName,
byte[] code){
Class klass = null;
try{
klass = findClass(codeName, code);
TaskIntf task = (TaskIntf)
klass.newInstance();
task.execute();
}
catch(Exception exception){
exception.printStackTrace();
}
}
这个类供客户端把client.TaskImpl(v1)转换成字节数组,之后此字节数组被发送到RMI服务端。在服务端,一个同样的类用来把字节数组的内容转换回代码。客户端代码如下:
public class Client{
public static void main (String[] args){
try{
byte[] code = getClassDefinition
("client.TaskImpl");
serverIntf.execute("client.TaskImpl",
code);
}
catch(RemoteException remoteException){
remoteException.printStackTrace();
}
}
private static byte[] getClassDefinition
(String codeName){
String userDir = System.getProperties().
getProperty("BytePath");
FileSystemClassLoader fscl1 = null;
try{
fscl1 = new FileSystemClassLoader
(userDir);
}
catch(FileNotFoundException
fileNotFoundException){
fileNotFoundException.printStackTrace();
}
return fscl1.findClassBytes(codeName);
} }
在执行引擎中,从客户端收到的代码被送到定制的类加载器中。定制的类加载器把其从字节数组定义成类,实例化并执行。需要指出的是,对每一个客户请求,我们用类FileSystemClassLoader的不同实例来定义客户端提交的client.TaskImpl。而且,client.TaskImpl并不在服务端的类路径中。这也就意味着当我们在FileSystemClassLoader调用 findClass()方法时,findClass()调用内在的defineClass()方法。类client.TaskImpl被特定的类加载器实例所定义。因此,当FileSystemClassLoader的一个新的实例被使用,类又被重新定义为字节数组。因此,对每个客户端请求类 client.TaskImpl被多次定义,我们就可以在相同执行引擎JVM中执行不同的client.TaskImpl的代码。
public void execute(String codeName, byte[] code)throws RemoteException{
FileSystemClassLoader fileSystemClassLoader = null;
try{
fileSystemClassLoader = new FileSystemClassLoader();
fileSystemClassLoader.execute(codeName, code);
}
catch(Exception exception){
throw new RemoteException(exception.getMessage());
}
}
示例在differentversionspush文件夹下定制的类加载器控制台。我们可以看到client.TaskImpl的代码被多次加载。实际上针对每一个客户端,类都被加载并初始化。含有client.TaskImpl.class.getClassLoader(v1)的日志记录的类TaskImpl的代码被客户端的VM加载,然后送到服务端另一个客户端把包含有 client.TaskImpl.class.getClassLoader(v1)的类代码加载并送往服务端这段代码演示了我们如何利用不同的类加载器实例来在同一个VM上执行不同版本的代码。
J2EE的类加载器
J2EE的服务器倾向于以一定间隔频率,丢弃原有的类并重新载入新的类。在某些情况下会这样执行,而有些情况则不。同样,对于一个web服务器如果要丢弃一个servlet实例,可能是服务器管理员的手动操作,也可能是此实例长时间未相应。当一个JSP页面被首次请求,容器会把此JSP页面翻译成一个具有特定形式的servlet代码。一旦servlet代码被创建,容器就会把这个servlet翻译成class文件等待被使用。对于提交给容器的每次请求,容器都会首先检查这个JSP文件是否刚被修改过。是的话就重新翻译此文件,这可以确保每次的请求都是及时更新的。企业级的部署方案以.ear, .war, .rar等形式的文件,同样需要重复加载,可能是随意的也可能是依照某种配置方案定期执行。对所有的这些情况——类的加载、卸载、重新加载……全部都是建立在我们控制应用服务器的类加载机制的基础上的。实现这些需要扩展的类加载器,它可以执行由其自身所定义的类。Brett Peterson已经在他的文章 Understanding J2EE Application Server Class Loading Architectures给出了J2EE应用服务器的类加载方案的详细说明,详见网站TheServerSide.com。
结要
本文探讨了类载入到虚拟机是如何进行唯一标识的,以及类如果存在同样的类名和包名时所产生的问题。因为没有一个直接可用的类版本管理机制,所以如果我们要按自己的意愿来加载类时,需要自己订制类加载器来扩展其行为。我们可以利用许多J2EE服务器所提供的“热部署”功能来重新加载一个新版本的类,而不改动服务器的VM。即使不涉及应用服务器,我们也可以利用定制类加载器来控制java应用程序载入类时的具体行为。TedNeward的书 Server-Based Java Programming中详细阐述java的类加载,J2EE的API以及使用他们的最佳途径。
英文原文--
http://www.onjava.com/pub/a/onjava/2005/01/26/classloading.html
分享到:
相关推荐
类加载机制遵循“双亲委托模型”,意味着当一个类加载器收到加载类的请求时,它首先会委托父加载器去尝试加载,只有当父加载器无法完成时,才会自己尝试。这样可以防止用户自定义的类覆盖JDK的核心类,保证了系统类...
【内容简介】 本书深刻且通俗地揭示Java Web开发内幕,使您由内而外地明白使用Java进行Web应用开发的全过程——从XML基础知识到HTTP详述及相关体验,从用Tomcat配置Web站点到HttpServletResponse和...
在上述例子中,关于Singleton类的诡异现象揭示了类加载和初始化的顺序影响。最初,`Singleton.singleton`在类初始化之前被赋值,因此`b`的值为0。而当初始化顺序改变,先初始化静态变量再创建`singleton`实例时,`a`...
本书深入地揭示Java Web开发内幕,细致地解释许许多多来自开发第一线的一知半解的问题。阅读本书,可以为您详细地剖析Java Web开发的全过程,使您轻松地解决在使用Java进行Web应用开发遇到的各类疑难杂症。 本书...
本文将主要探讨“通过Java字节码发现有趣的内幕之初始化篇(下)”这一主题,它旨在揭示Java程序在初始化阶段的一些不为人知的秘密。我们将从类加载、实例初始化、静态初始化以及字节码指令等方面进行详细讲解,帮助...
《深入分析Java Web技术内幕 修订版》是Java Web开发领域的一部重量级著作,它详细探讨了Java Web技术的核心概念、实现原理以及在实际应用中的最佳实践。这本书旨在帮助开发者深化对Java Web的理解,提升技术水平,...
本书旨在揭示Java实现网络通信的核心原理,帮助开发者更好地理解和运用相关技术。 Java在网络协议方面的支持主要体现在Java的Socket编程、HTTP协议处理、多线程并发以及TCP/IP协议栈的接口等方面。下面我们将详细...
Java类由类加载器加载到JVM中,并且每个Java类必须由一个类加载器来加载。Java类加载器的层次结构包含三层:Bootstrap ClassLoader、Extension ClassLoader和Application ClassLoader。 JVM架构则是Java虚拟机的...
标题“数据库表生成对应的java类”揭示了主要功能,即根据数据库中的表结构,自动生成相应的Java类。这通常是通过ORM框架如Hibernate或MyBatis来实现的。这些框架可以解析数据库表的元数据,生成具有字段和方法的...
本书深入地揭示Java Web开发内幕,细致地解释许许多多来自开发第一线的一知半解的问题。阅读本书,可以为您详细地剖析Java Web开发的全过程,使您轻松地解决在使用Java进行Web应用开发遇到的各类疑难杂症。
本书深入地揭示Java Web开发内幕,细致地解释许许多多来自开发第一线的一知半解的问题。阅读本书,可以为您详细地剖析Java Web开发的全过程,使您轻松地解决在使用Java进行Web应用开发遇到的各类疑难杂症。
本书深入地揭示Java Web开发内幕,细致地解释许许多多来自开发第一线的一知半解的问题。阅读本书,可以为您详细地剖析Java Web开发的全过程,使您轻松地解决在使用Java进行Web应用开发遇到的各类疑难杂症。
【标签】"java,源码,广告"揭示了这个项目的三个关键特性。首先,它是用Java语言编写的,这意味着开发者可能使用了Java的标准库,例如`java.awt`和`javax.swing`来构建GUI,或者使用现代的JavaFX库。其次,包含...
围绕Java虚拟机整体架构、编译器、class文件格式、加载、链接与初始化、指令集等核心主题对Java虚拟机进行全面而深入的分析,深刻揭示Java虚拟机的工作原理。同时,书中不仅完整地讲述了由Java SE 8所引入的新特性,...
带目录-pdf,本书完整而准确地阐释了Java虚拟机各方面的细节,围绕Java虚拟机整体架构、编译器、class文件格式、加载、链接与初始化、指令集等核心主题对Java虚拟机进行全面而深入的分析,深刻揭示Java虚拟机的工作...
在Java中,我们可以使用`Properties`类来加载和管理这类文件。这样做可以将SQL字符串与代码分离,使得代码更易于维护,同时也方便进行国际化和本地化。 使用这种方式组织代码,有以下优点: - **更好的可维护性**:...
Java类class反编译工具是开发者在理解和学习Java字节码或者进行逆向工程时必不可少的辅助工具。这些工具能够将已经编译过的.class文件转换回可读性强的.java源代码,帮助我们查看和理解已有的Java类结构,尤其是在...
通过import相关类和接口,比如java.util.Vector,javax.media.opengl.GL,gov.nasa.worldwind.geom.Position等,来实现MD2模型的加载和渲染。代码中应涵盖如何读取MD2文件的二进制数据,如何解析MD2文件的文件头和...
Java的动态加载机制是其区别于C++的一大特点,它允许程序在运行时按需加载类。当使用`java -verbose *.class`命令运行程序时,系统会详细地显示加载的类文件,揭示了类加载的过程。只有在实际使用到某个类的实例时,...