虚拟机设计团队把类的加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部实现,以便让应用程序自己决定如何去获取所需要的类。实现这个动作的代码模块被称为“类加载器”。
类加载器可以说是Java语言的一项创新,也是Java语言流行的重要原因之一,它最初是为了满足Java Applet的需求而被开发出来的。如今Java Applet技术基本上已经死掉,但是类加载器却在类层次划分、OSGi、热部署、代码加密等领域大放异彩,称为Java技术体系中一块重要的基石,真可谓是失之桑榆,收之东隅。
类与类加载器
类加载器虽然只用于实现类的加载动作,但它在Java程序中起到的作用却远远不限于类加载阶段。对于任意一个类,都需要由它的类加载器和这个类本身一同确定其在Java虚拟机中的唯一性。这句话可以表达的更加通俗些:比较两个类是否相等,只有在这两个类是同一个类加载器的前提下才有意义,否则,即使这两个类的来源是同一个Class文件,只有加载他们的类加载器不同,那么两个类就必定不相等。
这里所说的相等包括了代表类的Class对象的equals()方法,isAssignableFrom()方法、isInstance()方法的返回结果,也包括了使用instanceof关键字做对象所属关系判定情况。如果没有注意到类加载器的影响,在某些情况下可能会产生具有迷惑性的结果。
双亲委派模型
站在Java虚拟机的角度讲,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),这个类加载器使用C++语言实现,是虚拟机自身的一部分;另外一种就是所有其他的类加载器,这些类加载器都是由Java语言实现,独立虚拟机外部,并且全部继承自抽象类java.lang.ClassLoader。
从Java开发人员的角度来看,类加载器就可以划分的更细致一下,绝大部分Java程序都会使用到以下三种系统提供的类加载器:
启动类加载器(Bootstrap ClassLoader):前面已经介绍过,这个类加载器负责讲存在在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的(仅按照文件名识别,如rt.jar,名字不符合的类库即使放在lib目录中也不会被加载)类库加载到虚拟机内存中。启动类加载器无法被Java程序直接引用。
扩展类加载器(Extension ClassLoader):这个加载器由sun.misc.Launcher$ExtClassLoader实现,它负责加载<JAVA_HOME>\lib目录中的,或者被java.ext.dirs系统变量所指定的路径中的所有类库,开发者可以直接使用扩展类加载器。
应用程序类加载器(Application ClassLoader):这个类加载器由sun.misc.Launcher$AppClassLoader来实现。由于这个类加载器是ClassLoader中的getSystemClassLaoder()方法的返回值,所以一般也称它为系统类加载器。它负责加载用户类路径(ClassPath)上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下,这个就是程序中默认的类加载器。
我们的应用程序都是由这三类加载器互相配合进行加载的。如果有必要,还可以加入自己定义的类加载器。这些类加载器之间的关系一般如下图所示:
图中所展示的类加载器之间的这种层次关系,就称之为类加载器的双亲委派模型(Parents Delegation Model)。双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应当有自己的父类加载器。这里类加载器之间的父子关系一般不会以继承(Inheritance)的关系来实现,而是都使用组合(Composition)关系来复用父类加载器的代码。
类加载器的双亲委派模型在JDK1.2期间被引入并广泛应用于之后几乎所有的Java程序中,但它并不是一个强制性的约束模型,而是Java设计者推荐给开发者们的一种类加载器实现方式。
双亲委派模型的工作过程是:如果一个类加载器受到了类加载请求,它首先不会自己尝试去加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(他的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。
使用双亲委派模型来组织类加载器之间的关系,有一个显而易见的好处就是Java类随着它的类加载器一起具备了一种带有优先级的层次关系。例如java.lang.Object,它放在rt.jar中,无论哪一类加载器要加载这个类,最终都是委派给启动类加载器进行加载,因此Object类在程序的各类加载环境中都是同一个类。相反,如果没有使用双亲委派模型,由各个类加载器自行加载的话,如果用户自己写了一个名为java.lang.Object的类,并放在程序的ClassPath中,那系统中将会出现多个不同的Object类,Java类型体系中最基础的行为也就无从保证,应用程序也将会变得一片混乱。
双亲委派模型对于保证Java程序的稳定运行很重要,但它的实现却非常简单,实现双亲委派模型的代码都集中在java.lang.ClassLoader的loadClass()方法中,如下面代码所示。先检查是否加载过,如果没有加载过则调用父加载器的loadClass()方法,若父加载器为空则默认使用启动类加载器作为父加载器。如果父加载器加载失败,则抛出ClassNotFoundException异常后,再调用自己的findClass()方法进行加载。
破坏双亲委派模型
双亲委派模型“被破坏”是由这个模型自身的缺陷所导致的,双亲委派很好的解决了各个加载器的基础类的统一问题(越基础的类由越上层的加载器进行加载),基础类之所以被称为基础,是因为它们总是被作为用户代码调用的API,但世事往往没有绝对的完美,如果基础类又要调用用户的代码,那要怎么办?
这并非是不可能的事情,一个典型的例子就是JNDI服务,JNDI现在已经是Java的标准服务,它的代码由启动类加载器去加载(在JDK1.3时代放进去的rt.jar),但JNDI的目的就是对资源进行集中管理和查找,它需要调用独立厂商实现并部署在应用程序的ClassPath下的JNDI接口提供者(SPI,Service Provider Interface)的代码,但启动类加载器不可能不认识这些代码,那该怎么办?
为了解决这个困境,Java 设计团队只好引入一个不太优雅的设计:线程上下文类加载器(thread context classLoader)。这个类加载器可以通过java.lang.Thread类的setContextClassLoader()方法进行设置,如果创建线程时还未设置,它将会从父线程中继承一个;如果在应用程序的全局范围内都没有设置过,那么这个类加载器默认就是应用程序类加载器。
有了线程上下文类加载器,就可以做一些“舞弊”的事情了,JNDI服务使用这个线程上下文类加载器去加载所需要的SPI代码,也就是父类加载器请求子类加载器去完成类加载动作。这种行为实际上就是打通了双亲委派模型的层次结构来逆向使用类加载器,已经违背了双亲委派模型的一般性原则,但这也是无可奈何的事情。Java中所涉及的SPI的加载动作基本上都采用这种方式,例如JNDI、JDBC、JAXB和JBI等。
双亲委派模型还可以由用户对程序动态性的追求而导致。这里所说的动态性指的是当前一些非常“热”门的名词:代码热替换(HotSwap)、模块热部署(Hot Deployment)等。说白了就是希望应用程序能像我们的电脑外设那样,插上鼠标或者U盘,不用重启机器就能立即使用,鼠标有问题就升级或者换个鼠标,不用停机也不用重启。
在JSR-297、JSR-277规范从纸上标准变成真正可运行的程序之前,OSGi是当前业界事实上的Java模块标准,而OSGi实现模块化部署的关键则是它自定义的类加载器机制的实现。每一个程序模块(OSGi中称为Bundle)都有一个自己的类加载器,当需要更换一个Bundle时,就把Bundle连同加载器一起换掉以实现代码的热替换。
在OSGi环境下,类加载器不再是双亲委派模型中的树状结构,而是进一步发展为网状结构,当收到类加载请求时,OSGi将按照下面的顺序进行类搜索:
(1)将以java.*开头的类,委派给父类加载器加载。
(2)否则,将委派列表名单的类,委派给父类加载器加载。
(3)否则,将Import列表中的类,委派给Export这个类的Bundle的类加载器加载。
(4)否则,查找当前Bundle的classPath,使用自己的类加载器。
(5)否则,查找类是否在自己的Fragment Bundle中,如果在,则委派给Fragment Bundle的类加载器加载。
(6)否则,查找Dynamic import列表的Bundle,委派给对应的Bundle的类加载器加载。
(7)否则,类查找失败。
上面的查找顺序中,只有开头的两点仍然符合双亲委派模型规则,其余的类查找都是在平级的类加载器中进行的。