`

Java XML API 漫谈

    博客分类:
  • xml
阅读更多

在IBM的developerWorks上有几篇非常优秀的关于Java XML API的评测文章,它们是:

http://www-900.ibm.com/developerWorks/cn/xml/x-injava/index.shtml

http://www-900.ibm.com/developerWorks/cn/xml/x-injava2/index.shtml

http://www-900.ibm.com/developerWorks/cn/xml/x-databdopt/part2/index.shtml

http://www-900.ibm.com/developerWorks/cn/xml/x-databdopt/part1/index.shtml

对这几篇文章我想说的就是“吐血推荐”

Java的XML API这几篇文章该讲的都讲到了,我只想补充几点:

一、Crimson和Xerces恩仇录

Crimson来自于Sun捐赠给Apache的ProjectX项目,Xerces来自IBM捐赠给Apache的XML4J项目,结果Xerces胜出,成了Apache XML小组全力开发的XML API,而Crimon已经早就不做了,如今Xerces名满天下,到处都是在用Xerces DOM和SAX解析器,只有Sun不服气,非要在JDK1.4里面使用过时的Crimson,让人感觉像是在赌气一样,真是让人可怜又可气!不过IBM发行JDK用的XML 解析器自然是Xerces。

由于JDK的Class Loader的优先级关系,当你采用JAXP编写XML程序的时候,即使把Xerces包引入CLASSPATH,JDK还是会顽固的使用Crimson,这一点通过打开JVM的verbose参数可以观察到。不过JDK也允许你采用其它的解析器,因此我们可以通过在JRE\lib\目录下建一个jaxp.properties的文件,来替换解析器,jaxp.properties内容如下:

引用
javax.xml.parsers.DocumentBuilderFactory=org.apache.xerces.jaxp.DocumentBuilderFactoryImpl
javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl


这样就可以使用Xerces,当然你必须还是要把Xerces包放到CLASSPATH下。

二、JAXP的姗姗来迟

Sun在XML领域总是后知后觉,等到Sun重视XML的时候,XML的API早就满天 飞了,尤其是IBM具有非常大的领先优势。不过Sun是规范的制订者,于是参考W3C的标准制订了JAXP规范。JAXP不像Xerces和Crimon那样,它只是一个spec,本身是不做任何事情的,它的作用就是提出一个统一的接口,让其它的XML API都来遵循JAXP编程,那么用JAXP写出来的程序,底层的API可以任意切换。

具体来说JAXP包括了几个工厂类,这就是JDK1.4里面的javax.xml.parsers 包,用来寻找符合DOM标准的XML API实现类的位置;此外JAXP还包括一整套interface,这就是JDK1.4里面的org.w3c.dom那几个包。工厂类负责加载DOM的实现类。那么加载的规则是什么呢?

我是通过阅读JAXP的源代码知道的,工厂类首先会根据java命令行传入的参数进行寻找,然后在根据JRE\lib\jaxp.properties中定义的实现类寻找,最后什么都找不到的话,就用Crimson。注意Crimons是由Bootstrap Class Loader来load的,如果你不通过上面两个方法来改变工厂的寻找顺序,那么铁定用Crimson了 :(

三、 DOM解析器和DOM API

当你严格采用JAXP编程的时候,是遵循W3C的DOm标准的,那么在JAXP底层你实际上可以任意切换不同的DOM实现,例如Xerces,或者Crimon,再或者其它,切换方法就是配置jaxp.properties。因此JAXP就是一些标准接口而已。

而Xerces和Crimon也不单单是一个DOM实现那么简单,他们本身实际上也包含SAX解析器和DOM解析器。所以一个JAXP程序下面有如下层次:

引用
JAXP应用程序 -> JAXP接口 -> Xerces DOM实现 -> Xerces DOM/SAX 解析器



只要你用JAXP编程,那么你就可以切换到Crimson上来

引用
JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Crimson DOM/SAX 解析器



另外你也可以这样来做:

引用
JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Xerces DOM/SAX 解析器



不过如果你的程序不安装JAXP来写,那么就没有办法切换不同的DOM实现了。

四、不是标准的dom4j和jdom

W3C的DOM标准API难用的让人想撞墙,于是有一帮人开发Java专用的XML API目的是为了便于使用,这就是jdom的由来,开发到一半的时候,另一部分人又分了出来,他们有自己的想法,于是他们就去开发dom4j,形成了今天这样两个API,至于他们之间的性能,功能之比较看看上面我推荐的文章就知道了,jdom全面惨败。

jdom 相当于上面的 JAXP接口 + Xerces DOM实现部分,它本身没有解析器,它可以使用Xerces或者Crimson的解析器,就是这样:

引用
jdom应用程序 -> jdom API -> Xerces/Crimson解析器



dom4j 和jdom类似,不过他自己绑定了一个叫做Alfred2的解析器,功能不是很全,但是速度很快,当没有其它的解析器的时候,dom4j将使用Alfred2解析器,如下:

引用
dom4j应用程序 -> dom4j API -> Xerces/Crimson解析器



或者

引用
dom4j应用程序 -> dom4j API -> Alfred2解析器



你在SF上下载的dom4j.jar是不含 Alfred2解析器的,而dom4j-full.jar包含了 Alfred2解析器,在这种情况下,实际上你什么也不需要,光是一个dom4j-full.jar就全部都包括了。

因此可以看出采用dom4j/jdom编写的应用程序,已经不具备可移植性了。

五、小插曲

Sun是JAXP标准的制订者,甚至很执著的在JDK1.4里面绑定Crimson DOM实现和解析器,然后可笑的是,Sun自己的JAXM RI竟然不是用JAXP写出来的,而是dom4j,制订标准让大家遵守,自己却监守自盗,这未免太说不过去了吧!

BTW: Hibernate也用的是dom4j来读取XML配置文件,如今已经越来越多的程序纷纷采用dom4j,如果你不是那么在乎可移植性,我强烈建议你采用dom4j。

 

 

分享到:
评论

相关推荐

    java_xml_api,java操作XML文档

    Java XML API是Java平台提供的一套用于处理XML文档的接口和类,它使得开发者能够方便地在Java程序中创建、解析、修改XML文档。本文将深入探讨Java XML API中的核心组件,包括SAX(Simple API for XML)、DOM...

    dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。下载地址 .txt

    dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的JavaXML API,具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom技术,同时它也是一个开放源代码的...

    JAVA_API1.6文档(中文)

    本文档是 Java 2 Platform Standard Edition 6.0 的 API 规范。 请参见: 描述 Java 2 Platform 软件包 java.applet 提供创建 applet 所必需的类和 applet 用来与其 applet 上下文通信的类。 java.awt 包含...

    The Java XML Validation API

    Java XML Validation API是Java平台中用于验证XML文档的重要工具,它是Java API for XML Processing (JAXP)的一部分。XML(eXtensible Markup Language)是一种用于标记数据的标准格式,广泛应用于数据交换、配置...

    Java 1.6 API 中文 New

    本文档是 Java Platform Standard Edition 6 的 API !Java 1.6 API的中文帮助文档。 深圳电信培训中心徐海蛟博士教学用api中文文档。支持全文检索,在线即时查询。 里面列出了,Java的所有类及其使用方法! Java ...

    java_xml_pack-summer02_01.zip_XML java_document XML API_java xm

    在Java中,处理XML的主要API包括JAXB(Java Architecture for XML Binding)、DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。这些API提供了对XML文档的各种操作方法,...

    Java™ API for XML

    1. Java XML API:Java XML API是用于处理XML(可扩展标记语言)文件的一系列Java API。它允许Java程序读写和操纵XML数据,使得Java程序能够创建、解析、打印和修改XML文档。这些API通常被集成到Java标准版(J2SE)...

    Java-xml.rar_XML java_java xml_javaXML.rar_javaxml.r_xml 网站

    在Java中,有多种处理XML的API,如DOM(Document Object Model)、SAX(Simple API for XML)和JAXB(Java Architecture for XML Binding)。DOM一次性加载整个XML文档到内存中,适合小型文件;SAX是事件驱动的,...

    Java XML编程指南

    在Web服务方面,Java的JAX-WS(Java API for XML Web Services)和JAX-RS(Java API for RESTful Web Services)支持基于XML的SOAP和RESTful服务的开发。SOAP是基于XML的消息传递协议,而RESTful服务通常以JSON或XML...

    Java Xml 编程指南书籍源码

    Java平台提供了丰富的API来支持XML处理,如DOM(文档对象模型)、SAX(简单API for XML)和StAX(流式API for XML)等。 1. DOM API:这是处理XML文档的一种常用方法,它将整个XML文档加载到内存中形成一个树形结构...

    java XML解析方式实现自动生成word文档

    4. 解析XML:使用Java的DOM或StAX API解析XML,找到占位符并提取数据。 ```java DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder...

    JAVA常用API文档 中文完整版.zip

    10. **XML处理**:DOM(Document Object Model)和SAX(Simple API for XML)是两种常见的XML解析方式,JAXB(Java Architecture for XML Binding)用于将XML数据绑定到Java对象。 这份中文完整版的Java API文档...

    java_xml_api.zip

    Java XML API是Java平台上的一个核心组件,用于处理XML(Extensible Markup Language)文档。XML是一种标记语言,常用于数据交换、配置存储以及结构化数据的传输。Java XML API提供了丰富的类库,使得开发者能够在...

    Java and XML(英文第三版)_java_xml_birdsolc_源码

    4. **JAXP(Java API for XML Processing)**:JAXP提供了XML解析和转换的接口,支持DOM、SAX和XSLT,是Java平台上处理XML的基础。 5. **XPath**:XPath是用于在XML文档中查找信息的语言,它可以根据表达式选取节点...

    java xml.java操作XML文档

    Java XML API是Java平台上的标准库,用于处理XML(可扩展标记语言)文档。XML是一种通用的数据交换格式,常用于存储结构化数据。在Java中,我们可以通过一系列的API来读取、写入、解析和操作XML文档。这些API包括DOM...

    java xml编程指南

    9. **JAX-RPC和JAX-WS**:在Web服务中,Java API for XML-based RPC (JAX-RPC)和Java API for XML Web Services (JAX-WS)用于创建和消费基于SOAP的Web服务。这些API允许XML消息在服务和客户端之间进行交换。 10. **...

    java http 发送xml报文(java发送xml报文实例+参数)

    可以使用DOM(Document Object Model)或者SAX(Simple API for XML)解析器来生成XML文档。例如,使用DOM解析器创建XML如下: ```java DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();...

    java api1.6、1.7

    6. **改进的XML处理**:更新了StAX(Streaming API for XML),提供了更高效的XML解析和生成。 接着,Java API 1.7(Java SE 7)于2011年发布,进一步提升了语言特性和库的功能: 1. **多版本选择语法**:允许导入...

    java中文API和W3CAPI

    【标题】"java中文API和W3CAPI" 涵盖了编程语言和技术标准的重要参考资料,主要包括Java、JavaScript、XML、CSS以及HTML的API文档。这些API是开发者日常工作中不可或缺的工具,提供了详细的类库函数说明,帮助程序员...

    java 解析xml 多级

    首先,Java提供了两种主要的API来处理XML:DOM(文档对象模型)和SAX(简单API for XML)。DOM解析器会将整个XML文件加载到内存中,形成一个树形结构,适合处理小到中等规模的XML文档。而SAX解析器采用事件驱动的...

Global site tag (gtag.js) - Google Analytics