在IBM的developerWorks上有几篇非常优秀的关于Java XML API的评测文章,它们是:
http://www-900.ibm.com/developerWorks/cn/xml/x-injava/index.shtml
http://www-900.ibm.com/developerWorks/cn/xml/x-injava2/index.shtml
http://www-900.ibm.com/developerWorks/cn/xml/x-databdopt/part2/index.shtml
http://www-900.ibm.com/developerWorks/cn/xml/x-databdopt/part1/index.shtml
对这几篇文章我想说的就是“吐血推荐”
Java的XML API这几篇文章该讲的都讲到了,我只想补充几点:
一、Crimson和Xerces恩仇录
Crimson来自于Sun捐赠给Apache的ProjectX项目,Xerces来自IBM捐赠给Apache的XML4J项目,结果Xerces胜出,成了Apache XML小组全力开发的XML API,而Crimon已经早就不做了,如今Xerces名满天下,到处都是在用Xerces DOM和SAX解析器,只有Sun不服气,非要在JDK1.4里面使用过时的Crimson,让人感觉像是在赌气一样,真是让人可怜又可气!不过IBM发行JDK用的XML 解析器自然是Xerces。
由于JDK的Class Loader的优先级关系,当你采用JAXP编写XML程序的时候,即使把Xerces包引入CLASSPATH,JDK还是会顽固的使用Crimson,这一点通过打开JVM的verbose参数可以观察到。不过JDK也允许你采用其它的解析器,因此我们可以通过在JRE\lib\目录下建一个jaxp.properties的文件,来替换解析器,jaxp.properties内容如下:
引用
javax.xml.parsers.DocumentBuilderFactory=org.apache.xerces.jaxp.DocumentBuilderFactoryImpl
javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl
这样就可以使用Xerces,当然你必须还是要把Xerces包放到CLASSPATH下。
二、JAXP的姗姗来迟
Sun在XML领域总是后知后觉,等到Sun重视XML的时候,XML的API早就满天 飞了,尤其是IBM具有非常大的领先优势。不过Sun是规范的制订者,于是参考W3C的标准制订了JAXP规范。JAXP不像Xerces和Crimon那样,它只是一个spec,本身是不做任何事情的,它的作用就是提出一个统一的接口,让其它的XML API都来遵循JAXP编程,那么用JAXP写出来的程序,底层的API可以任意切换。
具体来说JAXP包括了几个工厂类,这就是JDK1.4里面的javax.xml.parsers 包,用来寻找符合DOM标准的XML API实现类的位置;此外JAXP还包括一整套interface,这就是JDK1.4里面的org.w3c.dom那几个包。工厂类负责加载DOM的实现类。那么加载的规则是什么呢?
我是通过阅读JAXP的源代码知道的,工厂类首先会根据java命令行传入的参数进行寻找,然后在根据JRE\lib\jaxp.properties中定义的实现类寻找,最后什么都找不到的话,就用Crimson。注意Crimons是由Bootstrap Class Loader来load的,如果你不通过上面两个方法来改变工厂的寻找顺序,那么铁定用Crimson了 :(
三、 DOM解析器和DOM API
当你严格采用JAXP编程的时候,是遵循W3C的DOm标准的,那么在JAXP底层你实际上可以任意切换不同的DOM实现,例如Xerces,或者Crimon,再或者其它,切换方法就是配置jaxp.properties。因此JAXP就是一些标准接口而已。
而Xerces和Crimon也不单单是一个DOM实现那么简单,他们本身实际上也包含SAX解析器和DOM解析器。所以一个JAXP程序下面有如下层次:
引用
JAXP应用程序 -> JAXP接口 -> Xerces DOM实现 -> Xerces DOM/SAX 解析器
只要你用JAXP编程,那么你就可以切换到Crimson上来
引用
JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Crimson DOM/SAX 解析器
另外你也可以这样来做:
引用
JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Xerces DOM/SAX 解析器
不过如果你的程序不安装JAXP来写,那么就没有办法切换不同的DOM实现了。
四、不是标准的dom4j和jdom
W3C的DOM标准API难用的让人想撞墙,于是有一帮人开发Java专用的XML API目的是为了便于使用,这就是jdom的由来,开发到一半的时候,另一部分人又分了出来,他们有自己的想法,于是他们就去开发dom4j,形成了今天这样两个API,至于他们之间的性能,功能之比较看看上面我推荐的文章就知道了,jdom全面惨败。
jdom 相当于上面的 JAXP接口 + Xerces DOM实现部分,它本身没有解析器,它可以使用Xerces或者Crimson的解析器,就是这样:
引用
jdom应用程序 -> jdom API -> Xerces/Crimson解析器
dom4j 和jdom类似,不过他自己绑定了一个叫做Alfred2的解析器,功能不是很全,但是速度很快,当没有其它的解析器的时候,dom4j将使用Alfred2解析器,如下:
引用
dom4j应用程序 -> dom4j API -> Xerces/Crimson解析器
或者
引用
dom4j应用程序 -> dom4j API -> Alfred2解析器
你在SF上下载的dom4j.jar是不含 Alfred2解析器的,而dom4j-full.jar包含了 Alfred2解析器,在这种情况下,实际上你什么也不需要,光是一个dom4j-full.jar就全部都包括了。
因此可以看出采用dom4j/jdom编写的应用程序,已经不具备可移植性了。
五、小插曲
Sun是JAXP标准的制订者,甚至很执著的在JDK1.4里面绑定Crimson DOM实现和解析器,然后可笑的是,Sun自己的JAXM RI竟然不是用JAXP写出来的,而是dom4j,制订标准让大家遵守,自己却监守自盗,这未免太说不过去了吧!
BTW: Hibernate也用的是dom4j来读取XML配置文件,如今已经越来越多的程序纷纷采用dom4j,如果你不是那么在乎可移植性,我强烈建议你采用dom4j。
分享到:
相关推荐
Java XML API是Java平台提供的一套用于处理XML文档的接口和类,它使得开发者能够方便地在Java程序中创建、解析、修改XML文档。本文将深入探讨Java XML API中的核心组件,包括SAX(Simple API for XML)、DOM...
dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的JavaXML API,具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom技术,同时它也是一个开放源代码的...
本文档是 Java 2 Platform Standard Edition 6.0 的 API 规范。 请参见: 描述 Java 2 Platform 软件包 java.applet 提供创建 applet 所必需的类和 applet 用来与其 applet 上下文通信的类。 java.awt 包含...
Java XML Validation API是Java平台中用于验证XML文档的重要工具,它是Java API for XML Processing (JAXP)的一部分。XML(eXtensible Markup Language)是一种用于标记数据的标准格式,广泛应用于数据交换、配置...
本文档是 Java Platform Standard Edition 6 的 API !Java 1.6 API的中文帮助文档。 深圳电信培训中心徐海蛟博士教学用api中文文档。支持全文检索,在线即时查询。 里面列出了,Java的所有类及其使用方法! Java ...
在Java中,处理XML的主要API包括JAXB(Java Architecture for XML Binding)、DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。这些API提供了对XML文档的各种操作方法,...
1. Java XML API:Java XML API是用于处理XML(可扩展标记语言)文件的一系列Java API。它允许Java程序读写和操纵XML数据,使得Java程序能够创建、解析、打印和修改XML文档。这些API通常被集成到Java标准版(J2SE)...
在Java中,有多种处理XML的API,如DOM(Document Object Model)、SAX(Simple API for XML)和JAXB(Java Architecture for XML Binding)。DOM一次性加载整个XML文档到内存中,适合小型文件;SAX是事件驱动的,...
在Web服务方面,Java的JAX-WS(Java API for XML Web Services)和JAX-RS(Java API for RESTful Web Services)支持基于XML的SOAP和RESTful服务的开发。SOAP是基于XML的消息传递协议,而RESTful服务通常以JSON或XML...
Java平台提供了丰富的API来支持XML处理,如DOM(文档对象模型)、SAX(简单API for XML)和StAX(流式API for XML)等。 1. DOM API:这是处理XML文档的一种常用方法,它将整个XML文档加载到内存中形成一个树形结构...
4. 解析XML:使用Java的DOM或StAX API解析XML,找到占位符并提取数据。 ```java DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder...
10. **XML处理**:DOM(Document Object Model)和SAX(Simple API for XML)是两种常见的XML解析方式,JAXB(Java Architecture for XML Binding)用于将XML数据绑定到Java对象。 这份中文完整版的Java API文档...
Java XML API是Java平台上的一个核心组件,用于处理XML(Extensible Markup Language)文档。XML是一种标记语言,常用于数据交换、配置存储以及结构化数据的传输。Java XML API提供了丰富的类库,使得开发者能够在...
4. **JAXP(Java API for XML Processing)**:JAXP提供了XML解析和转换的接口,支持DOM、SAX和XSLT,是Java平台上处理XML的基础。 5. **XPath**:XPath是用于在XML文档中查找信息的语言,它可以根据表达式选取节点...
Java XML API是Java平台上的标准库,用于处理XML(可扩展标记语言)文档。XML是一种通用的数据交换格式,常用于存储结构化数据。在Java中,我们可以通过一系列的API来读取、写入、解析和操作XML文档。这些API包括DOM...
9. **JAX-RPC和JAX-WS**:在Web服务中,Java API for XML-based RPC (JAX-RPC)和Java API for XML Web Services (JAX-WS)用于创建和消费基于SOAP的Web服务。这些API允许XML消息在服务和客户端之间进行交换。 10. **...
可以使用DOM(Document Object Model)或者SAX(Simple API for XML)解析器来生成XML文档。例如,使用DOM解析器创建XML如下: ```java DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();...
6. **改进的XML处理**:更新了StAX(Streaming API for XML),提供了更高效的XML解析和生成。 接着,Java API 1.7(Java SE 7)于2011年发布,进一步提升了语言特性和库的功能: 1. **多版本选择语法**:允许导入...
【标题】"java中文API和W3CAPI" 涵盖了编程语言和技术标准的重要参考资料,主要包括Java、JavaScript、XML、CSS以及HTML的API文档。这些API是开发者日常工作中不可或缺的工具,提供了详细的类库函数说明,帮助程序员...
首先,Java提供了两种主要的API来处理XML:DOM(文档对象模型)和SAX(简单API for XML)。DOM解析器会将整个XML文件加载到内存中,形成一个树形结构,适合处理小到中等规模的XML文档。而SAX解析器采用事件驱动的...