JAXP(Java API for XML Parsing)
Sun(现在属于oracle)提供的一套操作解析和操作XML文档的接口,主要包括三个包:
- javax.xml包及子包: 用来获取解析器,并解析文档。
- org.w3c.dom包及子包: 使用DOM操作XML需要的接口
- org.xml.sax包及子包: 使用SAX操作XML需要的接口
JAXP可以分成两部分看,第一部分是获取解析器并解析文档,第二部分是对解析的文档进行操作。下面主要分析JAXP是如何获取解析器的,例子:
// 获取DOM解析器并解析文档
// 此后就是使用org.w3c.dom包的接口来操作Document了
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = parser.parse(filename);
// 获取SAX解析器并解析文档
// 此后就是使用org.xml.sax包的接口来操作了
SAXParserFactory factory2 = SAXParserFactory.newInstance();
SAXParser parser = factory2.newSAXParser();
System.out.println(parser.getClass());
parser.parse(new File("d:\\xml\\table.xml"), new MyHandler());
由上面可以看到,JAXP中DOM和SAX获取解析器的步骤是相似的,查看实现可以了解其内部有一个查找过程,如果用户不进行任何修改,JDK1.6会默认绑定apache的Xerces。
DOM4J
提到java的XML解析,大家都会想到DOM4J,那么DOM4J和JAXP有什么关系呢?
通过研究DOM4J 2.0的源码发现,DOM4J使用JAXP来获取解析器,然后通过自己定义的接口来操作解析后的文档,也就是说DOM4J和JAXP仅仅在操作文档上接口不同,JAXP使用的是org.w3c.dom和org.xml.sax,而DOM4J使用的是自定定义的一套接口。看DOM4J例子
// 使用JAXP获取DOM解析器并解析文档
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
org.w3c.dom.Document Document doc = parser.parse(filename);
// 对Document进行接口转换,转换成自己定义的Document接口
DOMReader reader = new DOMReader();
org.dom4j.Document doc = reader.read(doc2);
// SAX的例子
File f = new File("d:\\xml\\table.xml");
SAXReader reader = new SAXReader();
org.dom4j.Document Document doc = reader.read(f);
上面DOM操作的例子比较容易看懂,使用JAXP解析了文档后,再使用SAXReader对将org.w3c.dom.Document转换成org.dom4j.Document接口。以后对文档的操作就是org.dom4j.Document的事情了。
SAX的例子比较特别点,通过看DOM4J的源码,最后在SAXHelper类中发现了下面一句:
reader = createXMLReaderViaJAXP(validating, true);
就比较清楚了,SAX也是通过JAXP来获取解析器的。
不管是DOM还是SAX,在解析文档后,最终都转换成了org.dom4j.Document接口,这样的好处是很明显的: 如果程序之前使用DOM解析器,由于某种原因想换成SAX解析器,只需修改获取解析器部分的代码,后面对文档的操作代码是不需要改动的,而JAXP就不行,因为org.w3c.dom和org.xml.sax的接口是不一样的。
分析到这里,连我自己都有些疑惑了,个人认为:DOM4J的优势在于DOM和SAX访问接口的统一,而解析文档则共用的JAXP这部分。但是上网google一下都说DOM4J性能好,如果说DOM4J性能好,那到底快在哪里? 这个问题没有想明白。不知道谁研究过这个问题,学习一下。
附: 如何配置JAXP的解析器:
A 如何对JAXP SAX解析器进行配置:
1 程序中设置javax.xml.parsers.SAXParserFactory属性,例如
System.setProperty("javax.xml.parsers.SAXParserFactory", "org.apache.xerces.jaxp.SAXParserFactoryImpl");
2 运行时使用-D参数
java -Djavax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl
3 JAVA_HOME\JRE\lib下建立一个文件jaxp.properties,加入一行
javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl
4 查找解析器jar文件的META-INF\services目录, 在此目录下如果含有
javax.xml.parsers.SAXParserFactory文件,则通过此文件的内容加载解析器。
5 缺省解析器,1.6是xerces
其中DOM4J就是通过第四条,引入pull-parser jar包,并且在包中的META-INF\services目录加入javax.xml.parsers.SAXParserFactory文件来配置SAX解析器的。
B 如何对JAXP DOM解析器进行配置:
步骤和上面类似,不过设置的属性是javax.xml.parsers.DocumentBuilderFactory。
分享到:
相关推荐
在项目中使用DOM4J时,只需将相应的jar包(如dom4j-1.6.1.jar、dom4j-2.0.2.jar或dom4j-2.1.1.jar)导入到类路径中,即可开始利用其功能处理XML文档。导入后,可以按照DOM4J提供的API进行编程,快速实现XML的读写...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活、高效的API,使得XML的解析、创建、查询和修改变得更为简单。在本文中,我们将深入探讨DOM4J 1.6.1版本的安装及其在Maven项目中的应用。 首先,DOM4J...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活且高效的API,使得XML的解析、创建、修改和查询变得简单易行。在Java世界中,DOM4J是与DOM、SAX和JDOM等其他XML处理库并驾齐驱的一个选择,尤其在处理...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活、高效的API,使得XML的解析、创建、修改和查询变得简单。这次我们有两个版本的DOM4J库:1.6.1和2.0.0-ALPHA。这两个版本在功能、性能和API设计上都有所...
标题提及的"dom4j_1.6.1.jar"和"dom4j_2.1.0.jar"是两个不同版本的DOM4J库的Java档案文件,DOM4J是一个非常流行的Java XML API,用于处理XML文档。这两个版本的差异在于功能、性能优化和可能存在的bug修复。描述中...
另一份重要的资源是"dom4j-2.1.3-sources.jar",它提供了DOM4J库的源代码,允许开发者深入研究DOM4J的内部实现,对于理解DOM4J的工作原理、进行扩展或者调试都是不可或缺的。通过阅读源代码,开发者可以学习到如何...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活且高效的API,使得XML的解析、创建、修改和查询变得简单。DOM4J 1.6是该库的一个较新版本,提供了完整的功能集以及对XML标准的广泛支持。 DOM4J的核心...
《深入解析DOM4J——基于Java的XML处理框架》 DOM4J,作为一个强大的Java XML API,是处理XML文档的主流工具之一。它提供了一套简单而高效的方式来操作XML文档,包括读取、写入、修改和遍历XML结构。在Java开发中,...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了简单而直观的API,使得开发者可以方便地读取、写入、修改以及操作XML文件。DOM4J 1.6.1是这个库的一个稳定版本,发布于较早时期,但依然广泛应用于许多Java...
标题提到的"所有版本的dom4j工具包"表明这是一个包含多版本DOM4J库的集合,可能包括了从早期到较新的一些版本,如dom4j-1.4.jar、dom4j-1.6.1.jar和dom4j-1.5.2.jar。这些不同版本的库可能分别对应于不同的功能特性...
赠送jar包:dom4j-2.1.1.jar; 赠送原API文档:dom4j-2.1.1-javadoc.jar; 赠送源代码:dom4j-2.1.1-sources.jar; 赠送Maven依赖信息文件:dom4j-2.1.1.pom; 包含翻译后的API文档:dom4j-2.1.1-javadoc-API文档-...
JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源...
当我们遇到“java.lang.ClassNotFoundException: org.dom4j.DocumentException”的错误提示时,这通常意味着系统中缺少了DOM4j库,只需将“org.dom4j.jar”添加到项目类路径中即可解决此问题。 DOM4J是基于DOM和SAX...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活且高效的API,使得XML的解析、创建、修改和查询变得简单。DOM4J的名字来源于“Document Object Model for Java”,它采用面向对象的设计思想,提供了...
赠送jar包:dom4j-2.1.1.jar; 赠送原API文档:dom4j-2.1.1-javadoc.jar; 赠送源代码:dom4j-2.1.1-sources.jar; 赠送Maven依赖信息文件:dom4j-2.1.1.pom; 包含翻译后的API文档:dom4j-2.1.1-javadoc-API文档-...
DOM4J 2.1.1 是一个针对Java平台的高效、开源的XML处理库,其全称为“Document Object Model for Java”。这个库提供了一系列强大的API,使得开发人员能够轻松地解析、创建、修改和操作XML文档。XML(eXtensible ...
DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活、高性能的API,使得在Java应用程序中解析、创建、修改和操作XML文档变得容易。DOM4J因其易用性和丰富的功能集,在Java社区中广受欢迎,尤其在处理大型...
DOM4J 的使用 DOM4J 是一个开源的 XML 解析包,由 dom4j.org 出品,应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM、SAX 和 JAXP。DOM4J 的主要特点是使用大量的接口,所有主要接口都在 org.dom4j 里面定义...
DOM4J是一个强大的Java库,专门用于处理XML文档。它是一个灵活且高性能的XML解析器,提供了丰富的API来创建、修改和操作XML数据。在Java应用程序中,DOM4J作为一个流行的选择,尤其在处理复杂的XML结构时,因为它...