转自http://blog.sina.com.cn/s/blog_4cc16fc50100b8ep.html
DOM与SAX
用于读取和操作 XML 文件的标准是文档对象模型(Document Object Model,DOM)。遗憾的是,DOM 方法涉及读取整个文件并将该文件存储在一个树结构中,而这样可能是低效的、缓慢的,并且很消耗资源。一种替代技术就是 Simple API for XML,或称为 SAX。SAX 允许您在读取文档时处理它,从而不必等待整个文档被存储之后才采取操作。
基于树的处理的优点和缺点(DOM)
DOM 以及广义的基于树的处理具有几个优点。首先,由于树在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航,而不是像 SAX 那样是一次性的处理。DOM 使用起来也要简单得多。
另一方面,在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外,创建一棵 DOM 树可能是一个缓慢的过程。
基于事件的处理的优点和缺点(SAX)
这种处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时停止解析。一般来说,SAX 还比它的替代者 DOM 快许多。
另一方面,由于应用程序没有以任何方式存储数据,使用 SAX 来更改数据或在数据流中往后移是不可能的。
如何在 SAX 和 DOM 之间选择
选择 DOM 还是选择 SAX,这取决于下面几个因素:
应用程序的目的:如果打算对数据作出更改并将它输出为 XML,那么在大多数情况下,DOM 是适当的选择。并不是说使用 SAX 就不能更改数据,但是该过程要复杂得多,因为您必须对数据的一份拷贝而不是对数据本身作出更改。
数据容量: 对于大型文件,SAX 是更好的选择。
数据将如何使用:如果只有数据中的少量部分会被使用,那么使用 SAX 来将该部分数据提取到应用程序中可能更好。 另一方面,如果您知道自己以后会回头引用已处理过的大量信息,那么 SAX 也许不是恰当的选择。
对速度的需要: SAX 实现通常要比 DOM 实现更快。
SAX 和 DOM 不是相互排斥的,记住这点很重要。您可以使用 DOM 来创建 SAX 事件流,也可以使用 SAX 来创建 DOM 树。事实上,用于创建 DOM 树的大多数解析器实际上都使用 SAX 来完成这个任务!
JAXP
Sun在XML领域总是后知后觉,等到Sun重视XML的时候,XML的API早就满天飞了,尤其是IBM具有非常大的领先优势。不过Sun是规范的制订者,于是参考W3C的标准制订了JAXP规范。
JAXP它只是一个规范,完成了对SAX、DOM的包装,生成了DocumentBuilderFactory、 DocumentBuilder和SAXParserFactory、SAXParser。JAXP的作用就是提出一个统一的接口,让其它的XML API都来遵循JAXP编程。当你严格采用JAXP编程的时候,是遵循W3C的DOM标准的,那么在JAXP底层你实际上可以任意切换不同的DOM实现(也就是解释器),例如Xerces,或者Crimon,再或者其它,切换方法就是配置jaxp.properties。因此JAXP就是一些标准接口而已。
JAXP应用程序 -> JAXP接口 -> Xerces DOM实现 -> Xerces DOM/SAX 解析器
JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Crimson DOM/SAX 解析器
JAXP应用程序 -> JAXP接口 -> Crimson DOM实现 -> Xerces DOM/SAX 解析器
JDOM与DOM4J
W3C的DOM标准API难用的让人想撞墙,于是有一帮人开发Java专用的XML API目的是为了便于使用,这就是jdom的由来,开发到一半的时候,另一部分人又分了出来,他们有自己的想法,于是他们就去开发dom4j,形成了今天这样两个API,至于他们之间的性能,功能之比较看看上面我推荐的文章就知道了,jdom全面惨败。
JDOM、DOM4J与JAXP都是对DOM、SAX的封装,但是JAXP具备跨平台性,JDOM、DOM4J是具体的应用,采用dom4j/jdom编写的应用程序,不具备可移植性。
JDOM、DOM4J相当于上面的JAXP接口+DOM实现部分,它本身没有解析器,它可以使用Xerces或者Crimson的解析器。
jdom应用程序 -> jdom API -> Xerces/Crimson解析器
dom4j应用程序 -> dom4j API -> Xerces/Crimson解析器
dom4j应用程序 -> dom4j API -> Alfred2解析器
DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,例如大名鼎鼎的 Hibernate 也用 DOM4J 来读取 XML 配置文件,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。
xerces解释器
在xerces中对jaxp中定义的SAXParser、SAXParserFactory、DocumentBuilder、DocumentBuilderFactory进行了继承,对应SAXParserImpl、SAXParserFactoryImpl、DocumentBuilderImpl、DocumentBuilderFactoryImpl
这就是为什么你的classpath中只要有xerces.jar(其中包含了sax dom jaxp )和 xercesImpl.jar就可以的原因了
STAX是一种新的处理技术,它与SAX不同之处在于它是iterator模式,SAX是观察者模式。
分享到:
相关推荐
如果你在Java项目中使用DOM4J来解析XML,那么`xerces.jar`或`crimson.jar`作为底层解析器可以帮助DOM4J完成XML的读取和写入任务。 4. **XML解析器的选择**: 在Java中,解析XML时通常有DOM、SAX和StAX等方法。DOM...
具体而言,JAXP通过一系列接口定义了如何创建和配置不同的解析器,如DOM解析器和SAX解析器,从而允许开发者在不修改代码的情况下轻松切换不同的实现。 ### JAXP与DOM、SAX的关系 DOM和SAX是两种主要的XML解析技术...
4. 检查是否有其他 XML 解析器(如 Woodstox 或 JDOM)与 Xerces 冲突,如果有,调整配置以避免冲突。 标签 "xerces" 提示我们讨论的主题与 Xerces 解析器有关,这是一个强大的工具,广泛应用于处理 XML 数据的 ...
1. **Apache Xerces Java**:这是另一个流行的Java XML解析器,完全用Java编写,支持多种标准,包括XML 1.0、XML Schema、DOM Level 2和SAX 2等。它还支持JAXP 1.2,即Java API for XML Processing。Xerces Java可以...
本篇将重点讨论两种主要的XML解析方式——DOM和SAX,以及Java API for XML Processing(JAXP)和dom4j库的使用。 1. DOM解析: Document Object Model(DOM)是一种树形结构,它代表整个XML文档,允许程序和脚本...
- **DOM4j**:另一个为Java定制的高性能XML解析器,相比于JDOM,DOM4j提供了更丰富的功能集,如XPath支持等,适用于更复杂的XML处理场景。 - **选择建议**:尽管DOM和SAX是XML解析的基础标准,但在实际开发中,鉴于...
JAXP不直接提供解析器,而是为获取DOM或SAX解析器对象提供了一种标准方式,增强了代码的可移植性。 **常用的Java XML解析器** 1. **Xerces**:由IBM开发,从JDK 1.5开始成为JDK的默认XML解析器,支持JAXP。 2. **...
4. **xml-apis.jar**:这个jar包包含了XML API,它是许多XML解析器的基础,包括DOM、SAX和JAXP(Java API for XML Processing)。XML APIs提供了与XML相关的接口和类,如DocumentBuilderFactory和TransformerFactory...
Java操作XML是编程中常见的任务,特别是在处理配置文件...SAX适合处理大型文件,而JDOM和DOM4J则为开发人员提供了更便捷的API。了解和掌握这些方法对于Java开发者来说至关重要,能够帮助他们灵活应对各种XML处理需求。
须要有SAX、DOM解析器的类文件,JDOM只是一种适合Java程序员来使用的Java XML解析器,目前流行的Java XML解析器还有:Apache Xerces Java、JAXP。 Xerces Java解析器是完全用Java编写的XML解析器,最新版本是2.5,...
Xerces Java是一个纯Java实现的XML解析器,支持多个XML相关的标准和API,如XML 1.0、命名空间、DOM2核心、SAX2核心扩展、JAXP1.2以及XML Schema。你可以从Apache官方网站下载Xerces-J-bin的最新版本,并将其类文件...
JDOM 的设计目标是简化 XML 处理,对比于传统的 SAX 和 DOM 解析器,它具有更友好的编程模型。 在早期版本的 JDOM 中,可能存在编译错误和中文乱码问题。例如,原文提到的作者在使用旧版 JDOM 时遇到这些问题,但...
JDOM是一个流行的替代选择,它提供更简洁的API,但在内部使用JAXP或其默认解析器Xerces。 2. **JAXB(Java API for XML Binding)** JAXB允许Java对象与XML文档之间的双向映射,方便数据的序列化和反序列化。通过...
例如,JDOM beta8的二进制版本包含了必要的jar文件,如`jdom.jar`,以及像`xerces.jar`和`jaxp.jar`这样的依赖项。确保将这些jar文件添加到你的项目类路径中,以避免运行时出现`NoSuchMethodError`或`...
3. Apache Xerces:Apache组织提供的XML解析器,支持DOM、SAX和JAXP接口。 4. Woodstox:高性能的StAX实现,适用于Java应用。 5. lxml(Python):Python中流行的XML处理库,结合了libxml2和libxslt库,支持DOM、SAX...
3. **Apache DOM** 和 **Xerces**:Apache组织提供的XML解析库,包括DOM和SAX解析器。 4. **Java XML API(JAXP)**:Java的标准API,提供了DOM、SAX和XPath的实现。 XML实例开发: 1. **XML配置文件**:在Spring...
Xerces是Apache软件基金会提供的一个XML解析器,支持DOM和SAX。 针对C++语言,开发者可以使用IBM的XML4C库或James Clark的C++ expat库。对于Perl语言,Perl的XML::Parser模块是一个常用的工具,它通过包装了James ...
2. **高性能**:尽管 JDOM 的实现基于 SAX 解析器,但它的设计考虑了性能问题,避免了 DOM 解析可能导致的大内存消耗。 3. **无接口设计**:JDOM 中主要使用的是具体类而非接口,这使得代码更简洁,使用起来更加直观...