`
孙玉_1987
  • 浏览: 53653 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

XML解析方式对比(含XPP3解析)

 
阅读更多
XML在不同的语言里解析方式都是一样的,只不过实现的语法不同。
基本的解析方式包括SAX和DOM。

SAX是基于事件流的解析,DOM是基于XML文档树结构的解析。

DOM解析(W3C的DOM--org.w3c.dom):
DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。
解析器读取整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用DOM接口来操作这个树结构。
优点:整个文档树存在内存中,便于操作;支持删除、修改、重新排列等。
缺点:将整个文档调入内存(包括无用的节点),浪费空间和时间。
使用场合:一旦解析了文档还需要多次访问这些数据;硬件资源充足(如内存,CPU)


代码:
import java.io.*;
import java.util.*;
import org.w3c.dom.*;
import javax.xml.parsers.*;

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);



SAX解析:
解析器发现元素开始、元素结束、文本、文档的开始或结束时,发送事件,程序员编写响应这些时间的代码,保存数据。
优点:不用事先调入整个文档,占用资源少;
SAX解析器代码比DOM解析器小,适用于applet、下载;
缺点:不是持久的;事件过后,若 没保存数据,那么数据就丢了;
无状态性;
从事件中只能得到文档,但不知道该文本属于哪个元素;
使用场合:Applet;
只需要XML文档的少量内容,很少回头访问,机器内存少。
SAX 解析器的时候编码工作会比较困难,而且很难同时访问同一个文档中的多处不同数据。

代码:
import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;


SAXParserFactory sf = SAXParserFactory.newInstance();
SAXParser sp = sf.newSAXParser();
MyXMLReader reader = new MyXMLReader();
sp.parse(new InputSource("data_10k.xml"), reader);


DOM4J解析:
DOM4J是一个非常优秀的JAVA XML API,具有性能优异、功能强大和极端易用使用的特点。


代码:
import java.io.*;
import java.util.*;
import org.dom4j.*;
import org.dom4j.io.*;


File f = new File("data_10k.xml");
SAXReader reader = new SAXReader();
Document doc = reader.read(f);





JDOM解析:
JDOM的目的是成为java特定文档模型,简化与XML的交互并且比使用DOM实现更快。
为减少DOM SAX的编码量,出现了JDOM;
优点:20-80原则,极大的减少了代码量。
使用场合:要实现的功能简单、如解析、创建等,但在底层,JDOM还是使用SAX、DOM等。

JDOM与DOM主要有两个方面不同:
JDOM使用具体类而不使用接口。这在某些方面简化了API,但是也限制了灵活性。
API大量是用了Collections类,简化了那些已经熟悉这些类得JAVA开发者的使用。

JDOM自身不包含解析器,通常是用SAX2解析器来解析和验证输入XML文档。



代码:
import java.io.*;
import java.util.*;
import org.jdom.*;
import org.jdom.input.*;

SAXBuilder builder = new SAXBuilder();
Document doc = builder.build(new File("data_10k.xml"));



开发人员之所以往往不愿意使用SAX,原因是它很复杂,不过又只好使用它,因为没有其他切实可行的选择。不然,如果XML文件超过几百KB,DOM的内存开销和性能下降对应用开发人员来说就会成为棘手的绊脚石,这样就无法满足项目对性能的最低要求。


XPP3解析:
这是一种比较古老的XML解析方式,其官方网站上也曾经说明这种解析方式在性能上是比较可靠的。
先贴出这种解析方式的完整解析代码:
public static void xpp3Parse(){
XmlPullParserFactory factory;
try {
factory = XmlPullParserFactory.newInstance();
factory.setNamespaceAware(true);
    XmlPullParser xpp = factory.newPullParser();
    long start = System.currentTimeMillis();
    xpp.setInput(new FileInputStream("d:\\inbox.xml"), "utf-8");
    int eventType = xpp.getEventType();
    while (true) {
            switch (eventType) {
            case XmlPullParser.START_DOCUMENT:
                System.out.println("Start of Document");
                break;
            case XmlPullParser.START_TAG:
                System.out.println("Start of Tag: " + xpp.getName());
                if(xpp.getAttributeCount() > 0){                
                for(int i=0;i<xpp.getAttributeCount();i++){
                System.out.println(xpp.getAttributeName(i) + " = " + xpp.getAttributeValue(i));
                }                
                }
                break;
            case XmlPullParser.END_TAG:
                System.out.println("END_TAG: " + xpp.getName());
                break;
            case XmlPullParser.TEXT:
                System.out.println("Text: " + xpp.getText());
                break;
            }
            if (eventType == XmlPullParser.END_DOCUMENT)
                break;
            eventType = xpp.next();           
        } 
    System.out.println("XPP3耗时:"+(System.currentTimeMillis() - start)+" ms");
} catch (XmlPullParserException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

}

PS:附件中的ZIP包中包含XPP3解析所需要的jar包。

简单测试:同时载入然后循环遍历80k的XML文件
XPP3:67ms
DOM4J:360ms
果然在性能上有很大的提升空间。

分享到:
评论
1 楼 zhouxingbo 2012-02-06  

相关推荐

    xpp3 xml解析器

    XPP3,全称为XML Pull Parser 3,是一款高效的XML解析器,专为处理XML文档而设计。在IT行业中,XML作为一种重要的数据交换格式,被广泛应用于数据存储、配置文件、网络通信等领域。XPP3作为XML Pull解析器的第三版,...

    XPP3解析XML举例

    MyXmlPullApp.java 一个使用XPP3解析XML的例子。 An example of an application that uses XMLPULL V1 API.

    xml解析方式大全

    xml解析方式包括w3c dom,sax,xpp,stax,vtd方式,其实还有jdom和xmlevent这样才够全面

    xpp3-1.1.5.jar

    《深入解析xpp3-1.1.5.jar:XML解析器的核心技术》 在Java开发领域,XML(eXtensible Markup Language)作为一种数据交换和文档存储的标准格式,广泛应用于各种应用程序之间。为了高效地处理XML文档,开发者通常会...

    java解析XML所需要的完整包(包括XStream.jar,dom4j.jar和xpull/xpp.jar)

    XPP3通常被用作其他库(如XStream)的底层XML解析机制,它允许快速、低级别的XML解析和事件驱动的处理。 这三个库在Java XML处理中扮演着不同的角色:XStream提供了对象到XML的序列化和反序列化,dom4j提供了强大的...

    jar包下载xpp3

    总的来说,XPP3是一个强大的XML解析库,它提供了一种高效、灵活的方式来处理XML数据,适用于那些需要在Java环境中处理大量XML的项目。无论是服务器端还是客户端应用,尤其是资源有限的环境,如Android,XPP3都是一个...

    xstream142和xpp3.zip

    XStream库内部使用XPP3作为默认的XML解析器,因为XPP3提供了高效的解析速度。 `xpp3_min-1.1.4c.jar`是XPP3的一个最小化版本,只包含必要的类和方法,以减小库的体积,适合对资源有限的环境,如移动设备或者嵌入式...

    xpp3-1.1.4-min.jar

    这个小型的JAR文件包含了XPP3解析器的精简版,旨在提供一个备用的、高效的XML解析机制,以确保XStream能正常运行,即使在面对挑战性的情况时也能保持稳定。 XPP3采用了XML拉式解析(Pull Parsing)模式,与传统的推...

    xpp3的Jar包

    XPP3是XML解析的重要工具,尤其在需要高效、低内存占用处理XML的场景下,如Openfire这样的XMPP服务器。通过理解XPP3的工作原理和使用方法,开发者可以更好地优化XML处理流程,提高应用的性能。在Openfire中,XPP3...

    xstream-1.3.jar xpp3_min-1.1.4c.jar

    在Java项目中,XStream通常与XPP3一起使用,因为XPP3作为底层的XML解析引擎,可以为XStream提供高效的XML解析能力。当XStream处理XML时,它会依赖XPP3来解析XML流,然后将解析的结果转换成Java对象或反之。 综上所...

    XML高效解析器对比测试(Java工程)

    本Java项目对SAX,XPP,VTD三种高效的XML解析技术进行了对比测试。如果你只想知道结果: 连续10,000XML解析(简单XML): SAX:16157 XPP:3875 VTD:2218 请将本项目解压后导入Eclipse,并使用Junit4运行。本资源也可作为SAX...

    xstream-1.4.2.jar和xpp3_min-1.1.4c.jar包

    XStream简化了对象和XML之间的转换,而XPP3则提供了一个快速且低内存占用的XML解析器。如果你需要在Java项目中处理XML,这两个库是值得考虑的。在使用前,确保正确地导入它们,并根据项目需求配置好相应的安全设置。

    xpp3_min-1.1.4c.jar.zip

    XPP3(XML Pull Processing)是XML解析的一种方法,它不同于DOM(Document Object Model)和SAX(Simple API for XML)。DOM解析器将整个XML文档加载到内存中,形成一个树形结构,便于遍历和操作;SAX则采用事件驱动...

    将对象生成xml的jar包,xstream-1.4.2,xmlpull-1.1.3.1,xpp3_min-1.1.4c

    XPP3提供了一个轻量级、高性能的XML解析器,可以与XMLPull API一起使用。XPP3_min是XPP3的一个精简版本,旨在减少库的大小,使其更适合嵌入式设备或资源有限的环境。 集成这三个库,可以在Java应用中实现高效、灵活...

    Android中xml解析

    XPP3是一个XML Pull解析器,提供了一个高效的XML解析机制,为XStream提供解析XML的基础。 以下是如何在Android中使用XStream的一个简要示例: 1. 添加依赖:首先,将XStream库文件添加到项目的lib目录,并在...

    xpp3_min-1.1.4.zip

    XPP3(XML Pull Parser for Java version 3)是一个高性能、轻量级的XML解析库,它实现了XML 1.0和1.1的pull解析API。Pull解析API允许开发者按需读取XML文档的元素,而不是像SAX(Simple API for XML)那样通过事件...

    XML应用的基石:XML解析技术

    本文将重点介绍三种主要的XML解析技术——DOM解析、SAX解析及XPP解析,并探讨它们的特点及应用场景。 #### 二、三种主要的XML解析技术 **1. DOM解析** DOM是一种基于树型结构的解析技术,将XML文档一次性加载到...

    用pullXML解析本地数据并存在本地

    implementation 'xpp3:xpp3_min:1.1.4c' } ``` 然后,编写XML解析代码。以下是一个基本的示例: ```java import org.xmlpull.v1.XmlPullParser; import org.xmlpull.v1.XmlPullParserFactory; // 创建...

    xstream-1.3.1.jar&xpp3;_min-1.1.4c.jar

    XPP3(XML Pull Processing Library version 3)是一个轻量级的XML解析器,它实现了XML Pull API。在Java中,XPP3作为解析XML文档的一种高效方式,比DOM(Document Object Model)和SAX(Simple API for XML)更节省...

Global site tag (gtag.js) - Google Analytics