`

JAVA第三方开源库之Dom4j

阅读更多

DOM4J是dom4j.org出品的一个开源XML解析包,它的网站中这样定义:
     Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。
     DOM4J使用起来非常简单。只要你了解基本的XML-DOM模型,就能使用。然而他自己带的指南只有短短一页(html),不过说的到挺全。国内的中文资料很少。因而俺写这个短小的教程方便大家使用,这篇文章仅谈及基本的用法,如需深入的使用,请……自己摸索或查找别的资料。


     之前看过IBM developer社区的文章(参见附录),提到一些XML解析包的性能比较,其中DOM4J的性能非常出色,在多项测试中名列前茅。(事实上DOM4J的官方文档中也引用了这个比较)所以这次的项目中我采用了DOM4J作为XML解析工具。

      在国内比较流行的是使用JDOM作为解析器,两者各擅其长,但DOM4J最大的特色是使用大量的接口,这也是它被认为比JDOM灵活的主要原因。大师不是说过么,“面向接口编程”。目前使用DOM4J的已经越来越多。如果你善于使用JDOM,不妨继续用下去,只看看本篇文章作为了解与比较,如果你正要采用一种解析器,不如就用DOM4J吧。

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/zfmsa/archive/2007/03/13/1527738.aspx
它的主要接口都在org.dom4j这个包里定义:
Attribute Attribute定义了XML的属性 
Branch Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为, 
CDATA CDATA 定义了XML CDATA 区域 
CharacterData CharacterData是一个标识接口,标识基于字符的节点。如CDATA,Comment, Text. 
Comment Comment 定义了XML注释的行为 
Document 定义了XML文档 
DocumentType 


DocumentType 定义XML DOCTYPE声明 
Element Element定义XML 元素 
ElementHandler ElementHandler定义了 Element 对象的处理器 
ElementPath 被 ElementHandler 使用,用于取得当前正在处理的路径层次信息 
Entity Entity定义 XML entity 
Node Node为所有的dom4j中XML节点定义了多态行为 
NodeFilter NodeFilter 定义了在dom4j节点中产生的一个滤镜或谓词的行为(predicate) 
ProcessingInstruction ProcessingInstruction 定义 XML 处理指令. 
Text Text 定义XML 文本节点. 
Visitor Visitor 用于实现Visitor模式. 
XPath XPath 在分析一个字符串后会提供一个XPath 表达式 


看名字大致就知道它们的涵义如何了。
要想弄懂这套接口,关键的是要明白接口的继承关系:
interface java.lang.Cloneable 
interface org.dom4j.Node 
interface org.dom4j.Attribute 
interface org.dom4j.Branch 
interface org.dom4j.Document 
interface org.dom4j.Element 
interface org.dom4j.CharacterData 
interface org.dom4j.CDATA 
interface org.dom4j.Comment 
interface org.dom4j.Text 
interface org.dom4j.DocumentType 
interface org.dom4j.Entity 
interface org.dom4j.ProcessingInstruction 
一目了然,很多事情都清楚了。大部分都是由Node继承来的。知道这些关系,将来写程序就不会出现ClassCastException了。
下面给出一些例子(部分摘自DOM4J自带的文档),简单说一下如何使用。


1. 读取并解析XML文档:
读写XML文档主要依赖于org.dom4j.io包,其中提供DOMReader和SAXReader两类不同方式,而调用方式是一样的。这就是依靠接口的好处。
 
    // 从文件读取XML,输入文件名,返回XML文档
    public Document read(String fileName) throws MalformedURLException, DocumentException {
       SAXReader reader = new SAXReader();
       Document document = reader.read(new File(fileName));
       return document;
    }
  

    
    其中,reader的read方法是重载的,可以从InputStream, File, Url等多种不同的源来读取。得到的Document对象就带表了整个XML。根据本人自己的经验,读取的字符编码是按照XML文件头定义的编码来转换。如果遇到乱码问题,注意要把各处的编码名称保持一致即可。


2.    取得Root节点
读取后的第二步,就是得到Root节点。熟悉XML的人都知道,一切XML分析都是从Root元素开始的。
 
   public Element getRootElement(Document doc){
       return doc.getRootElement();
    }
  


3.    遍历XML树
DOM4J提供至少3种遍历节点的方法:
1) 枚举(Iterator)
 
    // 枚举所有子节点
    for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
       Element element = (Element) i.next();
       // do something
    }
    // 枚举名称为foo的节点
    for ( Iterator i = root.elementIterator(foo); i.hasNext();) {
       Element foo = (Element) i.next();
       // do something
    }
    // 枚举属性
    for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
       Attribute attribute = (Attribute) i.next();
       // do something
    } 


2)递归 
递归也可以采用Iterator作为枚举手段,但文档中提供了另外的做法
 
    public void treeWalk() {
       treeWalk(getRootElement());
    }
    public void treeWalk(Element element) {
       for (int i = 0, size = element.nodeCount(); i < size; i++)     {
           Node node = element.node(i);
           if (node instanceof Element) {
              treeWalk((Element) node);
           } else { // do something....
           }
       }
}
  


3) Visitor模式
最令人兴奋的是DOM4J对Visitor的支持,这样可以大大缩减代码量,并且清楚易懂。了解设计模式的人都知道,Visitor是GOF设计模式之一。其主要原理就是两种类互相保有对方的引用,并且一种作为Visitor去访问许多Visitable。我们来看DOM4J中的Visitor模式(快速文档中没有提供)
只需要自定一个类实现Visitor接口即可。
 
        public class MyVisitor extends VisitorSupport {
           public void visit(Element element){
               System.out.println(element.getName());
           }
           public void visit(Attribute attr){
               System.out.println(attr.getName());
           }
        }
 
        调用:  root.accept(new MyVisitor()) 

    Visitor接口提供多种Visit()的重载,根据XML不同的对象,将采用不同的方式来访问。上面是给出的Element和Attribute的简单实现,一般比较常用的就是这两个。VisitorSupport是DOM4J提供的默认适配器,Visitor接口的Default Adapter模式,这个模式给出了各种visit(*)的空实现,以便简化代码。
    注意,这个Visitor是自动遍历所有子节点的。如果是root.accept(MyVisitor),将遍历子节点。我第一次用的时候,认为是需要自己遍历,便在递归中调用Visitor,结果可想而知。
4. XPath支持
    DOM4J对XPath有良好的支持,如访问一个节点,可直接用XPath选择。
 
   public void bar(Document document) {
        List list = document.selectNodes( //foo/bar );
        Node node = document.selectSingleNode(//foo/bar/author);
        String name = node.valueOf( @name );
     }
  

    例如,如果你想查找XHTML文档中所有的超链接,下面的代码可以实现: 
 
    public void findLinks(Document document) throws DocumentException {
        List list = document.selectNodes( //a/@href );
        for (Iterator iter = list.iterator(); iter.hasNext(); ) {
            Attribute attribute = (Attribute) iter.next();
            String url = attribute.getValue();
        }
     }
  


5. 字符串与XML的转换
有时候经常要用到字符串转换为XML或反之,
 
    // XML转字符串 
  Document document = ...;
    String text = document.asXML();
// 字符串转XML
    String text = <person> <name>James</name> </person>;
    Document document = DocumentHelper.parseText(text);
  


6 用XSLT转换XML
 
   public Document styleDocument(
       Document document, 
       String stylesheet
    ) throws Exception {
    // load the transformer using JAXP
    TransformerFactory factory = TransformerFactory.newInstance();
    Transformer transformer = factory.newTransformer( 
       new StreamSource( stylesheet ) 
    );
    // now lets style the given document
    DocumentSource source = new DocumentSource( document );
    DocumentResult result = new DocumentResult();
    transformer.transform( source, result );
    // return the transformed document
    Document transformedDoc = result.getDocument();
    return transformedDoc;
}
  


7. 创建XML
  一般创建XML是写文件前的工作,这就像StringBuffer一样容易。
 
    public Document createDocument() {
       Document document = DocumentHelper.createDocument();
       Element root = document.addElement(root);
       Element author1 =
           root
              .addElement(author)
              .addAttribute(name, James)
              .addAttribute(location, UK)
              .addText(James Strachan);
       Element author2 =
           root
              .addElement(author)
              .addAttribute(name, Bob)
              .addAttribute(location, US)
              .addText(Bob McWhirter);
       return document;
    }
  


8. 文件输出
    一个简单的输出方法是将一个Document或任何的Node通过write方法输出
 
    FileWriter out = new FileWriter( foo.xml );
    document.write(out);
  

  如果你想改变输出的格式,比如美化输出或缩减格式,可以用XMLWriter类
 
    public void write(Document document) throws IOException {
       // 指定文件
       XMLWriter writer = new XMLWriter(
           new FileWriter( output.xml )
       );
       writer.write( document );
       writer.close();
       // 美化格式
       OutputFormat format = OutputFormat.createPrettyPrint();
       writer = new XMLWriter( System.out, format );
       writer.write( document );
       // 缩减格式
       format = OutputFormat.createCompactFormat();
       writer = new XMLWriter( System.out, format );
       writer.write( document );
    }
  


本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/zfmsa/archive/2007/03/13/1527738.aspx
0
0
分享到:
评论

相关推荐

    dom4j--java框架技术

    - DOM4J具有丰富的第三方插件,如JAXB支持、XML Schema支持等。 - 社区活跃,遇到问题时,可以在官方论坛或其他开发者社区寻求帮助。 总之,DOM4J作为Java处理XML的利器,其简洁的API、高效的性能和广泛的应用...

    Java解析XML汇总DOM_SAX_JDOM_DOM4j_XPath

    JDOM和DOM4j是两个独立的第三方库,它们都提供了类似于DOM的API,但具有更简洁的语法和更好的性能。 ##### JDOM JDOM是一个轻量级的Java XML API,它允许用户轻松地创建、修改和查询XML文档。与DOM不同的是,JDOM...

    Dom4j_学习教程

    此外,`dom4j.pdf`文档可能是一个详细的Dom4j官方教程或第三方教程,涵盖了Dom4j的全面使用指南和技术细节。这将是深入学习Dom4j不可或缺的参考资料。 总的来说,Dom4j是Java开发中处理XML文档的重要工具,通过本...

    Java Web jar 包 dbutils dom4j c3p0 dbcp dom4j jstl Commons Logging

    Java Web 开发中,开发者经常会使用到各种第三方库来提高开发效率和代码质量。这个压缩包包含了一些经典的Java Web开发中的重要组件,如dbutils、dom4j、c3p0、dbcp以及jstl等,同时也包含了数据库驱动和Commons ...

    java axis调用第三方webservice程序demo

    它允许开发者通过Java调用第三方提供的Webservice,使得不同系统间的数据交换变得简单。本文将详细介绍如何使用Java Axis调用第三方Webservice,并提供一个简单的示例。 一、Java Axis调用第三方Webservice的准备...

    Hibernate第三方类库

    这里提到了三个重要的第三方库:dom4j、log4j和antlr。 1. dom4j-1.6.1.jar: Dom4j是一个非常灵活的用于处理XML的Java库,它提供了丰富的API来读取、写入、修改和操作XML文档。在Hibernate中,dom4j被用作默认的...

    dom4j中文教程【有例子,其中有两篇来自IBM及其他网站网站】

    2. **dom4j.pdf**:这可能是DOM4J的官方文档或者第三方编写的教程,PDF格式方便离线阅读和查阅。 3. **Dom4jXML**:这个文件名可能表示包含使用DOM4J处理XML的实例代码或示例XML文件,可以结合学习理解DOM4J的实际...

    java常用第三方软件包大全_.docx

    以下是一些常见的Java第三方软件包及其用途的详细介绍: 1. **Apache POI**:用于处理Microsoft Office文档,如Excel、Word和PowerPoint,提供了读写这些文件格式的能力。 2. **iText**:是一个PDF操作库,支持...

    Android例子源码集成安卓主流优秀第三方组件框架.zip

    已集成第三方开源组件: 网络请求库android-async-http 图片异步加载库universal-image-loader Sqlite数据库操作ormlite-android 社会化分享ShareSDK 短信验证码 Zxing二维码库 百度地图定位SDK 谷歌依赖注入...

    集成安卓主流优秀第三方组件框架.zip

    已集成第三方开源组件: 网络请求库android-async-http 图片异步加载库universal-image-loader Sqlite数据库操作ormlite-android 社会化分享ShareSDK 短信验证码 Zxing二维码库 百度地图定位SDK 谷歌依赖注入...

    java相关jar包

    Java相关jar包是一个重要的软件开发资源集合,主要涵盖了Spring框架的4.0版本,DOM处理库dom4j,以及AOP(面向切面编程)相关的类库,还有用于查看Java源码的MyEclipse反编译工具。这些组件在Java开发中扮演着不可或...

    java操纵xml文件的读写,并根据xml生成树型菜单

    **知识点**: 上述代码展示了用于读写文件的基本Java类库(如`java.io.*`),以及用于处理XML的第三方库JDOM中的`SAXBuilder`等类。这些类是实现XML文件读写的基石。 ##### 2. 常量定义 ```java private static ...

    使用java操作xml

    为了方便地操作XML文件,开发者通常会利用第三方库,如dom4j。本篇文章将深入探讨如何使用dom4j库进行XML文件的读取和写入操作。 首先,我们需要了解dom4j是什么。dom4j是一个开源的Java XML API,它提供了全面且...

    Android集成主流优秀第三方组件框架

    已集成第三方开源组件: 网络请求库android-async-http 图片异步加载库universal-image-loader Sqlite数据库操作ormlite-android 社会化分享ShareSDK+短信验证码 Zxing二维码库 百度地图定位SDK 谷歌依赖注入库...

    集成目前Android主流优秀第三方组件

    已集成第三方开源组件: 网络请求库android-async-http 图片异步加载库universal-image-loader Sqlite数据库操作ormlite-android 社会化分享ShareSDK+短信验证码 Zxing二维码库 百度地图定位SDK 谷歌依赖注入库...

    GDATAXML-xml解析的第三方类库

    **GDATAXML:XML解析的第三方类库** GDATAXML是一个强大的开源类库,专为XML解析设计,尤其适用于iOS和Mac OS X平台。它由Google开发并维护,因此得名“GDATA”,是Google Data的缩写。GDATAXML提供了Objective-C...

    json/ajax第三方jar包

    JSON(JavaScript Object Notation)是一种轻量级的...这个"json/ajax第三方jar包"可能包含了实现这些功能所需的Java库,方便开发者在实际项目中使用。学习和掌握这些技术,对于提升Web应用的用户体验和性能至关重要。

    java读取xml用到的jar包集合

    JDOM是一个第三方库,它提供了一个纯Java的DOM实现,相比Java内置的DOM,JDOM的API设计更面向Java开发者,使用起来更加直观。JDOM可以简化XML的读写操作。 6. **DOM4J** DOM4J是另一个流行的Java XML库,它提供了...

    java操作xml文件的一个简单代码

    Java操作XML文件是软件开发中常见的任务,XML(Extensible Markup Language)因其结构化和可扩展性被广泛用于数据交换和存储。...同时,也可以查阅DOM4J、JDOM等第三方库的文档,了解它们如何简化XML操作。

    Java 浏览器 Java浏览器

    Java可以使用内置的XML解析器处理HTML文档,但对于更复杂的DOM操作,可能需要使用如Jsoup或Apache HttpClient这样的第三方库。这些库提供了更方便的方式来解析HTML、查找元素、执行JavaScript以及与网页进行交互。 ...

Global site tag (gtag.js) - Google Analytics