`

DOM4J介绍与代码示例

    博客分类:
  • xml
 
阅读更多
DOM4Jdom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库,用于XMLXPathXSLT。它应用于Java平台,采用了Java集合框架并完全支持DOMSAXJAXP
DOM4J下载jar包:http://downloads.sourceforge.net/dom4j/dom4j-1.6.1.jar
JAXEN(对XPath的支持):http://dist.codehaus.org/jaxen/distributions/jaxen-1.1.1.zip
1.DOM4J主要接口
DOM4J主要接口都在org.dom4j这个包里定义。
 

 

 
-Node为所有的dom4jXML节点定义了多态行为;
 
-Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为;
|-Element 定义XML 元素;
|-Document定义了XML文档;
 
-DocumentType 定义XML DOCTYPE声明;
-Entity定义 XML entity
-Attribute定义了XML的属性;
-ProcessingInstruction 定义 XML 处理指令;
 
-CharacterData是一个标识借口,标识基于字符的节点。如CDATAComment, Text
|- CDATA 定义了XML CDATA 区域;
|-Text 定义XML 文本节点;
|- Comment 定义了XML注释的行为;
2.创建XML文档
示例xmlstudents.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="students.xsl"?>
<students>
    <!--A Student Catalog-->
    <student sn="01">
       <name>sam</name>
       <age>18</age>
    </student>
    <student sn="02">
       <name>lin</name>
       <age>20</age>
    </student>
</students>
 
下面是用dom4j创建上述文档,通过两种方式创建,一种是调用dom4j提供的方法,一种是通过字符串转换。
XmlGen.java
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
 
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.XMLWriter;
 
publicclass XmlGen {
    public Document generateDocumentByMethod() {
       Document document = DocumentHelper.createDocument();
       // ProcessingInstruction
       Map<String, String> inMap = new HashMap<String, String>();
       inMap.put("type", "text/xsl");
       inMap.put("href", "students.xsl");
       document.addProcessingInstruction("xml-stylesheet", inMap);
       // root element
       Element studentsElement = document.addElement("students");
       studentsElement.addComment("An Student Catalog");
       // son element
       Element stuElement = studentsElement.addElement("student");
       stuElement.addAttribute("sn", "01");
       Element nameElement = stuElement.addElement("name");
       nameElement.setText("sam");
       Element ageElement = stuElement.addElement("age");
       ageElement.setText("18");
       // son element
       Element anotherStuElement = studentsElement.addElement("student");
       anotherStuElement.addAttribute("sn", "02");
       Element anotherNameElement = anotherStuElement.addElement("name");
       anotherNameElement.setText("lin");
       Element anotherAgeElement = anotherStuElement.addElement("age");
       anotherAgeElement.setText("20");
 
       return document;
    }
 
    public Document generateDocumentByString() {
       String text = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>" +
              "<?xml-stylesheet type=\"text/xsl\" href=\"students.xsl\"?>" +
              "<students><!--An Student Catalog-->   <student sn=\"01\">" +
              "<name>sam</name><age>18</age></student><student sn=\"02\">" +
              "<name>lin</name><age>20</age></student></students>";
       Document document = null;
       try {
           document = DocumentHelper.parseText(text);
       } catch (DocumentException e) {
           e.printStackTrace();
       }
       return document;
    }
 
    publicvoid saveDocument(Document document, File outputXml) {
       try {
           // 美化格式
           OutputFormat format = OutputFormat.createPrettyPrint();
           /*// 缩减格式
           OutputFormat format = OutputFormat.createCompactFormat();*/
           /*// 指定XML编码
            format.setEncoding("GBK");*/
           XMLWriter output = new XMLWriter(new FileWriter(outputXml), format);
           output.write(document);
           output.close();
       } catch (IOException e) {
           System.out.println(e.getMessage());
       }
    }
 
    publicstaticvoid main(String[] argv) {
       XmlGen dom4j = new XmlGen();
       Document document = null;
       // document=dom4j.generateDocumentByMethod();
       document = dom4j.generateDocumentByString();
       dom4j.saveDocument(document, new File("output.xml"));
    }
}
方法generateDocumentByMethod()通过调用方法构建xml文档:
1.使用DocumentHelper得到Document实例
Document document = DocumentHelper.createDocument();
2.创建Processing Instruction
document.addProcessingInstruction("xml-stylesheet", inMap);
3.创建元素Element
Element studentsElement = document.addElement("students");
4.为元素添加注释Comment
studentsElement.addComment("An Student Catalog");
5.为元素添加属性
studentsElement.addComment("An Student Catalog");
6.为元素添加文本值Text
ageElement.setText("18");
 
方法generateDocumentByString()通过字符串转换直接构建xml文档,使用DocumentHelper.parseText()来实现.
document = DocumentHelper.parseText(text);
 
方法saveDocument(Document document, File outputXml)将文档输出到文件保存,可指定字符编码,可指定格式化输出。
3.修改XML文档
这里使用xpath来定位待修改的元素和属性,需要jaxen的支持。
示例中将students-gen.xml的第一个student元素的sn属性改为001,其子元素name内容改为jeff
XmlMod.java
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
 
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
 
publicclass XmlMod {
    publicvoid modifyDocument(File inputXml) {
       try {
           SAXReader saxReader = new SAXReader();
           Document document = saxReader.read(inputXml);
           List list = document.selectNodes("//students/student/@sn");
           Iterator iter = list.iterator();
           while (iter.hasNext()) {
              Attribute attribute = (Attribute) iter.next();
              if (attribute.getValue().equals("01"))
                  attribute.setValue("001");
           }
 
           list = document.selectNodes("//students/student");
           iter = list.iterator();
           while (iter.hasNext()) {
              Element element = (Element) iter.next();
              Iterator iterator = element.elementIterator("name");
              while (iterator.hasNext()) {
                  Element nameElement = (Element) iterator.next();
                  if (nameElement.getText().equals("sam"))
                     nameElement.setText("jeff");
              }
           }
 
           XMLWriter output = new XMLWriter(new FileWriter(new File(
                  "students-modified.xml")));
           output.write(document);
           output.close();
       }
 
       catch (DocumentException e) {
           System.out.println(e.getMessage());
       } catch (IOException e) {
           System.out.println(e.getMessage());
       }
    }
 
    publicstaticvoid main(String[] argv) {
       XmlMod dom4jParser = new XmlMod();
       dom4jParser.modifyDocument(new File("students-gen.xml"));
    }
}
1.使用File定位文件资源,并基于此获得Document实例
SAXReader saxReader = new SAXReader();
Document document = saxReader.read(inputXml);
2.Document实例的selectNodes方法可以传入xpath,并返回一个List实例,基于此使用迭代器,完成特定的应用
List list = document.selectNodes("//students/student/@sn");
4.遍历XML文档
这里提供两种遍历方法,一种是基于迭代的遍历,一种是基于Visitor模式的遍历。
XmlTra.java
import java.io.File;
import java.util.Iterator;
 
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.ProcessingInstruction;
import org.dom4j.VisitorSupport;
import org.dom4j.io.SAXReader;
 
publicclass XmlTra {
    private File inputXml;
 
    public XmlTra(File inputXml) {
       this.inputXml = inputXml;
    }
 
    public Document getDocument() {
       SAXReader saxReader = new SAXReader();
       Document document = null;
       try {
           document = saxReader.read(inputXml);
       } catch (DocumentException e) {
           e.printStackTrace();
       }
       return document;
    }
 
    public Element getRootElement() {
       return getDocument().getRootElement();
    }
 
    publicvoid traversalDocumentByIterator() {
       Element root = getRootElement();
       // 枚举根节点下所有子节点
       for (Iterator ie = root.elementIterator(); ie.hasNext();) {
           System.out.println("======");
           Element element = (Element) ie.next();
           System.out.println(element.getName());
 
           // 枚举属性
           for (Iterator ia = element.attributeIterator(); ia.hasNext();) {
              Attribute attribute = (Attribute) ia.next();
              System.out.println(attribute.getName() + ":"
                     + attribute.getData());
           }
           // 枚举当前节点下所有子节点
           for (Iterator ieson = element.elementIterator(); ieson.hasNext();) {
              Element elementSon = (Element) ieson.next();
              System.out.println(elementSon.getName() + ":"
                     + elementSon.getText());
           }
       }
    }
 
    publicvoid traversalDocumentByVisitor() {
       getDocument().accept(new MyVisitor());
    }
 
    /**
     *定义自己的访问者类
     */
    privatestaticclass MyVisitor extends VisitorSupport {
       /**
        *对于属性节点,打印属性的名字和值
        */
       publicvoid visit(Attribute node) {
           System.out.println("attribute : " + node.getName() + " = "
                  + node.getValue());
       }
 
       /**
        *对于处理指令节点,打印处理指令目标和数据
        */
       publicvoid visit(ProcessingInstruction node) {
           System.out.println("PI : " + node.getTarget() + " "
                  + node.getText());
       }
 
       /**
        *对于元素节点,判断是否只包含文本内容,如是,则打印标记的名字和元素的内容。如果不是,则只打印标记的名字
        */
       publicvoid visit(Element node) {
           if (node.isTextOnly())
              System.out.println("element : " + node.getName() + " = "
                     + node.getText());
           else
              System.out.println("--------" + node.getName() + "--------");
       }
    }
 
    publicstaticvoid main(String[] argv) {
       XmlTra dom4jParser = new XmlTra(new File("students-gen.xml"));
       // dom4jParser.traversalDocumentByIterator();
       dom4jParser.traversalDocumentByVisitor();
    }
}
方法traversalDocumentByIterator()提供一种基于迭代的遍历实现,每个Element通过elementIterator()attributeIterator()取代其子元素和属性的迭代器。
VisitorGOF设计模式之一。其主要原理就是两种类互相保有对方的引用,并且一种作为Visitor去访问许多VisitableDOM4J中的Visitor模式只需要自定一个类实现Visitor接口即可。
publicclass MyVisitor extends VisitorSupport {
    publicvoid visit(Element element) {
       System.out.println(element.getName());
    }
 
    publicvoid visit(Attribute attr) {
       System.out.println(attr.getName());
    }
}
调用:  root.accept(new MyVisitor())
    Visitor接口提供多种Visit()的重载,根据XML不同的对象,将采用不同的方式来访问。上面是给出的ElementAttribute的简单实现,一般比较常用的就是这两个。VisitorSupportDOM4J提供的默认适配器,Visitor接口的Default Adapter模式,这个模式给出了各种visit(*)的空实现,以便简化代码。
    注意,这个Visitor是自动遍历所有子节点的。如果是root.accept(MyVisitor),将遍历子节点。我第一次用的时候,认为是需要自己遍历,便在递归中调用Visitor,结果可想而知。
5.使用ElementHandler
XmlHandler.java
import java.io.File;
 
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.ElementHandler;
import org.dom4j.ElementPath;
import org.dom4j.io.SAXReader;
 
publicclass XmlHandler {
    publicstaticvoid main(String[] args) {
       SAXReader saxReader = new SAXReader();
       File file = new File("students.xml");
       try {
           // 添加一个ElementHandler实例。
           saxReader.addHandler("/students/student", new StudentHandler());
           saxReader.read(file);
 
       } catch (DocumentException e) {
           System.out.println(e.getMessage());
       }
    }
 
    /**
     *定义StudentHandler处理器类,对<student>元素进行处理。
     */
    privatestaticclass StudentHandler implements ElementHandler {
       publicvoid .Start(ElementPath path) {
           Element elt = path.getCurrent();
           System.out.println("Found student: " + elt.attribut.ue("sn"));
           // 添加对子元素<name>的处理器。
           path.addHandler("name", new NameHandler());
       }
 
       publicvoid .End(ElementPath path) {
           // 移除对子元素<name>的处理器。
           path.removeHandler("name");
       }
    }
 
    /**
     *定义NameHandler处理器类,对<student><name>子元素进行处理。
     */
    privatestaticclass NameHandler implements ElementHandler {
       publicvoid .Start(ElementPath path) {
           System.out.println("path : " + path.getPath());
       }
 
       publicvoid .End(ElementPath path) {
           Element elt = path.getCurrent();
           // 输出<name>元素的名字和它的文本内容。
           System.out.println(elt.getName() + " : " + elt.getText());
       }
    }
}
6.使用XSLT转换XML
这里必须使用JAXP的支持。
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
 
import org.dom4j.Document;
import org.dom4j.io.DocumentResult;
import org.dom4j.io.DocumentSource;
 
    ……
    public Document styleDocument(Document document, String stylesheet)
           throws Exception {
 
       // load the transformer using JAXP
       TransformerFactory factory = TransformerFactory.newInstance();
       Transformer transformer = factory.newTransformer(new StreamSource(stylesheet));
 
       // now lets style the given document
       DocumentSource source = new DocumentSource(document);
       DocumentResult result = new DocumentResult();
       transformer.transform(source, result);
 
       // return the transformed document
       Document transformedDoc = result.getDocument();
       return transformedDoc;
    }
……
 

 

本文出自 “子 孑” 博客,原始出处:http://zhangjunhd.blog.51cto.com/113473/126310

  • 大小: 28.1 KB
分享到:
评论

相关推荐

    dom4j解析xml文件代码示例

    在本示例中,我们将深入探讨如何使用DOM4J解析XML文件,以`CacheInit.java`作为我们的核心代码示例,并参考`emailTemplateConfig.xml`作为实际操作的对象。 首先,让我们了解XML(eXtensible Markup Language)。...

    DOM4J小示例

    本节将通过一个具体的示例来介绍如何使用DOM4J进行XML文档的创建和解析。 ##### 1. 创建XML文档 在给定的示例代码中,首先使用`DocumentHelper.createDocument()`方法创建了一个新的`Document`对象,该对象代表了...

    dom4j示例

    总的来说,DOM4J示例文件可能会涵盖这些基本操作,并通过实际的代码示例展示如何使用DOM4J处理XML文档。学习这些示例将有助于理解XML文档的操作,包括读取、创建、修改和输出,对于任何处理XML的Java开发者来说都是...

    dom4j_1.6.1.jar dom4j_2.1.0.jar

    这个列表只包含了一个条目"xml",可能意味着压缩包中包含的是与XML相关的文件或资源,可能是XML示例文件、测试用例或者与DOM4J处理XML相关的配置文件。 总结来说,DOM4J是一个强大的XML处理库,提供了丰富的API和...

    dom4j_API_示例.doc

    DOM4J的架构基于一套丰富的接口,这些接口共同构成了DOM4J的核心框架,下面我们将详细介绍其中的关键接口: - **Attribute**: 定义XML中的属性,提供了获取和设置属性值的方法,使得属性管理变得简单。 - **Branch*...

    DOM4J帮助文档及使用教程

    11. **示例代码**:每个章节都会配以清晰的代码示例,帮助读者更好地理解和应用DOM4J。 12. **常见问题与解决方案**:列举了一些在使用DOM4J过程中可能会遇到的问题及其解决方法。 通过阅读和实践DOM4J的帮助文档...

    dom4j-2.0.3.zip

    本篇将详细介绍DOM4J的核心概念、主要功能以及如何在实际项目中运用。 一、DOM4J简介 DOM4J是基于DOM模型的,但相比Java内置的DOM API,DOM4J更轻量级且易于使用。它支持XPath查询,提供了丰富的事件处理机制,...

    dom4j需要的包

    学习帮助文档`0_02013011112572651533851383.chm`通常是一个Windows系统的帮助文件,可能包含了DOM4J的详细教程、API参考和示例代码,对于初学者来说是非常有价值的资源。CHM文件是Microsoft编写的HTML帮助格式,...

    dom4j-jar与dom4j解析xml文档介绍

    "dom4j-jar与dom4j解析xml文档介绍" 这个标题告诉我们,我们将探讨的是一个关于dom4j库的jar文件,以及如何使用这个库来解析XML文档。dom4j是一个Java库,它提供了丰富的API用于处理XML、HTML和DOM文档。这里的"jar...

    DOM4J 的使用

    DOM4J 的使用 DOM4J 是一个开源的 XML 解析包,由 dom4j.org 出品,应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM、SAX 和 JAXP。DOM4J 的主要特点是使用大量的接口,所有主要接口都在 org.dom4j 里面定义...

    dom4j 2.1.1

    在解压后的文件“dom4j”中,可能包含了DOM4J库的源码、API文档、示例代码等资源,这对于深入理解和使用DOM4J非常有帮助。通过阅读源码,可以了解其实现原理;查看API文档,可以快速找到所需功能的方法和接口;运行...

    JavaScript dom操作 删除元素 示例代码

    示例代码JavaScript dom操作 删除元素 示例代码JavaScript dom操作 删除元素 示例代码JavaScript dom操作 删除元素 示例代码JavaScript dom操作 删除元素 示例代码JavaScript dom操作 删除元素 示例代码JavaScript ...

    dom4j-2.1.3.zip

    同时,DOM4J与Java Collections Framework紧密集成,使得XML数据可以无缝地与Java集合对象相互转换。 在实际开发中,DOM4J常被用于Web服务、配置文件管理、数据交换等多种场景。例如,它可以帮助开发者轻松地解析和...

    xml 三种解析方式dom,sax,dom4j

    在提供的压缩包中,包含了关于这三种解析方式的代码示例,你可以参考这些代码了解如何在Java环境中使用DOM、SAX和DOM4J进行XML解析。通过阅读和理解这些示例,你可以更好地掌握XML解析技术,并根据项目需求选择合适...

    dom4j-java-API

    - DOM4J API.CHM文件很可能是DOM4J的官方帮助文档,包含了详细的API参考、示例代码和使用指南,对于学习和使用DOM4J非常有帮助。 5. **使用CHM文件** - 双击CHM文件,通常会用默认的浏览器打开,用户可以通过目录...

    dom4j的Java工程

    在这个“dom4j的Java工程”中,我们可以看到一个示例项目,展示了如何利用DOM4J库进行XML文件的增、删、改、查操作。 首先,让我们深入了解DOM4J的基本概念。DOM4J采用了Document Object Model (DOM)接口,但它的...

    dom4j_API_示例

    4. **开放源代码:**DOM4J是一个开源项目,这意味着开发者可以自由地修改和扩展其功能,同时也能够受益于社区的支持和贡献。 #### 三、DOM4J核心概念 DOM4J的核心概念围绕着XML文档的各种组成部分展开,包括元素、...

    dom4j完整版.zip

    压缩包中的“使用说明.txt”很可能是DOM4J的快速入门指南或API参考,它可能包含了如何导入库、创建XML文档、执行XPath查询、修改XML结构等基础用法的示例代码。对于初次使用者来说,这份文档是理解DOM4J功能和用法的...

    dom4j练习示例(备忘用)

    这个"dom4j练习示例(备忘用)"压缩包很可能是包含了一些代码示例,帮助学习者理解和掌握DOM4J的核心功能。 在DOM4J中,XML文档被表示为一个树形结构,根节点是Document对象,而其他元素、属性、文本等都是其子节点。...

Global site tag (gtag.js) - Google Analytics