`
hn_archer
  • 浏览: 132974 次
  • 性别: Icon_minigender_1
  • 来自: 河南
社区版块
存档分类
最新评论

使用 dom4j 解析 XML

 
阅读更多

 

 dom4j是一种解析XML文档的开放源代码的XML框架。从性能上来说,这个框架已经远远的超过了W3C DOM、JDOM了。而且,dom4j支持XPath。

   dom4j的API里面包含一个解析XML文档的工具,我们使用这个解析器创建一个示例XML文档,清单1.catalog.xml。然后使用同一个解析器修改catalog.xml,清单2是修改生的XML文档,catalog-modified.xml。 

 

清单1.示例XML文档(catalog.xml)

 

<?xml version="1.0" encoding="UTF-8"?>
<catalog>
 <!--An XML Catalog-->
 <?target instruction?>
 <journal title="XML Zone" publisher="IBM developerWorks">
   <article level="Intermediate" date="December-2001">
     <title>Java configuration with XML Schema</title>
     <author>
       <firstname>Marcello</firstname>
       <lastname>Vitaletti</lastname>
     </author>
   </article>
 </journal>
</catalog> 

清单2.修改后的XML文档(catalog-modified.xml)

 

<?xml version="1.0" encoding="UTF-8"?>
<catalog>
<!--An XML catalog-->
<?target instruction?>
    <journal title="XML Zone" publisher="IBM developerWorks">
       <article level="Introductory" date="October-2002">
           <title>Create flexible and extensible XML schemas</title>
           <author>
              <firstname>Ayesha</firstname>
              <lastname>Malik</lastname>
           </author>
       </article>
    </journal>
</catalog>

一:创建catalog.xml

 

// 1:使用DocumentHelper类创建一个文档实例。DocumentHelper是生成XML文档节点的dom4j API 工厂类。
Document document = DocumentHelper.createDocument();

// 2:使用addElement()方法创建根元素catalog。addElement()用于向XML文档中啬元素。
Element catalogElement = document.addElement("catalog");

// 3:在catalog元素中使用addComment()方法添加注释“An XML catalog”。
catalogElement.addComment("An XML catalog");

// 4:在catalog元素中使用addProcessingInstruction()方法增加一个处理指令。
catalogElement.addProcessingInstruction("target", "text");

// 5:在catalog元素中使用addElement()方法啬journal元素。
Element journalElement = catalogElement.addElement("journal");

// 6:使用addAttribute()方法向journal元素添加title和publisher属性。
journalElement.addAttribute("title", "XML Zone");
journalElement.addAttribute("publisher", "IBM developerWorks");

// 7:向journal元素中添加article元素,并添加level和date属性。
Element articleElement = journalElement.addElement("article").addAttribute(
    "level", "Intermediate").addAttribute("date", "December-2001");

// 8:向article元素中添加title元素,author元素。
Element titleElement = articleElement.addElement("title");
titleElement.setText("Java configuration with XML Schema");

Element authorElement = articleElement.addElement("author");

Element firstNameElement = authorElement.addElement("firstname");
firstNameElement.setText("Marcello");

Element lastNameElement = authorElement.addElement("lastname");
lastNameElement.setText("Vitaletti");

// 9:还可以用addDocType()方法向文件加入文档类型说明
document.addDocType("catalog", null, "file://c:/Dtds/catalog.dtd");
// 这样就会身XML文档中添加文档类型说明:
// <!DOCTYPE catalog SYSTEM “file://c:/Dtds/catalog.dtd">
// 如果文档 要作用文档类型定义(DTD)文档验证则必须有Doctype。

// 10:把Document写入文件
try {
  XMLWriter output = new XMLWriter(new FileWriter("e:/catalog.xml"));
  output.write(document);
  output.close();
} catch (IOException e) {
  System.out.println(e.getMessage());
} 

经过以上10个过程,我们创建了catalog.xml文档。下面我们把catalog.xml修改一下,并生成catalog-modified.xml。

 

二:创建catalog-modified.xml

 

// 1:使用 SAXReader 解析 XML 文档 catalog.xml:
SAXReader saxReader = new SAXReader();
Document documentOld = saxReader.read(new File("e:/catalog.xml"));

// 2:使用XPath表达式从article元素中获得level节点列表,如果level属性值是“Intermediate”则改为“Introductory”。
List list = documentOld.selectNodes("//article/@level");
Iterator iter = list.iterator();
while (iter.hasNext()) {
  Attribute attribute = (Attribute) iter.next();

  if (attribute.getValue().equals("Intermediate"))
    attribute.setValue("Introductory");
}

// 3:修改title
/*
 * 1:遍历所有article元素 2:遍历article元素下的title元素 3:比较修改
 */
list = document.selectNodes("//article");
iter = list.iterator();
while (iter.hasNext()) {
  Element element = (Element) iter.next();
  Iterator iterator = element.elementIterator("title");
  while (iterator.hasNext()) {
    Element titleElement1 = (Element) iterator.next();
    if (titleElement1.getText()
        .equals("Java configuration with XML Schema"))
      titleElement1.setText("Create flexible and extensible XML schema");
  }
} 

以过多次修改,得到catalog-modified.xml的Document对象,再写入文件!

 

从上面的例子,我们可以看出,dom4j里最常用的几个地方是:

 

1:枚举(Iterator)

// 枚举所有子节点

for ( Iterator i = root.elementIterator(); i.hasNext(); ) {

   Element element = (Element) i.next();

   // do something

}

// 枚举名称为foo的节点

for ( Iterator i = root.elementIterator("foo"); i.hasNext();) {

   Element foo = (Element) i.next();

   // do something

}

// 枚举属性

for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {

   Attribute attribute = (Attribute) i.next();

   // do something

}

 

2:递归

public void treeWalk(Element element) {

    for (int i = 0, size = element.nodeCount(); i < size; i++) {

       Node node = element.node(i);

       if (node instanceof Element) {

           treeWalk((Element) node);

       } else {

           // do something....

       }

    }

}

 

3:得到想要的节点的对象,对XPath的良好支持

public void bar(Document document) {

List list = document.selectNodes("//foo/bar");

Node node = document.selectSingleNode("//foo/bar/author");

String name = node.valueOf("@name");

}

例如,如果你想查找XHTML 文档中所有的超链接,下面的代码可以实现:

public void findLinks(Document document) throws

DocumentException {

List list = document.selectNodes( //a/@href );

for (Iterator iter = list.iterator(); iter.hasNext(); ) {

Attribute attribute = (Attribute) iter.next();

String url = attribute.getValue();

}

}

 

4:XML----String转换

// XML 转字符串

Document document = ...;

String text = document.asXML();

// 字符串转XML

String text = "<person><name>James</name></person>";

Document document = DocumentHelper.parseText(text);

 

 

下面的例子,是一个运用递归,复制文件的例子:

 

Dom4jDemo2 dom4jDemo = new Dom4jDemo2();

// ------------源---------------

SAXReader saxReader = new SAXReader();

Document docSource = saxReader.read(new File("e:\\jcmReponse.xml"));

Element rootSource = docSource.getRootElement();

 

// ------------目标-------------

Document docTarget = DocumentHelper.createDocument();

Element rootTarget = docTarget.addElement(rootSource.getNamespacePrefix()   +":"+rootSource.getName());

 

dom4jDemo.treeWalk(iteratorSource,return1);

dom4jDemo.writeNewXml(docTarget, "e:\\b.xml");

 

// 写入

public void writeNewXml(Document doc, String fileName) {

try {

    OutputFormat format = OutputFormat.createPrettyPrint();

    XMLWriter writer = new XMLWriter(new FileWriter(fileName), format);

    writer.write(doc);

    writer.close();

} catch (IOException e) {

    e.printStackTrace();

  }

}

 

// 递归

private void treeWalk(Element element, Element targetE) {

    for (int i = 0, size = element.nodeCount(); i < size; i++) {

       Node node = element.node(i);

       Element eTemp = null;

       if (node instanceof Element) {           

 

           String nameSpacePrefix = ((Element) node).getNamespacePrefix();

           if(nameSpacePrefix == null || "".equals(nameSpacePrefix))

              eTemp = targetE.addElement(node.getName());

           else

              eTemp = targetE.addElement(nameSpacePrefix + ":"+ node.getName());

 

           eTemp.setText(node.getText());

 

           for (Iterator ite = ((Element) node).attributeIterator(); ite.hasNext();) {

              Attribute atr = (Attribute) ite.next();

              eTemp.addAttribute(atr.getNamespacePrefix() + ":"

                     + atr.getName(), atr.getValue());

           }

           treeWalk((Element) node, eTemp);

       }

    }

}  

分享到:
评论

相关推荐

    使用dom4j解析XML

    【使用dom4j解析XML】 dom4j是一个强大的开源XML框架,它提供了处理XML文档的各种功能,包括解析、创建、修改等。相比W3C DOM API,dom4j的优势在于其内置的XPath支持,允许更方便地定位和操作XML文档中的节点。 *...

    使用DOM4j解析XML文件

    ### 使用DOM4j解析XML文件:提升开发效率与代码可读性 在现代软件开发中,XML(Extensible Markup Language)是一种广泛使用的数据交换格式,它以人类可读的文本形式存储结构化信息。然而,如何高效、准确地解析XML...

    dom4j解析xml详解

    ### DOM4J解析XML详解 #### 一、DOM4J简介与特性 DOM4J是一个由dom4j.org开发的开源XML解析包,专为Java平台设计,它不仅支持DOM、SAX和JAXP标准,还巧妙地融入了Java集合框架,使其成为Java开发者在处理XML数据时...

    dom4j解析xml,连接oracle数据库

    在本实例中,我们将深入探讨如何使用DOM4J解析XML,并利用这些数据连接Oracle数据库进行数据操作。 首先,让我们了解DOM4J的基本用法。DOM4J的主要类包括`Document`、`Element`、`Attribute`和`Namespace`。`...

    使用DOM4j解析xml

    ### 使用DOM4j解析XML详解 #### DOM4j概述 DOM4j是一个Java库,用于处理XML数据。它提供了一种高效、灵活的方式来解析、创建和修改XML文档。DOM4j支持DOM、SAX和JDOM等接口,使得开发者可以在不同的环境中选择最...

    dom4j解析xml

    在提供的文件列表中,`Test.java`可能包含使用DOM4J解析XML的示例代码。通常,这样的代码会包含以下部分: ```java import org.dom4j.Document; import org.dom4j.DocumentHelper; import org.dom4j.Element; // ...

    dom4j 解析xml实例

    在这个实例中,我们将深入探讨如何使用DOM4J解析XML文件,并通过`Dom4jTest1.java`这个示例程序来理解其工作原理。 首先,我们需要了解XML(Extensible Markup Language)是一种标记语言,常用于存储和传输数据。...

    分别使用DOM和DOM4j解析XML文件

    以下是如何使用DOM4j解析XML: 1. 引入DOM4j库(如:dom4j-1.6.1.jar)。 2. 创建DocumentFactory实例。 3. 使用DocumentFactory的read()方法读取XML文件,得到Document对象。 4. 使用Document对象提供的方法(如...

    dom4j解析xml文件代码示例

    在本示例中,我们将深入探讨如何使用DOM4J解析XML文件,以`CacheInit.java`作为我们的核心代码示例,并参考`emailTemplateConfig.xml`作为实际操作的对象。 首先,让我们了解XML(eXtensible Markup Language)。...

    dom4j 解析写入xml

    1、xml文档解析 2、 dom4j解析xml 3、实现xml文件解析 xml字符串解析 xml MAP键值对解析 4、实现xml写入与生成文件

    java dom4j解析xml

    Java DOM4J解析XML是一种常见的处理XML文档的技术,它提供了灵活且高效的API,使得开发者能够方便地读取、写入、修改以及操作XML文件。DOM4J是Java中一个非常强大的XML处理库,它结合了DOM、SAX和JDOM的优点,同时也...

    dom4j解析XML所需要的jar包

    为了在Java项目中使用DOM4J解析XML,你需要将这两个jar文件(dom4j-1.6.1和jaxen-1.1-beta-7.jar)添加到你的类路径(classpath)中。这可以通过在IDE中配置构建路径,或者在命令行中指定 `-cp` 参数来完成。一旦...

    使用dom4j和jaxen解析xml

    - **dom4j+jaxen操作XML**:首先使用dom4j解析XML,然后通过jaxen创建XPath对象并执行查询。查询结果可以是元素、属性或其他XML节点,根据需要进行进一步处理。 例如,以下代码展示了如何使用dom4j和jaxen解析XML...

    dom4j解析xml文件的压缩包

    为了使用这个库,你需要将该jar包添加到项目的类路径中,然后就可以通过DOM4J提供的类和方法来解析和操作XML文件了。 总之,DOM4J是一个功能强大的XML处理库,无论是在小型项目还是大型系统中,都能发挥其优势,...

    利用Dom4j生成XML和解析XML

    在本文中,我们将学习如何使用 Dom4j 生成 XML 文档和解析 XML 文档。 生成 XML 文档 使用 Dom4j 生成 XML 文档非常简单。首先,我们需要创建一个 Document 对象,然后添加元素和属性。下面是一个生成 XML 文档的...

Global site tag (gtag.js) - Google Analytics