`
yehuijia
  • 浏览: 9553 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

利用dom4j对任意xml的解析

    博客分类:
  • JAVA
阅读更多
java利用dom4j对任意xml的解析JAVA 2009-12-26 17:01:35 阅读23 评论2 字号:大中小
             最近完成了java对任意对象生成xml,有写了下java对任意一个xml文件的解析,生成主要靠反射原理来完成,而解析则主要是遍历xml树的每个节点,并对每个节点进行处理。刚刚开始我写了个如下的解析文件。



package javaForXML;

import java.io.File;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
* 利用dom4j进行XML解析
* 没用递归,本类只能解析到两层嵌套的属性和值
* @date Dec 25, 20094:43:47 PM
* @author zhangjp
* @param
*/
public class PraseXMLTest5 {
   
    /**
     * 遍历每个节点和属性
     * @param filename
     * @returnPraseXMLTest5.java
     */
public  static  List<Map<String,String>> iterateWholeXML(String filename) {

  List <Map<String,String>>list = new ArrayList<Map<String,String>>();
  SAXReader saxReader = new SAXReader();

   try {
    Document document = saxReader.read(new File(filename));
    Element root = document.getRootElement();

    // 遍历根结点的所有孩子节点
    for (Iterator iter = root.elementIterator(); iter.hasNext();) {
     HashMap<String, String> map = new HashMap<String, String>();

     Element element = (Element) iter.next();
     if (element == null)
      continue;
     // 获取属性和它的值
     for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
      Attribute attr = (Attribute) attrs.next();
      if (attr == null)
       continue;
      String attrName = attr.getName();
      String attrValue = attr.getValue();

      map.put(attrName, attrValue);
     }
     if(element.isTextOnly()){
      String elementName = element.getName();
      String elementValue = element.getText();
      map.put(elementName, elementValue);
     }else{
     // 遍历结点的所有孩子节点,并进行处理
     for (Iterator iterInner = element.elementIterator(); iterInner.hasNext();) {
       Element elementInner = (Element) iterInner.next();
       //如果没有孩子结点,则直接取值
       if (elementInner == null){
        String elementName = element.getName();
        String elementValue = element.getText();
        map.put(elementName, elementValue);
       }
       
       //孩子结点的属性
       for(Iterator innerAttrs = elementInner.attributeIterator();innerAttrs.hasNext();){
        Attribute innerAttr = (Attribute)innerAttrs.next();
        if(innerAttr == null)
         continue;
        String innerAttrName = innerAttr.getName();
        String innerAttrValue = innerAttr.getValue();
        map.put(innerAttrName, innerAttrValue);
       }
       //假定没有第三层嵌套,获得第二层的值
       String innerName = elementInner.getName();
       String innerValue = elementInner.getText();
       map.put(innerName, innerValue);
     
      }
    
     }
     list.add(map);
    }
       return list;
   } catch (DocumentException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
   }
   return null;

}
   

/**
  * 测试
  * @param args
  * @throws DocumentExceptionPraseXMLTest5.java
  */
public static void main(String[] args) throws DocumentException {
  String filename = "d:\\data.xml";
  List<Map<String,String>> list = PraseXMLTest5.iterateWholeXML(filename);
  for(Map <String,String>map:list){
  for (String ss : map.keySet()) {
   System.out.println(ss + ":" + map.get(ss));
  }
  }
}
}




这个写的很累,具体说很累赘,而且只能遍历xml的两层嵌套,对三层或更多的嵌套无能无力。于是很明显的看到这里用一个递归式多么容易的事情。于是写了下面这个代码:



package javaForXML;

import java.io.File;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
* 利用dom4j进行XML解析
* 利用递归,本类对所有嵌套进行递归遍历
* @date Dec 25, 20094:43:47 PM
* @author zhangjp
* @param
*/
public class PraseXMLTest6 {
   
    /**
     * 遍历每个节点和属性
     * @param filename
     * @returnPraseXMLTest5.java
     */
public  static  List<Map<String,String>> iterateWholeXML(String filename) {

  List <Map<String,String>>list = new ArrayList<Map<String,String>>();
  SAXReader saxReader = new SAXReader();

   try {
    Document document = saxReader.read(new File(filename));
    Element root = document.getRootElement();
    recursiveNode(root,list);
       return list;
   } catch (DocumentException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
   }
   return null;

}
   
/**
  * 递归遍历所有的节点获得对应的值
  * @param rootPraseXMLTest6.java
  */
private static void recursiveNode(Element root,List <Map<String,String>>list ){
  // 遍历根结点的所有孩子节点
  for (Iterator iter = root.elementIterator(); iter.hasNext();) {
   HashMap<String, String> map = new HashMap<String, String>();

   Element element = (Element) iter.next();
   if (element == null)
    continue;
   // 获取属性和它的值
   for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
    Attribute attr = (Attribute) attrs.next();
    if (attr == null)
     continue;
    String attrName = attr.getName();
    String attrValue = attr.getValue();

    map.put(attrName, attrValue);
   }
   //如果有PCDATA,则直接提出
   if(element.isTextOnly()){
    String innerName = element.getName();
    String innerValue = element.getText();
    map.put(innerName, innerValue);
     list.add(map);
   }else{
     list.add(map);
        //递归调用
           recursiveNode(element ,list);   
   }

  }
}

/**
  * 测试
  * @param args
  * @throws DocumentExceptionPraseXMLTest5.java
  */
public static void main(String[] args) throws DocumentException {
  String filename = "d:\\zhang.xml";
  List<Map<String,String>> list = PraseXMLTest6.iterateWholeXML(filename);
  for(Map <String,String>map:list){
  for (String ss : map.keySet()) {
   System.out.println(ss + ":" + map.get(ss));
  }
  }
}
}






    用了递归后,节省很多代码。看起来也比较简单明了,最大的好处是对于任意多个嵌套的xml文件的解析都不在话下,呵呵 ~ 好了 ,这个解析比生成要简单的多,好好悟吧。
分享到:
评论

相关推荐

    DOM4J jar包 xml解析 所有的dom4j-1.6.1 dom4j-2.0.2 dom4j-2.1.1包 导入直接使用

    在项目中使用DOM4J时,只需将相应的jar包(如dom4j-1.6.1.jar、dom4j-2.0.2.jar或dom4j-2.1.1.jar)导入到类路径中,即可开始利用其功能处理XML文档。导入后,可以按照DOM4J提供的API进行编程,快速实现XML的读写...

    dom4j 解析(读取) xml 节点数据

    总结起来,DOM4J是处理XML的优秀工具,尤其适合解析具有任意深度的XML结构。通过`SAXReader`解析XML文件,`Document`和`Element`对象提供了一种直观的方式来访问和操作XML数据。结合递归遍历,我们可以轻松地处理...

    xmldom4j解析

    四、DOM4J处理循环节点 在处理包含循环节点的XML时,可以使用迭代器或XPath查询来遍历这些节点。例如,遍历所有`&lt;item&gt;`元素: ```java Element root = document.getRootElement(); List&lt;Element&gt; items = root....

    dom4j解析xml

    ### DOM4J解析XML知识点详解 #### 一、DOM4J简介 DOM4J是一个Java库,用于处理XML文档。它的设计目标是为了提供一个简单、易于使用的API来处理XML文件,同时保持性能上的优势。与Java标准库中的DOM实现相比,DOM4J...

    用dom4j解析xml文件

    而DOM4J是Java中一个强大的、灵活的处理XML的库,它提供了丰富的API,使得XML的解析、创建、遍历以及修改变得更为简便。本篇文章将深入探讨如何使用DOM4J来解析XML文件,以及通过示例代码来展示其基本操作。 首先,...

    dom4j应用解析xml

    总结来说,DOM4J为Java开发者提供了一个高效、易用的XML处理工具,无论是在简单的XML解析还是复杂的XML操作中,都能发挥出它的优势。在实际开发中,结合示例中的`xmlDemo`文件,你可以逐步学习和掌握DOM4J的各种功能...

    dom4j文档.xml

    DOM4J的设计理念是基于Java集合框架,这意味着它可以无缝地融入到Java应用程序中,支持DOM、SAX和JAXP等多种XML解析标准。 DOM4J的核心接口集中在`org.dom4j`包下,这些接口包括: 1. **Attribute**: 表示XML的...

    Dom4j对xml文件的解析

    **标题:“Dom4j对XML文件的解析”** 在IT领域,XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,广泛应用于数据交换、配置文件和文档结构化表示。为了处理XML文件,开发人员经常使用解析器...

    通过Dom4j创建和读取xml文件下载

    本教程将详细讲解如何利用DOM4J进行XML文件的创建和读取。首先,我们需要了解DOM4J的核心概念,如Element、Attribute、Document等。 1. **DOM4J基本概念**: - **Document**: XML文档的根节点,代表整个XML文件。 ...

    使用dom4j读取xml四种方法

    ### 使用dom4j读取XML的四种方法 在Java开发中,处理XML文件是一种常见的需求。Dom4j作为一款简洁高效的Java库,被广泛应用于解析、操作XML文档。本文将详细介绍使用dom4j读取XML文件的四种常见方法,并通过示例...

    dom,dom4j,sax对xml进行解析

    通过DOM和DOM4J,可以直接访问XML文档的任意部分并进行修改;而SAX则可能实现了一种流式处理,逐个读取XML元素,完成相应的操作。 学习和理解这三种解析方法对于XML编程至关重要,因为每种方法都有其适用场景。DOM...

    dom4j解析XML文件

    在本文中,我们将深入探讨DOM4J如何解析XML文件,并讨论如何利用它来创建XML文档。 ### 1. XML解析 XML(eXtensible Markup Language)是一种标记语言,常用于数据交换和存储结构化数据。DOM4J提供了两种主要的...

    Dom4J与SAX解析实例

    本教程将深入探讨Dom4J和SAX两种解析器在处理XML时的使用方法和特点。 **DOM解析**: DOM解析器将整个XML文件加载到内存中,构建一棵由节点组成的树形结构,称为DOM树。这种解析方式方便对XML进行随机访问,但对...

    使用dom4j创建一个xml文件刘宝宝版

    在Java编程中,DOM4J是一个非常流行的XML处理库,它提供了丰富的API来操作XML文档,包括创建、解析、修改和查询XML。下面我们将详细介绍如何使用DOM4J来创建一个XML文件。 首先,让我们了解DOM4J的基本概念。DOM4J...

    用 dom4j解析xml例子

    DOM4J支持DOM、SAX和StAX三种XML解析方式,能够满足不同场景下的需求。 ### 代码解析 #### 创建SAXReader实例 在代码片段中,首先通过`SAXReader`类创建了一个实例`saxReader`。`SAXReader`是DOM4J提供的基于SAX...

    DOM_XML.rar_DOM_dom xml_dom xml java_dom解析xml_java解析xml

    标题中的"DOM_XML.rar"可能是一个包含DOM解析XML相关示例的压缩文件,"DOM_dom xml_dom xml java_dom解析xml_java解析xml"这部分描述了文件的主要内容,即关于DOM(Document Object Model)在XML解析中的应用,特别...

    dom4j的jar包,用于解析XML文件

    2. **文档遍历**:DOM4J支持XPath表达式,可以使用简单的字符串查询XML文档中的任意节点。这极大地提高了代码的可读性和可维护性。 3. **文档构建**:DOM4J允许动态构建XML文档,可以方便地添加、删除或修改元素和...

    dom4j解析天气预报

    相对于DOM和SAX解析器,DOM4J提供了更简洁、高效的API,使得XML解析更加易用。 DOM(Document Object Model)解析器将整个XML文档加载到内存中,形成一个树形结构,可以方便地访问任意节点,但对大文件可能会消耗...

    总结Dom4j、JDom、SAX、Dom四种方法解析XML的资料和代码(Java)

    提供的"JavaXml"压缩包可能包含了这四种解析方式的示例代码、教程资料和相关电子书,可以帮助开发者深入理解和掌握XML解析技术。通过阅读和实践这些代码,你可以了解每种方法的具体用法,以及它们在不同场景下的表现...

Global site tag (gtag.js) - Google Analytics