`
563525042
  • 浏览: 49807 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

用dom4j建立,修改XML文档,并解决格式化输出和中文问题

    博客分类:
  • java
阅读更多
下面给出一些例子(部分摘自DOM4J自带的文档),简单说一下如何使用。
1.                读取并解析XML文档:
读写XML文档主要依赖于org.dom4j.io包,其中提供DOMReader和SAXReader两类不同方式,
而调用方式是一样的。这就是依靠接口的好处。
       // 从文件读取XML,输入文件名,返回XML文档
          
 public Document read(String fileName) throws
MalformedURLException, DocumentException {
               SAXReader reader = new SAXReader();
               Document document = reader.read(new File(fileName));
               return document;
            }


其中,reader的read方法是重载的,可以从InputStream, File, Url等多种不同的源来读
取。得到的Document对象就带表了整个XML。
根据本人自己的经验,读取的字符编码是按照XML文件头定义的编码来转换。如果遇到乱码问题,注意
要把各处的编码名称保持一致即可。
2.      取得Root节点
读取后的第二步,就是得到Root节点。熟悉XML的人都知道,一切XML分析都是从Root元素开
始的。
     public Element getRootElement(Document doc){
               return doc.getRootElement();
            }

3.      遍历XML树
DOM4J提供至少3种遍历节点的方法:
1) 枚举(Iterator)
       // 枚举所有子节点
            for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
               Element element = (Element) i.next();
               // do something
            }
            // 枚举名称为foo的节点
            for ( Iterator i = root.elementIterator(foo); i.hasNext();) {
               Element foo = (Element) i.next();
               // do something
            }
            // 枚举属性
            for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
               Attribute attribute = (Attribute) i.next();
               // do something
      }

2)递归
递归也可以采用Iterator作为枚举手段,但文档中提供了另外的做法
     
 public void treeWalk() {
               treeWalk(getRootElement());
            }
            public void treeWalk(Element element) {
               for (int i = 0, size = element.nodeCount(); i < size; i++)
{
                   Node node = element.node(i);
                   if (node instanceof Element) {
                      treeWalk((Element) node);
                   } else { // do something....
                   }
               }
        }


3) Visitor模式
最令人兴奋的是DOM4J对Visitor的支持,这样可以大大缩减代码量,并且清楚易懂。了解设计模式
的人都知道,Visitor是GOF设计模式之一。其主要原理就是两种类互相保有对方的引用,并且
一种作为Visitor去访问许多Visitable。我们来看DOM4J中的Visitor模式(快速文档中没有提
供)
只需要自定一个类实现Visitor接口即可。
          public class MyVisitor extends VisitorSupport {
                   public void visit(Element element){
                       System.out.println(element.getName());
                   }
                   public void visit(Attribute attr){
                       System.out.println(attr.getName());
                   }
          }           调用:    root.accept(new MyVisitor())

      Visitor接口提供多种Visit()的重载,根据XML不同的对象,将采用不同的方式来访问。
上面是给出的Element和Attribute的简单实现,一般比较常用的就是这两个。VisitorSupport是
DOM4J提供的默认适配器,Visitor接口的Default Adapter模式,这个模式给出了各
种visit(*)的空实现,以便简化代码。
      注意,这个Visitor是自动遍历所有子节点的。如果是root.accept(MyVisitor),将遍历
子节点。我第一次用的时候,认为是需要自己遍历,便在递归中调用Visitor,结果可想而知。
4. XPath支持
      DOM4J对XPath有良好的支持,如访问一个节点,可直接用XPath选择。

         
 public void bar(Document document) {
                List list = document.selectNodes( //foo/bar );
                Node node = document.selectSingleNode(//foo/bar/author);
                String name = node.valueOf( @name );
             }


      例如,如果你想查找XHTML文档中所有的超链接,下面的代码可以实现:

          
 public void findLinks(Document document) throws DocumentException
{
                List list = document.selectNodes( //a/@href );
                for (Iterator iter = list.iterator(); iter.hasNext(); ) {
                    Attribute attribute = (Attribute) iter.next();
                    String url = attribute.getValue();
                }
             }


5. 字符串与XML的转换
有时候经常要用到字符串转换为XML或反之,
       // XML转字符串   Document document = ...;
            String text = document.asXML();
        // 字符串转XML
            String text = <person> <name>James</name> </person>;
            Document document = DocumentHelper.parseText(text);

6 用XSLT转换XML

       
   public Document styleDocument(
               Document document,
               String stylesheet
            ) throws Exception {
            // load the transformer using JAXP
            TransformerFactory factory = TransformerFactory.newInstance();
            Transformer transformer = factory.newTransformer(
               new StreamSource( stylesheet )
            );
            // now lets style the given document
            DocumentSource source = new DocumentSource( document );
            DocumentResult result = new DocumentResult();
            transformer.transform( source, result );
            // return the transformed document
            Document transformedDoc = result.getDocument();
            return transformedDoc;
        }


7. 创建XML
    一般创建XML是写文件前的工作,这就像StringBuffer一样容易。

       
    public Document createDocument() {
               Document document = DocumentHelper.createDocument();
               Element root = document.addElement(root);
               Element author1 =
                   root
                      .addElement(author)
                      .addAttribute(name, James)
                      .addAttribute(location, UK)
                      .addText(James Strachan);
               Element author2 =
                   root
                      .addElement(author)
                      .addAttribute(name, Bob)
                      .addAttribute(location, US)
                      .addText(Bob McWhirter);
               return document;
            }


8. 文件输出
      一个简单的输出方法是将一个Document或任何的Node通过write方法输出
       FileWriter out = new FileWriter( foo.xml );
            document.write(out);

    如果你想改变输出的格式,比如美化输出或缩减格式,可以用XMLWriter类    
 public void write(Document document) throws IOException {
               // 指定文件
               XMLWriter writer = new XMLWriter(
                   new FileWriter( output.xml )
               );
               writer.write( document );
               writer.close();
               // 美化格式
               OutputFormat format = OutputFormat.createPrettyPrint();
               writer = new XMLWriter( System.out, format );
               writer.write( document );
               // 缩减格式
               format = OutputFormat.createCompactFormat();
               writer = new XMLWriter( System.out, format );
               writer.write( document );
            }


如何,DOM4J够简单吧,当然,还有一些复杂的应用没有提到,如ElementHandler等。如果你动心
了,那就一起来用DOM4J.




                         用dom4j建立,修改XML文档,并解决格式化输出和中文问题
<books>
  <!--This is a test for dom4j, holen, 2004.9.11-->
  <book show="no">
       <title>Dom4j Tutorials</title>
  </book>
  <book show="no">
       <title>Lucene Studing</title>
  </book>
  <book show="no">
       <title>Lucene in Action</title>
  </book>
  <owner>O'Reilly</owner>
</books>
---------------------
package com.holen.dom4j;
 
import java.io.File;
import java.io.FileWriter;
import java.util.Iterator;
import java.util.List;
 
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
 
/**
 * @author Holen Chen
 */
public class Dom4jDemo {
   
    public Dom4jDemo() {
    }
   
    /**
     * 建立一个XML文档,文档名由输入参数决定
     * @param filename 需建立的文件名
     * @return 返回操作结果, 0表失败, 1表成功
     */
    public int createXMLFile(String filename){
       /** 返回操作结果, 0表失败, 1表成功 */
       int returnValue = 0;
       /** 建立document对象 */
        Document document = DocumentHelper.createDocument();
       /** 建立XML文档的根books */
        Element booksElement = document.addElement("books");
       /** 加入一行注释 */
        booksElement.addComment("This is a test for dom4j, holen, 2004.9.11");
       /** 加入第一个book节点 */
        Element bookElement = booksElement.addElement("book");
       /** 加入show参数内容 */
        bookElement.addAttribute("show","yes");
       /** 加入title节点 */
        Element titleElement = bookElement.addElement("title");
       /** 为title设置内容 */
        titleElement.setText("Dom4j Tutorials");
      
       /** 类似的完成后两个book */
        bookElement = booksElement.addElement("book");
        bookElement.addAttribute("show","yes");
        titleElement = bookElement.addElement("title");
        titleElement.setText("Lucene Studing");
        bookElement = booksElement.addElement("book");
        bookElement.addAttribute("show","no");
        titleElement = bookElement.addElement("title");
        titleElement.setText("Lucene in Action");
      
       /** 加入owner节点 */
        Element ownerElement = booksElement.addElement("owner");
        ownerElement.setText("O'Reilly");
      
       try{
           /** 将document中的内容写入文件中 */
           XMLWriter writer = new XMLWriter(new FileWriter(new File(filename)));
           writer.write(document);
           writer.close();
           /** 执行成功,需返回1 */
           returnValue = 1;
        }catch(Exception ex){
           ex.printStackTrace();
       }
              
        return returnValue;
    }
   
    /**
     * 修改XML文件中内容,并另存为一个新文件
     * 重点掌握dom4j中如何添加节点,修改节点,删除节点
     * @param filename 修改对象文件
     * @param newfilename 修改后另存为该文件
     * @return 返回操作结果, 0表失败, 1表成功
     */
    public int ModiXMLFile(String filename,String newfilename){
       int returnValue = 0;
       try{
           SAXReader saxReader = new SAXReader();   
           Document document = saxReader.read(new File(filename));
           /** 修改内容之一: 如果book节点中show参数的内容为yes,则修改成no */
           /** 先用xpath查找对象 */
           List list = document.selectNodes("/books/book/@show" );   
           Iterator iter = list.iterator();
           while(iter.hasNext()){
               Attribute attribute = (Attribute)iter.next();
               if(attribute.getValue().equals("yes")){
                   attribute.setValue("no");
               }  
           }
          
           /**
            * 修改内容之二: 把owner项内容改为Tshinghua
            * 并在owner节点中加入date节点,date节点的内容为2004-09-11,还为date节点添加一个参数type
            */
           list = document.selectNodes("/books/owner" );
           iter = list.iterator();
           if(iter.hasNext()){
               Element ownerElement = (Element)iter.next();
               ownerElement.setText("Tshinghua");
               Element dateElement = ownerElement.addElement("date");
               dateElement.setText("2004-09-11");
               dateElement.addAttribute("type","Gregorian calendar");
           }
          
           /** 修改内容之三: 若title内容为Dom4j Tutorials,则删除该节点 */
           list = document.selectNodes("/books/book");
           iter = list.iterator();
           while(iter.hasNext()){
               Element bookElement = (Element)iter.next();
               Iterator iterator = bookElement.elementIterator("title");
               while(iterator.hasNext()){
                   Element titleElement=(Element)iterator.next();
                   if(titleElement.getText().equals("Dom4j Tutorials")){
                      bookElement.remove(titleElement);
                  }
               }
           }          
          
           try{
               /** 将document中的内容写入文件中 */
               XMLWriter writer = new XMLWriter(new FileWriter(new File(newfilename)));
               writer.write(document);
               writer.close();
               /** 执行成功,需返回1 */
               returnValue = 1;
           }catch(Exception ex){
               ex.printStackTrace();
           }
          
        }catch(Exception ex){
           ex.printStackTrace();
       }
        return returnValue;
    }
   
    /**
     * 格式化XML文档,并解决中文问题
     * @param filename
     * @return
     */
    public int formatXMLFile(String filename){
       int returnValue = 0;
       try{
           SAXReader saxReader = new SAXReader();   
           Document document = saxReader.read(new File(filename));
           XMLWriter output = null;
           /** 格式化输出,类型IE浏览一样 */
           OutputFormat format = OutputFormat.createPrettyPrint();
           /** 指定XML字符集编码 */
           format.setEncoding("GBK");
           output = new XMLWriter(new FileWriter(new File(filename)),format);
           output.write(document);
           output.close();       
           /** 执行成功,需返回1 */
           returnValue = 1;      
        }catch(Exception ex){
           ex.printStackTrace();
       }
        return returnValue;
    }
 
    public static void main(String[] args) {
        Dom4jDemo temp = new Dom4jDemo();
        System.out.println(temp.createXMLFile("d://holen.xml"));
        System.out.println(temp.ModiXMLFile("d://holen.xml","d://holen2.xml"));
        System.out.println(temp.formatXMLFile("d://holen2.xml"));
    }
}
分享到:
评论

相关推荐

    DOM4J格式化XML

    【标题】"DOM4J格式化XML"是一个关于XML处理的专题,主要聚焦于使用DOM4J库对XML文档进行格式化的技术。DOM4J是一个非常流行的Java XML API,它提供了丰富的功能,包括读取、写入、修改以及操作XML文档。在XML处理中...

    Dom 4j 格式化xml补充

    ### Dom 4j 格式化 XML 输出详解 #### 概述 Dom 4j 是一个用于处理 XML 文件的强大 Java 库。它提供了一系列简单易用的 API,可以帮助开发者高效地解析、创建和修改 XML 文档。其中,格式化 XML 输出是 Dom 4j ...

    dom4j解析xml文件的压缩包

    8. **转换与格式化**:DOM4J可以将XML Document对象转换为String或OutputStream,同时提供XML格式化的功能,使得输出的XML更易于阅读。 9. **JAXB集成**:DOM4J可以与Java的默认XML绑定框架JAXB进行集成,方便地将...

    dom4j-1.6.1说明文档,chm格式

    1. **元素(Element)**:DOM4J中的元素代表XML文档中的一个节点,它可以包含其他元素、文本和属性。通过`Element`类,我们可以创建、修改和遍历元素。 2. **属性(Attribute)**:元素可以有零个或多个属性,DOM4J...

    使用DOM4J对XML文件操作-添加、修改、删除、获取元素节点

    DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活且高效的API,使得XML的解析、创建、修改和查询变得简单。在本教程中,我们将深入探讨如何使用DOM4J来执行基本的XML操作,包括添加元素、修改元素、删除...

    Dom4j解析XML及中文问题

    本文将深入探讨如何使用Dom4j解析XML以及解决中文乱码的问题。 首先,让我们了解Dom4j的基本用法。在解析XML文件时,通常会使用`DocumentBuilderFactory`和`DocumentBuilder`来创建一个`Document`对象,然后通过这...

    dom4j包和文档

    这个API的设计目标是简化XML在Java应用程序中的使用,无论是读取、创建还是修改XML文档,DOM4J都能提供简单易用的接口。DOM4J的核心特性包括XML解析、XPath支持、事件驱动的SAX解析以及DOM模型的构建。 **DOM4J解析...

    dom4j帮助文档和架包

    总结来说,DOM4J是一个强大且全面的XML处理工具,适用于广泛的XML应用场景,无论是解析、构建还是操作XML文档,它都能提供高效且易于使用的解决方案。通过学习“dom4j帮助文档和架包”,开发者能够掌握DOM4J的精髓,...

    dom4j帮助文档

    DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活、高效的API,使得XML的读取、创建、修改和分析变得简单易行。在Java世界中,XML作为一种数据交换格式,广泛应用于配置文件、数据传输和文档存储等领域...

    dom4j api文档

    DOM4J提供`XMLWriter`和`OutputFormat`类,用于将XML文档写入输出流,支持格式化输出,包括缩进、换行等。此外,还可以通过`DOMWriter`将DOM4J对象转换为标准DOM对象,或者使用`DOMSource`和`StreamResult`与Java的`...

    dom4j dom4j1.6 dom4j最新版

    5. **转换和序列化**:DOM4J可以将XML文档转换为其他格式,如HTML或者DOM,也可以将XML对象序列化回字符串或文件。 6. **文档结构**:DOM4J的Document、Element、Attribute、Namespace等类提供了清晰的文档结构表示...

    dom4j-1.6.1架包,读取xml

    5. 建立XML文档:DOM4J提供了简单的方法来创建新的XML文档或修改现有文档。例如,可以使用`DocumentFactory`创建新的`Document`,然后通过`Element`对象构建XML结构。 6. 功能丰富的API:DOM4J的API设计得非常友好...

    dom4j以String的方式读取XML的内容,并给String的值赋值,写入XML中

    DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活且高效的API,使得XML的解析、创建、修改变得更加简单。在这个场景中,我们关注的是如何使用DOM4J以String的形式读取XML内容,然后将String的值赋给XML...

    java中dom4j读写XML

    在Java中,DOM4J提供了一种灵活的方式来操作XML文档,包括解析、遍历、修改节点以及序列化回XML字符串。 **DOM4J的基本概念:** 1. **Element(元素)**:XML文档中的每一个标签都是一个Element,它包含属性、文本...

    dom4j API 用于解析XML的java库

    5. **XML文档构建**:DOM4J提供了便捷的方法来构建XML文档,如`DocumentHelper.createDocument()`和`Element.addElement()`,使得动态创建XML文档变得容易。 6. **读写XML文件**:DOM4J提供了一系列的`Writer`和`...

    使用dom4j将xml字符串转换成Bean对象

    首先,dom4j是一个强大的Java XML API,它提供了丰富的功能,如读取、写入、修改和操作XML文档。其核心概念是Element(元素)、Attribute(属性)和Document(文档)。通过这些对象,我们可以方便地处理XML文档的...

    使用DOM4j解析XML文件

    在使用DOM4j解析XML文件时,首先需要导入DOM4j的相关包,如`SAXReader`用于读取XML文件,`Document`表示整个XML文档,`Element`表示XML文档中的元素,以及`Attribute`表示元素的属性。以下是一个使用DOM4j解析XML...

    dom4j-2.1.3.zip

    1. **灵活的文档构建**:DOM4J提供了多种方式来创建和修改XML文档,如通过元素、属性、文本节点等对象直接操作,或者使用XPath表达式定位。 2. **强大的查询能力**:DOM4J支持XPath,可以方便地通过路径表达式查找...

    DOM4J读取XML

    DOM4J是一个轻量级、高性能且易于使用的Java库,用于处理XML文档。它提供了类似于DOM、SAX和JDOM的API,但又在其基础上进行了优化,使得在读取、写入、查询和修改XML文档时更加高效与便捷。本文将详细介绍如何使用...

    dom4j 2.1.1

    XML(eXtensible Markup Language)作为一种结构化数据格式,在网络应用、配置文件、数据交换等方面广泛应用,DOM4J作为其解析工具,为开发者提供了便利。 DOM4J的主要特点包括: 1. 易于使用:DOM4J的API设计直观...

Global site tag (gtag.js) - Google Analytics