`

dom4j解析及写入XML文档时的乱码问题

阅读更多

book.xml

  1. <?xml version="1.0" encoding="UTF-8"?> 
  2.  
  3. <书架> 
  4.   <> 
  5.     <书名>Java就业基础教程</书名>   
  6.     <作者>张孝祥</作者>   
  7.     <售价>48元</售价> 
  8.     <售价>58元</售价> 
  9.   </>   
  10.   <> 
  11.     <书名>JavaScript网页开发</书名>   
  12.     <作者>黎活明</作者>   
  13.     <售价>46元</售价> 
  14.   </> 
  15. </书架> 

Dom4j.java

  1. package yyy.dom4j;  
  2.  
  3. import java.io.File;  
  4. import java.io.FileOutputStream;  
  5. import java.io.OutputStreamWriter;  
  6. import java.util.List;  
  7.  
  8. import org.dom4j.Document;  
  9. import org.dom4j.DocumentHelper;  
  10. import org.dom4j.Element;  
  11. import org.dom4j.Node;  
  12. import org.dom4j.io.OutputFormat;  
  13. import org.dom4j.io.SAXReader;  
  14. import org.dom4j.io.XMLWriter;  
  15. import org.junit.Test;  
  16.  
  17.    
  18.  
  19. public class Dom4j {  
  20.    
  21.  private File file = new File("src/book.xml");  
  22.  //遍历xml文档  
  23.  @Test 
  24.  public void testList() throws Exception{  
  25.   SAXReader reader = new SAXReader();  
  26.   Document document = reader.read(file);  
  27.   Element root = document.getRootElement();  
  28.   list(root);  
  29.  }  
  30.  public void list(Element element){  
  31.   System.out.println(element.getName());  
  32.   List<Node> nodes = element.elements();  
  33.   //System.out.println(nodes.size());  
  34.   for(Node node : nodes){  
  35.    if(node instanceof Element){  
  36.     list((Element) node);  
  37.    }  
  38.   }  
  39.  }  
  40.    
  41.  //读取某个节点的值  
  42.  @Test 
  43.  public void read() throws Exception{  
  44.   SAXReader reader = new SAXReader();  
  45.   Document document = reader.read(file);  
  46.   Element root = document.getRootElement();  
  47.   Element price = root.element("书").element("作者");  
  48.   String value = price.getText();  
  49.   System.out.println(value);  
  50.  }  
  51.    
  52.  //添加某个节点  
  53.  @Test 
  54.  public void add() throws Exception{  
  55.   SAXReader reader = new SAXReader();  
  56.   Document document = reader.read(file);  
  57.     
  58.   Element price = DocumentHelper.createElement("售价"); //创建新的节点  
  59.   price.setText("44元");  //设置节点值  
  60.     
  61.   Element root = document.getRootElement();  
  62.   root.element("书").add(price);  //添加节点  
  63.     
  64.   //将内存中的document对象重新写入xml文档   特别要注意乱码问题  
  65.  
  66.   //方法1:使用OutputStreamWriter设置写入文档时所使用的编码表  
  67.   OutputStreamWriter out = new OutputStreamWriter(new FileOutputStream(file),"utf-8");  
  68.   document.write(out);  
  69.   out.close();  
  70.     
  71.   /*//方法2:  
  72.   OutputFormat format = OutputFormat.createPrettyPrint();  
  73.   format.setEncoding("gb2312");  
  74.   XMLWriter writer = new XMLWriter(new FileWriter(file),format);  
  75.   writer.write(document);  
  76.   writer.close();*/ 
  77.     
  78.      /*//方法3:  
  79.   OutputFormat format = OutputFormat.createPrettyPrint();  
  80.   XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(file),"utf-8"),format);  
  81.   writer.write(document);  
  82.   writer.close();*/ 
  83.     
  84.   /*//方法4:  
  85.   OutputFormat format = OutputFormat.createPrettyPrint();  
  86.   format.setEncoding("gb2312");  //源文档用"gb2312"编码,既不改变源文档的编码格式,又不能有乱码  
  87.   XMLWriter writer = new XMLWriter(new FileOutputStream(file),format);  
  88.   writer.write(document);  
  89.   writer.close();*/ 
  90.     
  91.   /*//document对象在内存中是以"UTF-8"编码形式存在,用FileWriter将document对象以字符流的形式写入xml文档默认是用本地码表"gb2312"编码  
  92.    * 乱码问题总结:  
  93.    * 1.用字符流向文件写入数据要考虑乱码问题,而用字节流就不必考虑乱码问题  
  94.    *   用字符流向文件写入数据默认使用本地码表即"gb2312"  
  95.    * 2.任何对象读入内存都是以"UTF-8"编码的形式存在  
  96.    * 默认情况下XMLWriter的write方法是以"UTF-8"的编码形式将内存中的document对象传给FileWriter,所以要想不发生乱码问题,  
  97.    * 就要使用包装流OutputStreamWriter并给定写入文件时所使用的编码表,或者使用OutputFormat的setEncoding方法指定传给  
  98.    * 流对象时所使用的编码格式。  
  99.    * */ 
  100.  }  
  101.    
  102.  //向指定位置添加节点  
  103.  @Test 
  104.  public void add2() throws Exception{  
  105.   SAXReader reader = new SAXReader();  
  106.   Document document = reader.read(file);  
  107.   Element root = document.getRootElement();  
  108.   Element price = DocumentHelper.createElement("售价");  
  109.   price.setText("48元");  
  110.   List list = root.element("书").elements();  
  111.   list.add(2,price);  
  112.     
  113.   OutputFormat format = OutputFormat.createPrettyPrint();  
  114.   XMLWriter writer = new XMLWriter(new FileOutputStream(file),format);  
  115.   writer.write(document);  
  116.   writer.close();  
  117.  }  
  118.    
  119.  //删除某个节点  
  120.  @Test 
  121.  public void delete() throws Exception{  
  122.   SAXReader reader = new SAXReader();  
  123.   Document document = reader.read(file);  
  124.   Element root = document.getRootElement();  
  125.   Element price = root.element("书").element("售价");  
  126.   price.getParent().remove(price);  
  127.     
  128.   OutputFormat format = OutputFormat.createPrettyPrint();  
  129.   XMLWriter writer = new XMLWriter(new FileOutputStream(file),format);  
  130.   writer.write(document);  
  131.   writer.close();  
  132.  }  
  133.    
  134.  //更改某个节点的内容  
  135.  @Test 
  136.  public void update() throws Exception{  
  137.   SAXReader reader = new SAXReader();  
  138.   Document document = reader.read(file);  
  139.   Element root = document.getRootElement();  
  140.   Element price = root.element("书").element("售价");  
  141.   price.setText("58元");  
  142.     
  143.   OutputFormat format = OutputFormat.createPrettyPrint();  
  144.   XMLWriter writer = new XMLWriter(new FileOutputStream(file),format);  
  145.   writer.write(document);  
  146.   writer.close();  
  147.  }  

原文链接:http://developer.51cto.com/art/201205/339308.htm

分享到:
评论

相关推荐

    Dom4j解析XML及中文问题

    本文将深入探讨如何使用Dom4j解析XML以及解决中文乱码的问题。 首先,让我们了解Dom4j的基本用法。在解析XML文件时,通常会使用`DocumentBuilderFactory`和`DocumentBuilder`来创建一个`Document`对象,然后通过这...

    dom4j以String的方式读取XML的内容,并给String的值赋值,写入XML中

    DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活且高效的API,使得XML的解析、创建、修改变得更加简单。在这个场景中,我们关注的是如何使用DOM4J以String的形式读取XML内容,然后将String的值赋给XML...

    dom4j 写UTF-8的xml乱码问题 使用FileOutputStream

    标题中的“dom4j 写UTF-8的xml乱码问题 使用FileOutputStream”涉及的是在使用Java编程语言处理XML文件时遇到的编码问题。DOM4J是一个强大的Java库,用于处理XML、XPath和XSLT,它提供了丰富的API来读取、写入、修改...

    dom4j解析XML

    在本文中,我们将深入探讨如何使用DOM4J进行XML的解析,包括创建XML文档,添加、修改和删除XML节点,以及XML的格式化输出和中文字符的处理。 1. **创建XML文档** 创建XML文档通常从`Document`对象开始。首先,我们...

    Dom4j解析XML.pdf

    本文主要介绍了如何使用Dom4j库来解析XML文档,包括创建XML文档、添加、修改和删除节点,以及处理XML文档的格式化输出和中文问题。Dom4j是一个在SourceForge.net上的开源Java项目,它提供了对XML的高效解析功能,以...

    dom4j中文彻底解决

    通过这种方式,我们可以确保DOM4J生成的XML文件采用正确的字符编码,避免了可能出现的乱码问题。同时,这也提醒我们在使用任何处理文本输出的API时,都要注意指定正确的编码,以保证跨平台和多语言环境下的兼容性。 ...

    dom4j-1.6 的jar包以及中文处理问题

    提供的`Dom4j解析XML及中文问题(普通下载).pdf`可能详细介绍了在DOM4J中处理中文字符的步骤和示例。而`dom4j-1.6.1`则是DOM4J的1.6.1版本的jar包,包含了DOM4J的所有类和方法,可以直接引入到项目中使用。 在实际...

    dom4j读取XML文件详解

    dom4j的主要接口都在org.dom4j这个包里定义,要想弄懂这套接口,关键的是要明白接口的继承关系:读写XML文档主要依赖于org.dom4j.io包,其中提供DOMReader和SAXReader两类不同的方式,而调用方式是一样的。...

    JSP基于dom解析xml实例详解.docx

    此外,虽然这个实例没有涉及,但在实际应用中,为了处理中文乱码问题,需要在读取和写入XML文件时设定正确的字符编码,例如在解析文件时指定`InputStream`的编码。同时,为了确保XML文件的合法性,通常需要进行XML...

    Android XML 解析 写入

    DOM解析器一次性加载整个XML文档到内存中,适合小型XML文件。而PULL解析器则是在需要时按需读取XML数据,适合处理大型或流式XML文档,更节省内存。 ### 2. PULL解析方式 PULL解析器遵循事件驱动模型,它不会一次性...

    XML文件的创建和解析

    3. 编码兼容性:确保XML文件的编码与读写操作的编码一致,避免乱码问题。 通过以上步骤,你可以使用C++和MSXML库高效地创建和解析XML文件。在实际开发中,可以根据项目需求选择合适的方法,结合DOM和SAX的优点,...

    使用java读写xml文档

    本篇文章将详细探讨如何使用Java进行XML文档的读写操作,并解决可能出现的中文乱码问题。 首先,我们来看创建XML文档的过程。`CreateXML.java` 文件很可能是实现这一功能的代码。创建XML文档主要涉及DOM(Document ...

    【Qt】 XML流读写XML.rar

    【Qt】XML流读写XML技术详解 在Qt框架中,XML处理是一项常见的任务,尤其在数据存储、配置文件管理以及跨平台应用间的数据交换中。Qt提供了丰富的API来支持XML的读写操作,包括基于DOM(Document Object Model)的...

    将xml文件转换成csv格式

    2. **解析XML文件**:使用XML解析器,如Python的`ElementTree`库,Java的`JDOM`或`DOM4J`,或者JavaScript的`DOMParser`,来读取和解析XML文件。解析器能够将XML文档转化为可操作的对象结构。 3. **构建CSV数据模型...

    VC++ ,XML类,XML文件读写类

    - 在处理XML时,应确保正确处理编码问题,避免乱码。 - 考虑到XML的安全性,应避免XML注入攻击,对用户输入进行适当验证。 - 错误处理是关键,确保在解析失败或文件未找到时能提供有用的反馈。 8. **性能优化** ...

    android 读写xml

    - 解析大型XML文件时,避免使用DOM解析器,因为它可能导致内存溢出。 - 对于XML的编码和解码,需要正确指定字符编码,防止乱码问题。 - 在写入XML时,注意保持良好的编码规范,如使用缩进来提高可读性。 以上就是...

    Word文档转xml

    4. **生成新的XML文件**:将处理后的数据写入一个新的XML文件。Java的DOM(Document Object Model)或StAX(Streaming API for XML)可以用来创建和操作XML文档。选择哪种API取决于你的需求,DOM适合处理小型文件,...

    evc写的XML文件读写程序

    1. 错误处理:在进行XML文件读写时,务必处理可能出现的错误,如文件不存在、权限问题等。 2. 编码格式:确保XML文件的编码与读写操作保持一致,避免乱码问题。 3. 性能优化:大型XML文件的读写可能会消耗大量资源,...

    Android解析XML使用WebView显示

    在处理文本文件时,尤其是XML和HTML文件,确保使用正确的编码读写,避免乱码问题。 6. **实际开发注意事项**: - 性能优化:对于大量XML数据,选择合适的解析器,避免内存溢出。 - UI更新:在主线程之外解析XML和...

    xml.rar_UTF8 unicode_c xml_unicode 文件_xml unicode_xml utf8

    例如,当解析一个UTF8编码的XML文件时,解析器会确保正确解码每个字符,避免乱码问题。同样,如果要将XML数据写入文件,解析器也会将Unicode字符转换为UTF8编码,以便正确存储。 在实际应用中,使用XML进行数据交换...

Global site tag (gtag.js) - Google Analytics