`
563525042
  • 浏览: 50243 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

用dom4j建立,修改XML文档,并解决格式化输出和中文问题

    博客分类:
  • java
阅读更多
下面给出一些例子(部分摘自DOM4J自带的文档),简单说一下如何使用。
1.                读取并解析XML文档:
读写XML文档主要依赖于org.dom4j.io包,其中提供DOMReader和SAXReader两类不同方式,
而调用方式是一样的。这就是依靠接口的好处。
       // 从文件读取XML,输入文件名,返回XML文档
          
 public Document read(String fileName) throws
MalformedURLException, DocumentException {
               SAXReader reader = new SAXReader();
               Document document = reader.read(new File(fileName));
               return document;
            }


其中,reader的read方法是重载的,可以从InputStream, File, Url等多种不同的源来读
取。得到的Document对象就带表了整个XML。
根据本人自己的经验,读取的字符编码是按照XML文件头定义的编码来转换。如果遇到乱码问题,注意
要把各处的编码名称保持一致即可。
2.      取得Root节点
读取后的第二步,就是得到Root节点。熟悉XML的人都知道,一切XML分析都是从Root元素开
始的。
     public Element getRootElement(Document doc){
               return doc.getRootElement();
            }

3.      遍历XML树
DOM4J提供至少3种遍历节点的方法:
1) 枚举(Iterator)
       // 枚举所有子节点
            for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
               Element element = (Element) i.next();
               // do something
            }
            // 枚举名称为foo的节点
            for ( Iterator i = root.elementIterator(foo); i.hasNext();) {
               Element foo = (Element) i.next();
               // do something
            }
            // 枚举属性
            for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
               Attribute attribute = (Attribute) i.next();
               // do something
      }

2)递归
递归也可以采用Iterator作为枚举手段,但文档中提供了另外的做法
     
 public void treeWalk() {
               treeWalk(getRootElement());
            }
            public void treeWalk(Element element) {
               for (int i = 0, size = element.nodeCount(); i < size; i++)
{
                   Node node = element.node(i);
                   if (node instanceof Element) {
                      treeWalk((Element) node);
                   } else { // do something....
                   }
               }
        }


3) Visitor模式
最令人兴奋的是DOM4J对Visitor的支持,这样可以大大缩减代码量,并且清楚易懂。了解设计模式
的人都知道,Visitor是GOF设计模式之一。其主要原理就是两种类互相保有对方的引用,并且
一种作为Visitor去访问许多Visitable。我们来看DOM4J中的Visitor模式(快速文档中没有提
供)
只需要自定一个类实现Visitor接口即可。
          public class MyVisitor extends VisitorSupport {
                   public void visit(Element element){
                       System.out.println(element.getName());
                   }
                   public void visit(Attribute attr){
                       System.out.println(attr.getName());
                   }
          }           调用:    root.accept(new MyVisitor())

      Visitor接口提供多种Visit()的重载,根据XML不同的对象,将采用不同的方式来访问。
上面是给出的Element和Attribute的简单实现,一般比较常用的就是这两个。VisitorSupport是
DOM4J提供的默认适配器,Visitor接口的Default Adapter模式,这个模式给出了各
种visit(*)的空实现,以便简化代码。
      注意,这个Visitor是自动遍历所有子节点的。如果是root.accept(MyVisitor),将遍历
子节点。我第一次用的时候,认为是需要自己遍历,便在递归中调用Visitor,结果可想而知。
4. XPath支持
      DOM4J对XPath有良好的支持,如访问一个节点,可直接用XPath选择。

         
 public void bar(Document document) {
                List list = document.selectNodes( //foo/bar );
                Node node = document.selectSingleNode(//foo/bar/author);
                String name = node.valueOf( @name );
             }


      例如,如果你想查找XHTML文档中所有的超链接,下面的代码可以实现:

          
 public void findLinks(Document document) throws DocumentException
{
                List list = document.selectNodes( //a/@href );
                for (Iterator iter = list.iterator(); iter.hasNext(); ) {
                    Attribute attribute = (Attribute) iter.next();
                    String url = attribute.getValue();
                }
             }


5. 字符串与XML的转换
有时候经常要用到字符串转换为XML或反之,
       // XML转字符串   Document document = ...;
            String text = document.asXML();
        // 字符串转XML
            String text = <person> <name>James</name> </person>;
            Document document = DocumentHelper.parseText(text);

6 用XSLT转换XML

       
   public Document styleDocument(
               Document document,
               String stylesheet
            ) throws Exception {
            // load the transformer using JAXP
            TransformerFactory factory = TransformerFactory.newInstance();
            Transformer transformer = factory.newTransformer(
               new StreamSource( stylesheet )
            );
            // now lets style the given document
            DocumentSource source = new DocumentSource( document );
            DocumentResult result = new DocumentResult();
            transformer.transform( source, result );
            // return the transformed document
            Document transformedDoc = result.getDocument();
            return transformedDoc;
        }


7. 创建XML
    一般创建XML是写文件前的工作,这就像StringBuffer一样容易。

       
    public Document createDocument() {
               Document document = DocumentHelper.createDocument();
               Element root = document.addElement(root);
               Element author1 =
                   root
                      .addElement(author)
                      .addAttribute(name, James)
                      .addAttribute(location, UK)
                      .addText(James Strachan);
               Element author2 =
                   root
                      .addElement(author)
                      .addAttribute(name, Bob)
                      .addAttribute(location, US)
                      .addText(Bob McWhirter);
               return document;
            }


8. 文件输出
      一个简单的输出方法是将一个Document或任何的Node通过write方法输出
       FileWriter out = new FileWriter( foo.xml );
            document.write(out);

    如果你想改变输出的格式,比如美化输出或缩减格式,可以用XMLWriter类    
 public void write(Document document) throws IOException {
               // 指定文件
               XMLWriter writer = new XMLWriter(
                   new FileWriter( output.xml )
               );
               writer.write( document );
               writer.close();
               // 美化格式
               OutputFormat format = OutputFormat.createPrettyPrint();
               writer = new XMLWriter( System.out, format );
               writer.write( document );
               // 缩减格式
               format = OutputFormat.createCompactFormat();
               writer = new XMLWriter( System.out, format );
               writer.write( document );
            }


如何,DOM4J够简单吧,当然,还有一些复杂的应用没有提到,如ElementHandler等。如果你动心
了,那就一起来用DOM4J.




                         用dom4j建立,修改XML文档,并解决格式化输出和中文问题
<books>
  <!--This is a test for dom4j, holen, 2004.9.11-->
  <book show="no">
       <title>Dom4j Tutorials</title>
  </book>
  <book show="no">
       <title>Lucene Studing</title>
  </book>
  <book show="no">
       <title>Lucene in Action</title>
  </book>
  <owner>O'Reilly</owner>
</books>
---------------------
package com.holen.dom4j;
 
import java.io.File;
import java.io.FileWriter;
import java.util.Iterator;
import java.util.List;
 
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
 
/**
 * @author Holen Chen
 */
public class Dom4jDemo {
   
    public Dom4jDemo() {
    }
   
    /**
     * 建立一个XML文档,文档名由输入参数决定
     * @param filename 需建立的文件名
     * @return 返回操作结果, 0表失败, 1表成功
     */
    public int createXMLFile(String filename){
       /** 返回操作结果, 0表失败, 1表成功 */
       int returnValue = 0;
       /** 建立document对象 */
        Document document = DocumentHelper.createDocument();
       /** 建立XML文档的根books */
        Element booksElement = document.addElement("books");
       /** 加入一行注释 */
        booksElement.addComment("This is a test for dom4j, holen, 2004.9.11");
       /** 加入第一个book节点 */
        Element bookElement = booksElement.addElement("book");
       /** 加入show参数内容 */
        bookElement.addAttribute("show","yes");
       /** 加入title节点 */
        Element titleElement = bookElement.addElement("title");
       /** 为title设置内容 */
        titleElement.setText("Dom4j Tutorials");
      
       /** 类似的完成后两个book */
        bookElement = booksElement.addElement("book");
        bookElement.addAttribute("show","yes");
        titleElement = bookElement.addElement("title");
        titleElement.setText("Lucene Studing");
        bookElement = booksElement.addElement("book");
        bookElement.addAttribute("show","no");
        titleElement = bookElement.addElement("title");
        titleElement.setText("Lucene in Action");
      
       /** 加入owner节点 */
        Element ownerElement = booksElement.addElement("owner");
        ownerElement.setText("O'Reilly");
      
       try{
           /** 将document中的内容写入文件中 */
           XMLWriter writer = new XMLWriter(new FileWriter(new File(filename)));
           writer.write(document);
           writer.close();
           /** 执行成功,需返回1 */
           returnValue = 1;
        }catch(Exception ex){
           ex.printStackTrace();
       }
              
        return returnValue;
    }
   
    /**
     * 修改XML文件中内容,并另存为一个新文件
     * 重点掌握dom4j中如何添加节点,修改节点,删除节点
     * @param filename 修改对象文件
     * @param newfilename 修改后另存为该文件
     * @return 返回操作结果, 0表失败, 1表成功
     */
    public int ModiXMLFile(String filename,String newfilename){
       int returnValue = 0;
       try{
           SAXReader saxReader = new SAXReader();   
           Document document = saxReader.read(new File(filename));
           /** 修改内容之一: 如果book节点中show参数的内容为yes,则修改成no */
           /** 先用xpath查找对象 */
           List list = document.selectNodes("/books/book/@show" );   
           Iterator iter = list.iterator();
           while(iter.hasNext()){
               Attribute attribute = (Attribute)iter.next();
               if(attribute.getValue().equals("yes")){
                   attribute.setValue("no");
               }  
           }
          
           /**
            * 修改内容之二: 把owner项内容改为Tshinghua
            * 并在owner节点中加入date节点,date节点的内容为2004-09-11,还为date节点添加一个参数type
            */
           list = document.selectNodes("/books/owner" );
           iter = list.iterator();
           if(iter.hasNext()){
               Element ownerElement = (Element)iter.next();
               ownerElement.setText("Tshinghua");
               Element dateElement = ownerElement.addElement("date");
               dateElement.setText("2004-09-11");
               dateElement.addAttribute("type","Gregorian calendar");
           }
          
           /** 修改内容之三: 若title内容为Dom4j Tutorials,则删除该节点 */
           list = document.selectNodes("/books/book");
           iter = list.iterator();
           while(iter.hasNext()){
               Element bookElement = (Element)iter.next();
               Iterator iterator = bookElement.elementIterator("title");
               while(iterator.hasNext()){
                   Element titleElement=(Element)iterator.next();
                   if(titleElement.getText().equals("Dom4j Tutorials")){
                      bookElement.remove(titleElement);
                  }
               }
           }          
          
           try{
               /** 将document中的内容写入文件中 */
               XMLWriter writer = new XMLWriter(new FileWriter(new File(newfilename)));
               writer.write(document);
               writer.close();
               /** 执行成功,需返回1 */
               returnValue = 1;
           }catch(Exception ex){
               ex.printStackTrace();
           }
          
        }catch(Exception ex){
           ex.printStackTrace();
       }
        return returnValue;
    }
   
    /**
     * 格式化XML文档,并解决中文问题
     * @param filename
     * @return
     */
    public int formatXMLFile(String filename){
       int returnValue = 0;
       try{
           SAXReader saxReader = new SAXReader();   
           Document document = saxReader.read(new File(filename));
           XMLWriter output = null;
           /** 格式化输出,类型IE浏览一样 */
           OutputFormat format = OutputFormat.createPrettyPrint();
           /** 指定XML字符集编码 */
           format.setEncoding("GBK");
           output = new XMLWriter(new FileWriter(new File(filename)),format);
           output.write(document);
           output.close();       
           /** 执行成功,需返回1 */
           returnValue = 1;      
        }catch(Exception ex){
           ex.printStackTrace();
       }
        return returnValue;
    }
 
    public static void main(String[] args) {
        Dom4jDemo temp = new Dom4jDemo();
        System.out.println(temp.createXMLFile("d://holen.xml"));
        System.out.println(temp.ModiXMLFile("d://holen.xml","d://holen2.xml"));
        System.out.println(temp.formatXMLFile("d://holen2.xml"));
    }
}
分享到:
评论

相关推荐

    计算机二级公共基础知识模 拟试题及答案详解.pdf

    计算机二级公共基础知识模 拟试题及答案详解.pdf

    电子工程领域的语音发射机电路设计与实现

    内容概要:本文档详细介绍了语音发射机的设计与实现,涵盖了从硬件电路到具体元件的选择和连接方式。文档提供了详细的电路图,包括电源管理、信号处理、音频输入输出接口以及射频模块等关键部分。此外,还展示了各个引脚的功能定义及其与其他组件的连接关系,确保了系统的稳定性和高效性能。通过这份文档,读者可以全面了解语音发射机的工作原理和技术细节。 适合人群:对电子工程感兴趣的初学者、从事嵌入式系统开发的技术人员以及需要深入了解语音发射机制的专业人士。 使用场景及目标:适用于希望构建自己的语音发射设备的研究人员或爱好者,帮助他们掌握相关技术和实际操作技能。同时,也为教学机构提供了一个很好的案例研究材料。 其他说明:文档不仅限于理论讲解,还包括具体的实施步骤,使读者能够动手实践并验证所学知识。

    易语言注册机源码详解:单线程架构下的接码、滑块验证与IP代理实现

    内容概要:本文详细介绍了用易语言编写的单线程全功能注册机源码,涵盖了接码平台对接、滑块验证处理、IP代理管理以及料子导入等多个核心功能。文章首先展示了主框架的初始化配置和事件驱动逻辑,随后深入探讨了接码平台(如打码兔)的API调用及其返回数据的处理方法。对于滑块验证部分,作者分享了如何利用易语言的绘图功能模拟真实用户的操作轨迹,并提高了验证通过率。IP代理模块则实现了智能切换策略,确保代理的有效性和稳定性。此外,料子导入功能支持多种格式的数据解析和去重校验,防止脏数据污染。最后,文章提到了状态机设计用于控制注册流程的状态持久化。 适合人群:有一定编程基础,尤其是熟悉易语言的开发者和技术爱好者。 使用场景及目标:适用于希望深入了解易语言注册机开发的技术细节,掌握接码、滑块验证、IP代理等关键技术的应用场景。目标是帮助读者理解并优化现有注册机的功能,提高其稳定性和效率。 其他说明:文中提到的部分技术和实现方式可能存在一定的风险,请谨慎使用。同时,建议读者在合法合规的前提下进行相关开发和测试。

    计算机绘图实用教程 第三章.pdf

    计算机绘图实用教程 第三章.pdf

    计算机辅助设计—AutoCAD 2018中文版基础教程 各章CAD图纸及相关说明汇总.pdf

    计算机辅助设计—AutoCAD 2018中文版基础教程 各章CAD图纸及相关说明汇总.pdf

    计算机类电子书集合PDF

    C++相关书籍,计算机相关书籍,linux相关及http等计算机学习、面试书籍。

    计算机二级mysql数据库程序设计练习题(一).pdf

    计算机二级mysql数据库程序设计练习题(一).pdf

    计算机发展史.pdf

    计算机发展史.pdf

    计算机二级课件.pdf

    计算机二级课件.pdf

    计算机概论第三讲:计算机组成.pdf

    计算机概论第三讲:计算机组成.pdf

    端侧算力网络白皮书:6G时代终端算力资源高效利用与应用场景解析

    内容概要:本文档由中国移动通信集团终端有限公司、北京邮电大学、中国信息通信研究院和中国通信学会共同发布,旨在探讨端侧算力网络(TCAN)的概念、架构、关键技术及其应用场景。文中详细分析了终端的发展现状、基本特征和发展趋势,阐述了端侧算力网络的定义、体系架构、功能架构及其主要特征。端侧算力网络通过整合海量泛在异构终端的算力资源,实现分布式多级端侧算力资源的高效利用,提升网络整体资源利用率和服务质量。关键技术涵盖层次化端算力感知图模型、资源虚拟化、数据压缩、多粒度多层次算力调度、现场级AI推理和算力定价机制。此外,还探讨了端侧算力网络在智能家居、智能医疗、车联网、智慧教育和智慧农业等领域的潜在应用场景。 适合人群:从事通信网络、物联网、边缘计算等领域研究和开发的专业人士,以及对6G网络和端侧算力网络感兴趣的学者和从业者。 使用场景及目标:适用于希望深入了解端侧算力网络技术原理、架构设计和应用场景的读者。目标是帮助读者掌握端侧算力网络的核心技术,理解其在不同行业的应用潜力,推动端侧算力网络技术的商业化和产业化。 其他说明:本文档不仅提供了端侧算力网络的技术细节,还对其隐私与安全进行了深入探讨

    学习java的心得体会.docx

    学习java的心得体会.docx

    计算机二级考试(南开100题齐全).pdf

    计算机二级考试(南开100题齐全).pdf

    计算机二级C语言考试通关宝典:全面解析核心知识点与解题技巧

    内容概要:本文详细介绍了计算机二级C语言考试的内容和备考方法。首先概述了计算机二级考试的意义及其在计算机技能认证中的重要性,重点讲解了C语言的基础语法,包括程序结构、数据类型、运算符和表达式等。接着深入探讨了进阶知识,如函数、数组、指针、结构体和共用体的应用。最后分享了针对选择题、填空题和编程题的具体解题技巧,强调了复习方法和实战演练的重要性。 适合人群:准备参加计算机二级C语言考试的学生和技术爱好者。 使用场景及目标:①帮助考生系统地掌握C语言的核心知识点;②提供有效的解题策略,提高应试能力;③指导考生制定合理的复习计划,增强实战经验。 其他说明:本文不仅涵盖了理论知识,还提供了大量实例代码和详细的解释,有助于读者更好地理解和应用所学内容。此外,文中提到的解题技巧和复习建议对实际编程也有很大帮助。

    论文格式及要求.doc

    论文格式及要求.doc

    三菱FX3U与台达变频器RS485通信程序设置及应用实例

    内容概要:本文详细介绍了如何使用三菱FX3U PLC及其485BD通信板与四台台达VFD-M系列变频器进行通信的设置与应用。主要内容涵盖硬件连接注意事项、通信参数配置、RS指令的应用、CRC校验算法的实现以及频率给定和状态读取的具体方法。文中提供了多个实用的编程示例,展示了如何通过梯形图和结构化文本编写通信程序,并讨论了常见的调试技巧和优化建议。此外,还提到了系统的扩展性和稳定性措施,如增加温度传感器通信功能和应对电磁干扰的方法。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是那些熟悉三菱PLC和台达变频器的使用者。 使用场景及目标:适用于需要实现多台变频器联动控制的工业应用场景,旨在提高生产效率和系统可靠性。通过学习本文,读者可以掌握如何构建稳定的RS485通信网络,确保变频器之间的高效协同工作。 其他说明:本文不仅提供了详细的理论指导,还包括了许多来自实际项目的经验教训,帮助读者避免常见错误并提升编程技能。

    计算机服务规范.pdf

    计算机服务规范.pdf

    Discuz-X3.2-TC-UTF8.zip

    Discuz_X3.2_TC_UTF8.zip LNMP搭建安装包

    2023年房地产行业研究报告:缓解竣工下行加速的两大改革.pdf

    2023年房地产行业研究报告:缓解竣工下行加速的两大改革

    win32汇编环境,网络编程入门之十五

    win32汇编环境,网络编程入门之十五

Global site tag (gtag.js) - Google Analytics