`

Dom4j 解析Xml文档及 XPath查询 学习笔记

阅读更多


本文查阅方法:
    1、查阅目录 —— 查阅本文目录,确定想要查阅的目录标题
    2、快捷“查找” —— 在当前浏览器页面,按键 “Ctrl+F” 按键组合,开启浏览器的查找功能,
             在查找搜索框中 输入需要查阅的 目录标题,便可以直接到达 标题内容 的位置。
    3、学习小结 —— 文中的学习小结内容,是笔者在学习之后总结出的,开发时可直接参考其进行应用开发的内容, 进一步加快了本文的查阅 速度。(水平有限,仅供参考。)

 

 

 


 

本文目录

 

    学习小结

 

     1、Dom4j 概述
     2、获取 Document对象
     3、将文档(document)写入XML文件/更新XML文件     

 

     4、获取/操作 节点对象 

 

           (1)获取文档的根节点.

 

           (2)取得某个节点指定名称的子节点.

 

           (3)取得节点的文字

 

           (4)取得某节点下所有 指定名称 的子节点,并进行遍历.  

 

           (5)对某节点下的所有子节点进行遍历.  

 

           (6)在某节点下添加子节点.

 

           (7)设置节点文字. 

 

           (8)删除某节点. //childElm是待删除的节点,parentElm是其父节点

 

           (9)Dom4j在指定位置插入节点 

 

           (10)添加一个CDATA节点. 

 

      5、获取/操作 节点对象属性

 

           (1)取得某节点下的某属性对象 

 

           (2)取得属性的文字

 

           (3)删除某属性  

 

           (4)遍历某节点的所有属性    

 

           (5)设置某节点的属性和文字.

 

           (6)设置属性的文字

 

      6、字符串与XML的转换 

 

          (1)将字符串转化为XML 

 

          (2)文档或节点的XML转化为字符串. 

 

     7、操作xml节点 以及节点属性的 Demo范例集合
     8、XPath:超级强大的Xml文档 节点查询定位 技术
     9、XPath  使用方法范例Demo 

 

 

 相关文章
    XML文档语法 学习笔记
        地址:http://even2012.iteye.com/blog/1828064

    DTD约束 —— Xml文档 约束技术 学习笔记
        地址:http://even2012.iteye.com/blog/1828290

    Schama —— Xml文档约束技术 学习笔记
        地址:http://even2012.iteye.com/blog/1832073

    Dom4j 解析Xml文档及 XPath查询  学习笔记
        地址:http://even2012.iteye.com/blog/1832068

    Jaxp :Dom解析Xml文档和SAX解析Xml文档学习笔记
        地址:http://even2012.iteye.com/blog/1829981


 

 

 

学习小结

 

  (一) 使用Dom4j 操作Xml文档的三个步骤:
     (1)获取document对象:
          SAXReader reader = new SAXReader();              
          Document  document = reader.read(new File("input.xml"));
     (2)操作节点对象及其属性
          A.使用XPath方式 查询获取节点
              a.查询仅单个节点:document.selectSingleNode("查询表达式"); 
              b.查询多个节点:  document.selectNodes("查询表达式"); 
          ​B.普通方式获取节点。
              Element root = document.getRootElement();     
     (3)将document对象写回到xml文档
          OutputFormat format = OutputFormat.createPrettyPrint();  
          format.setEncoding("UTF-8");  // 指定XML编码 
          XMLWriter writer = new XMLWriter(new FileOutputStream("output.xml"),format); 
          writer.write(document);   
          writer.close();

 

  (二)"从无到有"生成document对象
     (1)解析XML形式的文本,得到document对象. 
          String text = "<members></members>";   //创建根节点           
          Document document = DocumentHelper.parseText(text);
     (2)主动创建document对象. 
          Document document = DocumentHelper.createDocument();  
          Element root = document.addElement("members");//创建根节点 

 

 

 


 

  

 

1、Dom4j 概述

 

    Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。 

 

    Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。

 

    使用Dom4j开发,需下载dom4j相应的jar文件。

 

    备注:在使用Dom4j开发中,要导入一些类的包时,一定要导入Dom4j的自己的包名,否则就会出现需要转类型的提示信息。若是强行转换,则将无法使用Dom4j提供的强大的功能的良好的性能。

 

 

 


 

 

 

2、获取 Document对象

 

    DOM4j中,获得Document对象的方式有三种: 

 

      (1)读取XML文件,获得document对象【有源模式:源Xml文档必须已经存在】            

 

           SAXReader reader = new SAXReader();              

 

           Document   document = reader.read(new File("input.xml"));

 

     

 

      (2)解析XML形式的文本,得到document对象. 【无源模式:无需存在源Xml文档】

 

           String text = "<members></members>";   //创建根节点           

 

           Document document = DocumentHelper.parseText(text);

 

     

 

      (3)主动创建document对象.【无源模式:无需存在源Xml文档】 

 

           Document document = DocumentHelper.createDocument();  

 

           Element root = document.addElement("members");//创建根节点 

 

 

 


 

   

 

3、将文档(document)写入XML文件/更新XML文件  . 

 

    (1)文档中全为英文,不设置编码,直接写入的形式.   

 

        XMLWriter writer = new XMLWriter(new  FileWriter("output.xml"));   

 

        writer.write(document);   

 

        writer.close();     

 

    (2)文档中含有中文,设置编码格式写入的形式. 

 

        OutputFormat format = OutputFormat.createPrettyPrint();   // Pretty [ˈpriti]   

 

                // format [ˈfɔ:mæt]           

 

        format.setEncoding("GBK");  // 指定XML编码 

 

        XMLWriter writer = new XMLWriter(newFileWriter("output.xml"),format); 

 

        writer.write(document);     //注:为避免编码问题,此处也可使用new FileOutputStream("").

 

        writer.close();

 

 

 


 

 

 

4、获取/操作 节点对象 

 

    (1)获取文档的根节点.

 

          Demo样例:Element root = document.getRootElement();     

 

    (2)取得某个节点指定名称的子节点.

 

          Demo样例:Element childElement=anyNode.element(“书名");     

 

    (3)取得节点的文字

 

          Demo样例: String text=anyNode.getText(); 

 

    (4)取得某节点下所有 指定名称 的子节点,并进行遍历.  

 

          Demo样例: 

 

            List nodes = element.elements("member");     

 

            for (Iterator it = nodes.iterator(); it.hasNext();) {      

 

                Element element = (Element) it.next();  

 

                //do something  

 

            }     

 

    (5)对某节点下的所有子节点进行遍历.     

 

           for(Iterator it=element.elementIterator();it.hasNext();){        

 

                Element element = (Element) it.next(); 

 

                //do something     

 

           }

 

    (6)在某节点下添加子节点. 

 

          Element ageElement  = element.addElement("age");

 

    (7)设置节点文字.  

 

          element.setText("29");     

 

    (8)删除某节点. //childElm是待删除的节点,parentElm是其父节点

 

          parentElm.remove(childElm); 

 

    (9)Dom4j在指定位置插入节点 

 

        a.得到插入位置的节点列表(list)

 

        b.调用list.add(index,elemnent),由index决定element的插入位置。

 

            Element元素可以通过DocumentHelper对象得到。

 

            示例代码: 

 

                Element aaa = DocumentHelper.createElement("aaa");

 

                aaa.setText("aaa"); 

 

                List list = root.element("书").elements();

 

                list.add(1, aaa); 

 

 

 

    (10)添加一个CDATA节点. 

 

          Element contentElm = infoElm.addElement("content"); 

 

          contentElm.addCDATA(diary.getContent());

 


 

 

 

5、获取/操作 节点对象属性 

 

    (1)取得某节点下的某属性对象     

 

        Element root=document.getRootElement();   

 

        Attribute attribute=root.attribute("size"); //属性名name 

 

    (2)取得属性的文字     

 

        String text=attribute.getText(); 

 

    (3)删除某属性  

 

        Attribute attribute=root.attribute("size");  

 

        root.remove(attribute);

 

    (4)遍历某节点的所有属性    

 

        Element root=document.getRootElement();        

 

        for(Iterator it=root.attributeIterator();it.hasNext();){          

 

            Attribute attribute = (Attribute) it.next();          

 

            String text=attribute.getText();          

 

            System.out.println(text);     

 

        } 

 

    (5)设置某节点的属性和文字.    

 

        newMemberElm.addAttribute("name", "sitinspring");     

 

    (6)设置属性的文字    

 

        Attribute attribute=root.attribute("name");    

 

        attribute.setText("sitinspring"); 

 

     


 

 

 

6、字符串与XML的转换 

 

    (1)将字符串转化为XML  

 

        String text = "<members> <member>sitinspring</member></members>"; 

 

        Document document = DocumentHelper.parseText(text); 

 

    (2)文档或节点的XML转化为字符串. 

 

        SAXReader reader = new SAXReader(); 

 

        Document   document = reader.read(new File("input.xml"));           

 

        String docXmlText=document.asXML(); 

 

 

 

        Element root=document.getRootElement();   

 

        String rootXmlText=root.asXML(); 

 

 

 

        Element memberElm=root.element("member"); 

 

        String memberXmlText=memberElm.asXML(); 

 

 

 

     【备注:其他的API可参见 附件资料:《dom4jAPI帮助文档》】

 

 

 


 

 7、操作xml节点 以及节点属性的 Demo范例集合

 

 

 

//dom4j解析xml文档

 

public class Demo1 { 

 

  //遍历xml文档所有标签

 

      @Test

 

      public void listFile() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml"));

 

            Element root = document.getRootElement();

 

            list(root);

 

      } 

 

      public void list(Element e){

 

            System.out.println(e.getName());

 

            List<Element> list = e.elements();

 

            for(Element child : list){

 

                  list(child);

 

            }

 

      }

 

 

 

  //获取:<书名 name="aaa">javaweb开发</书名> 节点内容

 

      @Test

 

      public void test1() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml"));

 

            String value = document.getRootElement().element("书").element("书名").getText();

 

            System.out.println(value);

 

      }

 

 

 

  //获取:<书名 name="aaa">javaweb开发</书名> 节点属性

 

      @Test

 

      public void test2() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml"));

 

            Element bookname = document.getRootElement().element("书").element("书名");

 

            System.out.println(bookname.attributeValue("name"));

 

      }

 

 

 

  //向xml文档中添加一个售价节点

 

      @Test

 

      public void test3() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml")); 

 

            //创建要添加的节点

 

            Element e = DocumentHelper.createElement("售价");

 

            e.setText("39元"); 

 

            //把节点挂到书下

 

            document.getRootElement().element("书").add(e); 

 

            //把更新的内容写回到xml  docunment(UTF-8)

 

            /*XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream("src/book.xml"),"UTF-8"));

 

            writer.write(document);

 

            writer.close();*/ 

 

     

 

            /*XMLWriter writer = new XMLWriter(new FileWriter("src/book.xml"));

 

            writer.write(document);

 

            writer.close();*/

 

         

 

            /*OutputFormat format = OutputFormat.createPrettyPrint();

 

            format.setEncoding("UTF-8");*/ 

 

        

 

            OutputFormat format = OutputFormat.createCompactFormat();

 

            format.setEncoding("UTF-8");

 

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);

 

            writer.write(document);    //推荐这种XML输出流,防止乱码的出现。

 

            writer.close(); 

 

      }

 

 

 

  //向xml文档中添加一个售价节点

 

      @Test

 

      public void test4() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml")); 

 

            document.getRootElement().element("书").addElement("售价").setText("189元"); 

 

            OutputFormat format = OutputFormat.createPrettyPrint();

 

            format.setEncoding("UTF-8");

 

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);

 

            writer.write(document);

 

            writer.close(); 

 

      }

 

 

 

  //向xml文档的指定位置添加一个售价节点

 

      @Test

 

      public void test5() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml")); 

 

            //创建要添加的节点

 

            Element e = DocumentHelper.createElement("售价");

 

            e.setText("39元"); 

 

            List list = document.getRootElement().element("书").elements();

 

            list.add(2, e); 

 

            OutputFormat format = OutputFormat.createPrettyPrint();

 

            format.setEncoding("UTF-8");

 

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);

 

            writer.write(document);

 

            writer.close();

 

      }

 

 

 

  //删除节点

 

      @Test

 

      public void test6() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml")); 

 

            Element e = (Element) document.getRootElement().element("书").elements("售价").get(1);

 

            e.getParent().remove(e); 

 

            //更新

 

            OutputFormat format = OutputFormat.createPrettyPrint();

 

            format.setEncoding("UTF-8");

 

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);

 

            writer.write(document);

 

            writer.close();

 

      }

 

 

 

  //修改节点的值:第二本书售价的值

 

      @Test

 

      public void test7() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml")); 

 

            Element e = (Element) document.getRootElement().elements("书").get(1);

 

            e.element("售价").setText("890元"); 

 

            //更新

 

            OutputFormat format = OutputFormat.createPrettyPrint();

 

            format.setEncoding("UTF-8");

 

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);

 

            writer.write(document);

 

            writer.close();

 

      }

 

 

 

  //  根据节点里的内容删除内容所在的节点?

 

      @Test

 

      public void test8() throws DocumentException, IOException{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml"));

 

            Element root = document.getRootElement();

 

            list1(root); 

 

            //更新

 

            OutputFormat format = OutputFormat.createPrettyPrint();

 

            format.setEncoding("UTF-8");

 

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);

 

            writer.write(document);

 

            writer.close();

 

      }

 

 

 

      public void list1(Element e){

 

            String  value = e.getText();

 

            if("JavaScript网页开发".equals(value)){

 

                  e.getParent().remove(e);

 

            }

 

            List<Element> list = e.elements();

 

            for(Element child : list){

 

                  list1(child);

 

            }

 

      } 

 

}

 

 

 


 

 

 

 8、XPath:超级强大的Xml文档 节点查询定位 技术

 

    XPath 是dom4j组织提供的非常强大的 Xml文档 节点查询定位 技术 ,利用它可以非常快速的定位并获取到所需要的节点对象。甚至可以对查询条件设置很多的限定约束。

 

    基本应用语法:

 

        (1)查询仅单个节点:document.selectSingleNode("查询表达式"); 

 

        (2)查询多个节点:  document.selectNodes("查询表达式"); 

 

    其中的查询表达式 使其实现快速查询定位关键,XPath中各种丰富的查询表达式语法 学习 附件资料《XPath Tutorial(菜鸟必备)》 ,资料中共列出了 近22种实例 供大家学习。

 

    其使用方法则参加下面的范例Demo

 

    

 


 

9、XPath  使用方法范例Demo 

 

 

 

public class Demo2 { 

 

 // 简单查询条件的应用 

 

      @Test   

 

      public void test1() throws Exception{

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/book.xml"));

 

         

 

            Element e = (Element) document.selectSingleNode("//作者");

 

            System.out.println(e.getText());

 

         

 

            Element e1 = (Element) document.selectNodes("//作者").get(1);

 

            System.out.println(e1.getText());

 

      }

 

 

 

  // 复杂查询条件 。实现用户名和密码校验功能。重点参考,非常好

 

      @Test

 

      public void test2() throws Exception{

 

            String username = "aaa1";

 

            String password = "123";

 

         

 

            SAXReader reader = new SAXReader();

 

            Document document = reader.read(new File("src/users.xml"));

 

         

 

            Node node = document.selectSingleNode("//user[@username='"+username+"' and @password='"+password+"']");

 

            if(node!=null){

 

                  System.out.println("登陆成功!!");

 

            }else{

 

                  System.out.println("用户名或密码错误,登陆失败!!");

 

            } 

 

      } 

 

}

 

 

 

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2
3
分享到:
评论

相关推荐

    dom4j解析XML(学习笔记)

    为了在Java项目中使用DOM4j进行XML解析,首先需要下载DOM4j及相关依赖库。根据给定的部分内容中的信息,我们可以看到以下步骤: 1. **下载JAR包**:首先需要下载`dom4j-1.6.1.jar`和`jaxen-1.1-beta-10.jar`两个JAR...

    XML DOM4J学习笔记

    总结,XML DOM4J提供了一种高效且易用的方式来处理XML文档,结合XPath查询,能够快速地定位和操作XML数据。在实际开发中,根据项目需求和文档规模选择合适的XML处理方式至关重要。通过持续学习和实践,可以熟练掌握...

    Dom4j学习教程+API+xml实用大全+xml学习笔记+htc

    标题"Dom4j学习教程+API+xml实用大全+xml学习笔记+htc"提及了几个关键主题,包括Dom4j的学习资源、API文档,以及关于XML的实用指南和学习笔记,还提到了一个名为"htc"的文件,可能是关于HTC设备或技术的文档。...

    DOM4J笔记.学习如何应用DOM4J开发XML

    - **XPath表达式**:DOM4J支持XPath,一种强大的查询语言,可用于定位XML文档中的任何节点。在第46行,`selectNodes("//foo/bar")`返回匹配该XPath表达式的节点列表。第47行的`selectSingleNode("//foo/bar/author...

    dom4j 学习笔记

    **DOM4J学习笔记** DOM4J是一个强大的Java XML API,它提供了丰富的XML处理功能,包括文档构建、解析、修改和查询。作为一个开源项目,DOM4J在XML处理领域具有广泛的用户基础,因其简单易用和高效性能而备受青睐。...

    Dom4j学习笔记

    **标题解析:** "Dom4j学习笔记" 这个标题明确指出了我们要探讨的主题——Dom4j。Dom4j是一个流行的Java库,用于处理XML文档。它提供了丰富的API,使得XML的读取、写入、操作变得简单易行。在学习笔记中,通常会涵盖...

    DOM4J学习笔记

    **DOM4J学习笔记** DOM4J是一个Java库,它提供了强大的XML处理功能,包括解析、操作和生成XML文档。这个库是开源的,广泛应用于Java项目中,因其易用性和灵活性而备受开发者喜爱。这篇笔记将深入探讨DOM4J的核心...

    dom4j学习笔记.txt

    ### DOM4J学习笔记 #### 一、DOM4J简介 DOM4J是一个Java库,用于处理XML数据。它提供了一种非常灵活的方式来解析、创建和修改XML文档。DOM4J是一个开源项目,由Red Hat公司支持。相较于其他XML解析器如DOM、SAX等...

    dom4j学习笔记

    **DOM4J学习笔记** DOM4J是一个Java库,它提供了强大的XML处理功能,包括解析、操作和生成XML文档。这个库是开源的,广泛应用于Java应用程序中,特别是在需要处理XML数据时。DOM4J的设计目标是易于使用,同时保持高...

    dom4j 包含例子 各种增删改查

    "Read"即读取XML文档,DOM4J支持多种方式来获取XML数据,包括通过XPath表达式查询。XPath是一种强大的语言,可以定位到XML文档中的任何节点。这里可能包含了一个名为`jaxen-1.1.1.jar`的文件,它是XPath的实现,允许...

    xml学习笔记

    DOM4J是基于Java DOM API的扩展,它提供了更加简单易用的API,支持XPath查询,使得XML文档的读取、写入、修改变得高效且直观。在XML学习笔记中,我们可能会遇到以下几个关键知识点: 1. **XML基本结构**:XML文档由...

    java与xml 学习笔记整理

    DOM4J则在DOM的基础上进行了扩展,支持XPath查询,提供了更多的便利功能。 总的来说,Java处理XML提供了多种选择,每种都有其适用场景。DOM适合于小到中型的XML文件,且需要频繁地读写和修改XML结构。SAX适合处理...

    pugixml学习笔记1 加载文件

    在“pugixml学习笔记1 加载文件”中,我们将探讨如何利用pugixml库来加载XML文件,包括从内存、文件、字符串和流中加载。 首先,我们需要了解pugixml的核心类:`pugi::xml_document`、`pugi::xml_node`和`pugi::xml...

    Xml高级学习笔记

    【XML 高级学习笔记】 XML(Extensible Markup Language)是一种可扩展标记语言,与HTML类似,但其设计目标是存储和传输数据,而非呈现数据。XML允许用户自定义标签,使得它成为一种自描述的语言,并且是W3C的标准...

    XML高级编程学习笔记

    XPath(XML Path Language)是查询XML文档的语言,用于选取节点。XQuery则更为强大,它是一门用于查询XML数据的编程语言,支持复杂的数据检索和处理任务。 6. SOAP 和 Web Services SOAP(Simple Object Access ...

    圣思园XML培训视频课堂笔记完整版(含xml_1.pdf和xml_2.pdf)

    本课程涵盖了从基础到高级的XML概念,包括语法、解析方式、DOM与SAX解析器、DTD和XML Schema验证、XPath查询、XSLT转换等。 首先,XML的基础知识是学习的重点。XML文档由一系列元素构成,每个元素都有可能包含其他...

    day023-xml解析笔记和代码.rar

    由于DOM4J在解析XML时只能一层一层解析,所以当XML文件层数过多时使用会很不方便, 结合XPATH就可以直接获取到某个元素 使用dom4j支持xpath的操作的几种主要形式 第一种形式 /a/b/c: 表示一层...

    MLDN学习笔记 —— XML学习笔记

    1. **XPath**:查询XML文档中特定节点的语言,方便快速定位数据。 2. **XSLT(XSL Transformations)**:用于转换XML文档的样式表语言,可以将XML转换为HTML或其他格式。 3. **XML与Java、Python等编程语言的结合**...

Global site tag (gtag.js) - Google Analytics