`

DOM4J学习笔记

    博客分类:
  • xml
阅读更多
DOM4J简单介绍
基本使用
读取XML文档
Import org.dom4j.io.SAXReader;
Import org.dom4j.Document;
Import org.dom4j.DocumentException;

private Document doc;

public void setDocument(File xmlFile) throws DocumentException{
      SAXReader sax = new SAXReader();
      /**
      Read的参数类型,可为:java.net.URL、String、java.io.InputStream等
      */
      This.doc = sax.read(xmlFile);
}


创建XML文档
Import org.dom4j.DocumentFactory;
Import org.dom4j.Document;
Import org.dom4j.Element;

Document doc = DocumentFacotry.getInstance().createDocument();
Element root = Doc.addElement(rootElementName);//添加根节点,返回根节点元素

Element author1 = root.addElement(“author”)
                .addAttribute(“name”,”tom”)//添加属性
                .addAttribute(“location”,”上海”)//添加属性
                .addText(“这是第一个”);//添加文本节点

保存XML
Import org.dom4j.io.XMLWriter;
Import org.dom4j.io.OutputFormat;
Import java.io.OutputStream;
Import org.dom4j.Document;

OutputFormat format = OutputFormat.createPrettyPrint();
Format.setEncoding(“GB2312”);//不设置,默认使用UTF-8
XMLWriter writer = new XMLWriter(outputStream,format);
Writer.write(document);
Writer.flush();

文档元素访问方法
Iterator
Public void vistorElement(Element e){
Iterator elementIterator = e.elementIterator();
//Iterator elementIterator = root.elementIterator(aFilterElementName);

    while(elementIterator.hasNext()){
      Element elmeent = (Element)elementIterator.next();
      System.out.println(element.getName());
     
    
     
     }
}

Index
public void treeWalk(Element element) {
    for ( int i = 0, size = element.nodeCount(); i < size; i++ ) {
      Node node = element.node(i);
      if ( node instanceof Element ) {
        treeWalk( (Element) node );
      }
      else {
        // do something....
      }
    }

List

XPATH
Import org.dom4j.DocumentHelper;
Import org.dom4j.XPath;
Import org.dom4j.Document;

Public void selectByXPath(){
      XPath path = DocumentHelper.createXPath(“/people/dj[@name=’joys’]”);

List list = Path.selectNodes(doc);

For(Iterator it = list.iterator();it.hasNext();){
     Element e = (Element)it.next();

}

//Path.selectSingleNode(doc);
//doc.valueOf(“xpath expression”);
}
部分API介绍
DocumentFactory
getInstance()
createDocument()、createDocument(String encoding)、createDocument(Element root)
创建文档,可以无参数,或者参数为字符串(编码方式),或者为(根目录)
createXPath(String xpathExpression)
解析xpathExpression,创建一个XPath对象
DocumentHelper
createDocument()、createDocument(Element root)
createXPath(String xpathExpression)
parseText(String text)
解析提供的文本为XML DOCUMENT,返回一个新的DOCUMENT对象
XPath
selectNodes(Object context)
context—是一个Node对象或者是一个Node对象的List集E合,DOCUMENT,ATTRIBUTE、ELEMENT,都实现了NODE接口
执行XPath表达式,并返回一个单独的LIST<Node>
selectSingleNode(Object context)
Node
asXML()
getName()
getText()
selectNodes(String xpathExpression)
selectSingleNode(String xpathExpression)
valueOf(String xpathExpression)

Branch
normalize()
格式化所有的节点及其所有深层的子树,包含attribute等,节点之间不能是连接的文本节点或者是内容为空的文本节点
nodeCount()
该对象包含的节点数
node(int index)
一般连同nodeCount()使用,
index ---- 索引
remove(Node node)
remove(Element element)
add(Node node)
add(Element element)
addElement(String name)
nodeIterator()
Element
addAttribute(String name,String value)
attributeIterator()
elementIterator()
remove(Text text)
remove(Attribute attribute)
getText()
getTextTrim()
Boolean isRootElement()

Attribute
getValue()
XPATH介绍
<AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <CCC/>
     </AAA>

一、基本的XPATH语法和文件系统相似,如果它是以斜线“/”开始,它是描述请求元素的绝对路径。
范例结构:
访问元素“AAA”---- “/AAA” 。
访问元素“CCC” --- “/AAA/CCC”,访问根目录AAA下面的子节点CCC,本例会得到两个节点的集合。
访问根节点AAA的子节点DDD的子节点BBB:“/AAA/DDD/BBB”,本例会得到一个节点(标红色的节点)”<DDD><BBB/></DDD>”


二、如果路径表达式以“//”开始,它会查找所有符合规则的元素
范例结构:
“//BBB”,选择所有的元素<BBB/>,本例中共有四处
“//DDD/BBB”,选择元素节点“DDD”下的子节点“BBB”,只要满足元素“BBB”为“DDD”的子元素,就会被选择,

三、“*”选择所有由前面路径定位的元素
范例:
“/AAA/*”表示选择根节点下所有的元素
“/*/CCC”选择有一个父元素的“CCC”元素,“/*/*/BBB”选择第三级的根节点下的所有的“BBB”元素
“//*”表示匹配所有的元素

四、在方括号中的表达式可以进一步的指定元素,方括号中的数字表示被选择元素集合的位置,last()函数表示被选择元素集的最后一个元素
“/AAA/BBB[2]” 表示根节点下“BBB”元素集合的第二个元素
“/AAA/BBB[last()]” 表示根节点下“BBB”元素集合的最后一个元素

五、“@”表示属性
<AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>
“//@id”表示所有的名为“id”属性

“//BBB[@id]”表示所有含有ID属性的BBB元素

“//BBB[@*]”表示含有属性的所有的BBB元素,本例中的<BBB/>不会被选择,其它三个被选中

“//BBB[not(@*)]”表示没有属性的元素,本例中<BBB/>被选中,其它的三个元素不被选择

六、属性的值可以做为选择标准,函数“normalize-space”可以移掉头部和尾部的空格,或者用单个的空格替换

“//BBB[@id=’b1’]”:选择属性值为“b1”的元素“BBB”
<AAA>
          <BBB id = "b1"/>
          <BBB name = " bbb "/>
          <BBB name = "bbb"/>
     </AAA>

“//BBB[@name=’bbb’]”:选择属性值为“bbb”的元素,注意由于每一个属性名为name的元素“BBB”,其值有空格,不会被选择。
“//BBB[normalize-space(@name)='bbb']”:选择名称为“name”的,其值为“bbb”,值前后可以有空格,本例则会选择两个“BBB”元素

七、函数count(*):计算选择元素的个数
“//*[count(BBB)=2]”,选中含两个“BBB”子元素的元素

“//*[count(*)=2]”,选中含有两个子元素的元素

其它的规则暂时不介绍,详情见:http://www.zvon.org/xxl/XPathTutorial/General/examples.html
分享到:
评论

相关推荐

    Dom4j学习笔记

    **标题解析:** "Dom4j学习笔记" 这个标题明确指出了我们要探讨的主题——Dom4j。Dom4j是一个流行的Java库,用于处理XML文档。它提供了丰富的API,使得XML的读取、写入、操作变得简单易行。在学习笔记中,通常会涵盖...

    dom4j 学习笔记

    **DOM4J学习笔记** DOM4J是一个强大的Java XML API,它提供了丰富的XML处理功能,包括文档构建、解析、修改和查询。作为一个开源项目,DOM4J在XML处理领域具有广泛的用户基础,因其简单易用和高效性能而备受青睐。...

    dom4j学习笔记

    **DOM4J学习笔记** DOM4J是一个Java库,它提供了强大的XML处理功能,包括解析、操作和生成XML文档。这个库是开源的,广泛应用于Java应用程序中,特别是在需要处理XML数据时。DOM4J的设计目标是易于使用,同时保持高...

    dom4j学习笔记.txt

    ### DOM4J学习笔记 #### 一、DOM4J简介 DOM4J是一个Java库,用于处理XML数据。它提供了一种非常灵活的方式来解析、创建和修改XML文档。DOM4J是一个开源项目,由Red Hat公司支持。相较于其他XML解析器如DOM、SAX等...

    XML DOM4J学习笔记

    本篇笔记将深入探讨XML DOM4J的学习要点。 一、XML基础知识 1. XML结构:XML文档由元素(Element)、属性(Attribute)、文本内容(Text)、注释(Comment)等组成。每个XML文档都有一个根元素,其他元素嵌套在根...

    Dom4j学习教程+API+xml实用大全+xml学习笔记+htc

    标题"Dom4j学习教程+API+xml实用大全+xml学习笔记+htc"提及了几个关键主题,包括Dom4j的学习资源、API文档,以及关于XML的实用指南和学习笔记,还提到了一个名为"htc"的文件,可能是关于HTC设备或技术的文档。...

    Dom4j 解析Xml文档及 XPath查询 学习笔记

    **标题:** Dom4j 解析Xml文档及 XPath查询 学习笔记 **正文:** XML(eXtensible Markup Language)是一种标记语言,常用于数据交换、配置存储以及文档结构化表示。在Java世界中,解析XML文档有多种库,其中Dom4j是...

    DOM4J笔记.学习如何应用DOM4J开发XML

    DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了简单而直观的方式来解析、创建、修改和查询XML数据。以下是对DOM4J主要功能的详细说明: 1. **解析XML文档** DOM4J使用SAXReader类来解析XML文档。在示例...

    dom4j解析XML(学习笔记)

    ### DOM4j解析XML知识点详解 #### 一、DOM4j简介 DOM4j是一个用于处理XML文档的Java库,其名称来源于“Document Object Model for Java”,但它与标准的DOM API并不完全相同,而是提供了更为简便和高效的方式来...

    dom4j 包含例子 各种增删改查

    "2012-4-10 有关 xml dom4j的 crud"可能是另一个教程或者笔记,详细讲解了如何利用DOM4J进行XML的CRUD操作。这个文件可能包含了详细的步骤和代码示例,对于学习DOM4J非常有帮助。 "自己写的 dom4j的例子"很显然是...

    DOM学习笔记

    **DOM学习笔记** DOM,全称为Document Object Model,是HTML和XML文档的一种标准表示方式,它将网页内容结构化为一个可编程的节点树。在DOM中,每个部分(如元素、属性、文本等)都有对应的对象,允许我们通过...

    树懒_day05.1_xml_DOM4J笔记

    移动开发的小白树懒正在努力的学习移动开发中的web体系中的xml解析,每天提高自己...

    xml学习笔记

    在XML学习笔记中,我们可能会遇到以下几个关键知识点: 1. **XML基本结构**:XML文档由元素(Element)、属性(Attribute)、文本(Text)、注释(Comment)、处理指令(Processing Instruction)等组成。每个XML...

    java与xml 学习笔记整理

    另外,JDOM和DOM4J是两个流行的DOM替代库,提供了更友好的API来操作XML,尤其是对于复杂的XML结构。 JDOM简化了DOM的一些操作,它使用Java对象直接映射XML元素,使得操作更直观。DOM4J则在DOM的基础上进行了扩展,...

    NekoHTML学习笔记.doc

    NekoHTML 学习笔记 NekoHTML 是一个简单的 HTML 扫描器和标签补偿器,使得程序能解析 HTML 文档并用标准的 XML 接口来访问其中的信息。这个解析器能投扫描 HTML 文件并“修正”许多作者(人或机器)在编写 HTML ...

    java学习笔记 读写配置问价xml格式 。

    java操作xml文件大家可以借鉴一下 利用dom4j第三方jar包 支持增加 删除 修改 查询

Global site tag (gtag.js) - Google Analytics