`

dom4j解析

    博客分类:
  • xml
xml 
阅读更多
一:构建dom4j树(表示为Document 元素)
常用方法:
方式一:直接创建所有元素:dom4j为我们准备了工具类DocumentHelper ,该类的所有的方法都是静态方法,用来创建xml文档的各个组成部分。

1.1.1创建Document 和Element对象:
Document doc=DocumentHelper.createDocument();
Element eltRoot=DocumentHelper.createElement(“student”);
doc.setEltRootElement(eltRoot);

1.1.2或者先准备好根元素,使用有参数的构造方法创建Document对象。
Element eltRoot=DocumentHelper.createElement(“student”);
Document doc=DocumentHelper.createDocument(eltRoot);

1.2:添加节点和设置节点内容:
方法:Branch 接口中定义的方法;
public Element addElemen(String  name)  //以指定的name 为当前节点创建一个子节点,并返回新节点的引用
public void setText(String text)  //将content设置为节点的内容

示例如下:
Element eltName=eltRoot.addElement(“name”);
Element eltAge=eltRoot.addElement(“age”);
eltName.setText(“张三”);
eltAge.setText(“18”);

1.3:添加属性

方法:public Element addAttribute(String name,String value)


示例如下:
eltRoot.addAttribute(“sn”,”01”);

方式2:
2.1:org.dom4j.io提供了两个类:SAXReader和DOMReader,前者从一个现有的w3c DOM树构建dom4j树,而SAXReader则使用SAX解析器,从不同的输入源构建dom4j树。

2.1.1: 使用 SAXReader 构建dom4j文档对象:示例如下:

SAXReader saxReader=new SAXReader();
File file=new File(“student.xml”);
Document doc=saxReader.read(file);

2.2.1:使用DOMReader 构建dom4j 文档对象.

DocumentBuilderFactory dbf=new DocumentBuilderFactory.newInstance();
DocumentBuilder db=dbf.newDocumentBuilder();
File file=new File(“student.xml”);
org.w3c.dom.Document document=db.parse(file);
DOMReader domReader=new DOMReader();
org.dom4j.Document doc=domReader.read(document);

访问根节点:
Element root=doc.getRootElement();
访问节点:
访问所有节点:
java.util.List childrenList=elt.elements();

访问指定名称的所有节点
java.util.Liat childrenList=elt.elements(“student”);

访问指定名称第一个节点
Element eltChild=elt.element(“student”);

要迭代某个元素的所有子元素:
for(java.util.Iterator it=root.elementIterator();it.hasNext()){
Element element =it.hasNext();
……
}

Dom4j 中集成了对XPath的支持。在选择节点时,可以直接使用XPath 表达式,例如:
要选择例子文件 students.xml中的所有的<name>元素,代码如下:
java.util.List l=root.selectNodes(“//name”);

要选择属性sn的值等于01的<student>元素,代码如下:
java.util.List l=root.selectNodes(“//student[@sn=’01’]”);

注意:为了能够编译执行上述使用XPath表达式的代码,需要配置dom4j 安装包中自带的jaxen包,你也可以从http://sourceforge.net/products/jaxen/上下载jaxen。jaxen是一个用java开发的XPath引擎,用于配合各种基于XML的对象模型,如DOM,dom4j和JDOM。在dom4-1.6.1 目录下,有一个lib 子目录,其中有个jaxen-1.1-beta-6.jar文件,需要在classpath环境变量中配置该文件的全路径名。

访问属性:
要得到某个元素的所有属性,,如下:
java.util.List attrList=elt.attributes();
要得到指定的属性,如下:
Attribute attr=elt.attribute(“sn”);
要得到某个属性的值;如下:
String attrValue=elt.attributeValue(“sn”);

删除节点和节点的属性:
要删除某个元素::可以用Branch接口中定义的remove()方法,如下:
Element eltStu=root.element(“student”);
root.remove(eltStu);

要删除某个属性;如下:
elt.remove(elt.attribute(“sn”));

输出文档:
对象:XMLWriter 实例方法:write(Document doc)
常用的几种构造方法总结:
1:无参数:
2:字节流参数
3:字符流参数。
4:文档输出格式类参数。
示例代码1:
输出文档内容到控制台
XMLWriter xw=new XMLWriter();
xw.write(doc);
示例代码2:
输出文档内容到文件。构造XMLWriter 对象的时候,可以传递字节流参数。其底层代码设置了自动刷新机制。
XMLWriter xw=new XMLWriter(new java.io.FileOutputStream(“student.xml”));
xw.write(doc);

示例代码3:
构造XMLWriter 对象的时候,可以传递java.io.Writer对象。
XMLWriter xw=new XMLWriter(new java.io.FileWriter(“student.xml”));                                                                        
xw.write(doc);
xw.close();
注意:使用java.io.Writer对象构建的XMLWriter对象,则没有设置自动刷新机制,所以在调用write()方法之后,还要调用xw.close()或者xw.flush()方法。并且XMLWriter 继承自org.xml.sax.helpers.XMLFilterImpl类。它所提供的close()和flush()方法只是其内部java.io.Writer 对象的flush()和close()方法的封装方法。

示例代码4:
构造XMLWriter 对象的时候,可以传递文档输出格式类org.dom4j.io.OutputFormat,利用这个类,可以设置输出文档的字符编码,设置行分割符以及控制使用的缩进字符串等。

下面的代码输出格式使用4个空格作为缩进字符串,元素之间添加新行。

OutputFormat outFmt=new OutputFormat(“    ”,true);
XMLWriter xw=new XMLWriter(outFmt);
xw.write(doc);

下面的代码采用美化的格式输出文档,设置字符串编码为GB2312,并且用4个空格作为缩进。
OutputFormat outFmt=OutputFormat.createPrettyPrint();
outFmt.setEncoding(“GB2312”);
outFmt.setIndent(“    ”);
XMLWriter xw=new XMLWriter(outFmt);
xw.write(doc);

dom4j的名称空间 信息api
常用的方法有8个。

dom4j在Element和Attribute 接口中定义了获取名称空间信息的方法,这些方法和JDOM中的方法相同。如下所示:
public java.lang.String getNamespacePrefix()
该方法返回元素(属性)的名称空间前缀
public java.lang.String getNamespaceURI()
该方法返回元素(属性)的名称空间URI
public java.lang.String getName()
该方法返回元素(属性)的本地名
public java.lang.String getQualifiedName()
该方法返回元素(属性)的限定名
public Namespace getNamespace()
该方法返回元素本身的名称空间
public java.util.List additionalNamespaces()
返回某元素上附加的名称空间声明列表,列表中的每一个对象都是Namespace类型。这个类的方法提供了两个方法分别获得名称空间前缀和本地名。如下:

public java.lang.String getPrefix()
该方法返回名称空间前缀。
public java.lang.String getURI()
该方法返回名称空间的URI。


---------------------------------------------------

DOM4J解析技术
一. Document对象相关

(1) 读取XML文件,获得document对象

eg ->

SAXReader reader = new SAXReader();
Document document = reader.read(new File(emp.xml"));

  


(2) 解析XML形式的文本,得到document对象

eg ->

String text = "元素";
Document document = DocumentHelper.parseText(text);

  

(3) 主动创建document对象

eg ->

Document document = DocumentHelper.createDocument();
Element root = document.addElement("members");// 创建根节点

  
二. 节点相关

(1) 获取文档的根节点.

eg ->

SAXReader reader = new SAXReader();
Document document = reader.read(new File(emp.xml"));

  

(2) 取得某节点的单个子节点

eg ->

Element memberElm=root.element("member");// "member"是节点名

  

(3) 取得节点的文字

eg ->

DString text=memberElm.getText();

或者:

eg ->

String text=root.elementText("name");//这个是取得根节点下的name字节点的文字

  

(4) 取得某节点下名为"member"的所有字节点并进行遍历

eg ->

List nodes = rootElm.elements("member");
    for (Iterator it = nodes.iterator(); it.hasNext();) {
        Element elm = (Element) it.next(); // do something
    }

  

(5)对某节点下的所有子节点进行遍历

eg ->

for(Iterator it=root.elementIterator();it.hasNext();){
    Element element = (Element) it.next(); // do something
}

  

(6) 在某节点下添加子节点

eg ->

Element ageElm = newMemberElm.addElement("age");

  

(7)设置节点文字.

eg ->

ageElm.setText("29");

  

(8) 删除某节点

eg ->

parentElm.remove(childElm);// childElm是待删除的节点,parentElm是其父节点

  

(9)添加一个CDATA节点

eg ->

Element contentElm = infoElm.addElement("content");
contentElm.addCDATA(diary.getContent());
contentElm.getText(); // 特别说明:获取节点的CDATA值与获取节点的值是一个方法
contentElm.clearContent(); //清除节点中的内容,CDATA亦可

  
三 . 属性相关

(1)取得某节点下的某属性

eg ->

Element root=document.getRootElement();
Attribute attribute=root.attribute("size");// 属性名name

  

(2)取得属性的文字

eg ->

String text=attribute.getText();

  

或者: eg ->

String text2=root.element("name").attributeValue("firstname"); //这个是取得根节点下name字节点的属性firstname的值.

  

(3)遍历某节点的所有属性

eg ->

Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
    Attribute attribute = (Attribute) it.next();
    String text=attribute.getText();
    System.out.println(text);
}

  

(4)设置某节点的属性和文字

eg ->

newMemberElm.addAttribute("name", "sitinspring");

  

(5) 设置属性的文字

eg ->

Attribute attribute=root.attribute("name");
attribute.setText("sitinspring");

  

(6)删除某属性

eg ->

Attribute attribute=root.attribute("size");// 属性名name
root.remove(attribute);

  
四 . 将文档写入XML文件

(1)文档中全为英文,不设置编码,直接写入的形式

eg ->

XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();

  

(2)文档中含有中文,设置编码格式写入的形式

eg ->

OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("GBK"); // 指定XML编码
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);
writer.write(document);
writer.close();

  
五 . 字符串与XML的转换

(1)将字符串转化为XML

eg ->

String text = " sitinspring ";
Document document = DocumentHelper.parseText(text);

  

(2)将文档或节点的XML转化为字符串

eg ->

SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));
Element root=document.getRootElement();
String docXmlText=document.asXML();
String rootXmlText=root.asXML();
Element memberElm=root.element("member");
String memberXmlText=memberElm.asXML();
分享到:
评论

相关推荐

    利用DOM4J解析SOAP的简单示例

    本篇文章将深入探讨如何利用DOM4J解析SOAP消息中的元素,以便在实际项目中进行有效的数据提取和操作。 首先,理解SOAP消息的结构至关重要。一个典型的SOAP消息如下所示: ```xml &lt;!-- Header元素中的内容 --&gt; ...

    dom4j解析xml详解

    ### DOM4J解析XML详解 #### 一、DOM4J简介与特性 DOM4J是一个由dom4j.org开发的开源XML解析包,专为Java平台设计,它不仅支持DOM、SAX和JAXP标准,还巧妙地融入了Java集合框架,使其成为Java开发者在处理XML数据时...

    dom4j 解析(读取) xml 节点数据

    在本教程中,我们将深入探讨如何使用DOM4J解析(读取)XML节点数据,不受XML层级的限制。 首先,确保你已经下载了必要的依赖,即DOM4J库。通常,这将是一个名为`dom4j-x.x.x.jar`的文件,其中x.x.x是DOM4J的版本号...

    dom4j 解析写入xml

    1、xml文档解析 2、 dom4j解析xml 3、实现xml文件解析 xml字符串解析 xml MAP键值对解析 4、实现xml写入与生成文件

    dom4j解析xml.txt

    ### DOM4J解析XML知识点详解 #### 一、DOM4J简介 DOM4J(Document Object Model for XML)是一款用于处理XML文档的轻量级Java库。它提供了一种非常简单且灵活的方式来创建、读取、修改和删除XML文档。DOM4J的主要...

    使用 dom4j 解析 XML

    使用 dom4j 解析 XML dom4j 解析 XML dom4j解析xml

    DOM4J 解析XML

    **DOM4J解析XML** DOM4J是一个强大的Java库,专门用于处理XML文档。它提供了灵活、高效且功能丰富的API,使得XML的读取、创建、修改和查询变得简单易行。DOM4J的主要特点包括对XPath的支持、事件驱动的解析、以及与...

    xmldom4j解析

    本教程将深入探讨XML DOM4J解析的相关知识点。 一、DOM4J基本概念 DOM4J是一种灵活的Java API,其设计目标是简化XML处理,提供高效且易于使用的API。与标准的DOM(Document Object Model)相比,DOM4J更轻量级,...

    dom4j解析xml文件的压缩包

    5. **事件驱动解析(SAX)**:除了传统的DOM解析外,DOM4J还支持SAX解析器,这种解析方式适用于处理大型XML文件,因为它不需要一次性加载整个文档到内存。 6. **Namespace支持**:DOM4J提供了对XML命名空间的全面...

    java dom4j解析xml

    Java DOM4J解析XML是一种常见的处理XML文档的技术,它提供了灵活且高效的API,使得开发者能够方便地读取、写入、修改以及操作XML文件。DOM4J是Java中一个非常强大的XML处理库,它结合了DOM、SAX和JDOM的优点,同时也...

    分别使用DOM和DOM4j解析XML文件

    以下是如何使用DOM4j解析XML: 1. 引入DOM4j库(如:dom4j-1.6.1.jar)。 2. 创建DocumentFactory实例。 3. 使用DocumentFactory的read()方法读取XML文件,得到Document对象。 4. 使用Document对象提供的方法(如...

    DOM4J解析XML代码

    在使用DOM4J解析XML文件之前,需要导入DOM4J相关的jar包,通常版本为1.6.1。 #### DOM4J常用对象 - **SAXReader**: 用于读取XML文件,并将其转换成Document对象。 - **Document**: XML文档对象树,类似于HTML文档...

    dom4j解析xml文件(增删改查)

    在“dom4j解析xml文件(增删改查)”这个主题中,我们将深入探讨如何使用DOM4J来实现XML文档的四种基本操作:增加元素、删除元素、更新元素内容以及查询元素。 首先,让我们了解DOM4J的基本用法。在解析XML文件时,...

    Dom4j解析XML+使用简介

    **Dom4j解析XML+使用简介** Dom4j是一个非常流行的Java库,专门用于处理XML文档,它提供了灵活且高效的方式来解析、创建和操作XML内容。这个库在XML处理领域中备受推崇,因为它简单易用,同时又具有高度的灵活性和...

    dom4j解析和java加解密

    DOM4J解析是处理XML文档的一种方式,它提供了丰富的API来读取、修改、创建和更新XML文件。DOM4J的核心概念包括元素(Element)、属性(Attribute)、文本(Text)等。使用DOM4J解析XML时,首先会将整个XML文件加载到...

    dom4j解析xml

    ### DOM4J解析XML知识点详解 #### 一、DOM4J简介 DOM4J是一个Java库,用于处理XML文档。它的设计目标是为了提供一个简单、易于使用的API来处理XML文件,同时保持性能上的优势。与Java标准库中的DOM实现相比,DOM4J...

    dom4j 解析xml实例

    在这个实例中,我们将深入探讨如何使用DOM4J解析XML文件,并通过`Dom4jTest1.java`这个示例程序来理解其工作原理。 首先,我们需要了解XML(Extensible Markup Language)是一种标记语言,常用于存储和传输数据。...

Global site tag (gtag.js) - Google Analytics