`

在Java中实现DOM文档和XML文件互相转换

    博客分类:
  • java
阅读更多
文简要描述了DOM的概念和内部逻辑结构,实例讲述DOM文档操作和XML文件互相转换的java实现过程。


1. DOM简介


目前,W3C已于2000年11月13日推出了规范DOM level 2。文档对象模型(DOM)是HTML和XML文档的编程接口规范,它与平台和语言是无关的,因而可以用各种语言在各种平台上实现。该模型定义了THML和XML文件在内存中的逻辑结构(即为文档),提供了访问、存取THML和XML文件的方法。利用DOM规范,可以实现DOM 文档和XML之间的相互转换,遍历、操作相应DOM文档的内容。可以说,要自由的操纵XML文件,就要用到DOM规范。


2. DOM内部逻辑结构


DOM文档中的逻辑结构可以用节点树的形式进行表述。通过对XML文件的解析处理,XML文件中的元素便转化为DOM文档中的节点对象。DOM的文档节点有Document、Element、Comment、Type等等节点类型,其中每一个DOM文档必须有一个Document节点,并且为节点树的根节点。它可以有子节点,或者叶子节点如Text节点、Comment节点等。任何的格式良好的XML文件中的每一个元素均有DOM文档中的一个节点类型与之对应。利用DOM接口将XML文件转化成DOM文档后,我们就可以自由的处理XML文件了。


3. java中的DOM接口


DOM规范提供的API的规范,目前Sun公司推出的jdk1.4测试版中的java API遵循了 DOM level 2 Core推荐接口的语义说明,提供了相应的java语言的实现。


在org.xml.dom中,jkd1.4提供了Document、DocumentType、Node、NodeList、Element、Text等接口,这些接口均是访问DOM文档所必须的。我们可以利用这些接口创建、遍历、修改DOM文档。


在javax.xml.parsers中,jkd1.4提供的DoumentBuilder和DocumentBuilderFactory组合可以对XML文件进行解析,转换成DOM文档。


在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了DOMSource类和StreamSource类,可以用来将更新后的DOM文档写入生成的XML文件中。


4. 例程


4.1 将XML文件转化成DOM文档


这个过程是获得一个XML文件解析器,解析XML文件转化成DOM文档的过程。


Jdk1.4中,Document接口描述了对应于整个XML文件的文档树,提供了对文档数据的访问,是该步骤的目标。Document接口可以从类DocumentBuilder中获取,该类包含了从XML文档获得DOM文档实例的API。XML的解析器可以从类DocumentBuilderFactory中获取。在jdk1.4中,XML文件转化成DOM文档可以有如下代码实现:


//获得一个XML文件的解析器


DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

//解析XML文件生成DOM文档的接口类,以便访问DOM。


DocumentBuilder builder = factory.newDocumentBuilder();

document = builder.parse( new File(FileName) );


4.2 遍历DOM文档


获得接口类document实例后,可以对DOM的文档树进行访问。要遍历DOM文档,首先要获得Root元素。然后获得Root元素的子节点列表。这里通过递归的方法实现遍历的目的。


//获得Root元素


Element element = document.getDocumentElement();


//获得Root元素的子节点列表


nodelist = element.getChildNodes();


//用递归方法实现DOM文档的遍历


GetElement(nodelist);



其中GetElement方法实现如下:



  public void GetElement(NodeList nodelist){
  Node cnode;
  int i,len;
  String str;
  if(nodelist.getLength() == 0)
  // 该节点没有子节点

  return;
  }
  for(i=0;i 1)
  System.out.println(" "+str+" "+len);
  }
  }
  }


注意:上面的代码只是显示Node类型和Text类型的对象。它们的类型标识分别是1和3。


4.3 修改DOM文档


修改DOM文档的API在DOM level 2 Core规范中做了说明,jkd1.4中的org.xml.dom中实现了这些API。修改DOM文档操作主要集中在Document、Element、Node、Text等类中,这里给出的例子中是在解析出的DOM文档中增加一系列对象,对应与在XML文件中增加一条记录。


// 获得Root对象


Element root = document.getDocumentElement();

// 在DOM文档中增加一个Element节点


Element booktype = document.createElement("COMPUTES");

//将该节点转化成root对象的子节点


root.appendChild(cdrom);

//在DOM文档中增加一个Element节点


Element booktitle = document.createElement("Title");

//将该节点转化成booktype对象的子节点


booktype.appendChild(booktitle);

//在DOM文档中增加一个Text节点


Text bookname = document.createTextNode("understand Corba");

//将该节点转化成bookname对象的子节点


booktitle.appendChild(bookname);


4.4 将DOM文档转化成XML文件


// 获得将DOM文档转化为XML文件的转换器,在jdk1.4中,有类TransformerFactory

// 来实现,类Transformer实现转化API。


TransformerFactory tfactory = TransformerFactory.newInstance();

Transformer transformer = tfactory.newTransformer();

// 将DOM对象转化为DOMSource类对象,该对象表现为转化成别的表达形式的信息容器。


DOMSource source = new DOMSource(document);

/* 获得一个StreamResult类对象,该对象是DOM文档转化成的其他形式的文档的容器,

可以是XML文件,文本文件,HTML文件。这里为一个XML文件。*/

StreamResult result = new StreamResult(new File(“text.xml”));

// 调用API,将DOM文档转化成XML文件。


transformer.transform(source,result);
分享到:
评论

相关推荐

    java平台中使用DOM解析xml文件

    总的来说,理解并熟练掌握DOM解析XML是Java开发中的基础技能,无论是在简单的数据读取还是复杂的XML操作中,它都能提供强大的支持。同时,根据项目需求和性能考虑,可以选择JDOM等其他XML处理库作为替代方案。

    基于DOM4j和POI实现的XML文件转换为XLS(即标准EXCEL)的JAVA程序

    在该程序中,开发者首先会使用DOM4j解析XML文件,将XML数据结构转换为Java对象或数据结构。然后,利用Apache POI创建一个新的Excel工作簿,根据XML数据创建工作表、行和单元格,并填充相应的值。此外,可能还会涉及...

    java导入导出xml文件

    本文将深入探讨如何在Java中进行XML文件的导入与导出。 首先,理解XML的基本结构至关重要。XML文件由一系列的元素构成,每个元素都有可能包含子元素或者文本内容。元素通过开始标签 `<tag>` 和结束标签 `</tag>` ...

    java dom4j中生成xml文件

    DOM4J这个名字中的“DOM”代表文档对象模型(Document Object Model),这是一种标准的API,用于在Java中处理XML;而“4J”则暗示它是为Java平台设计的。这个库的出现是为了弥补Java标准库中DOM和SAX解析器的不足,...

    java_dom解析xml xml java

    标题“java_dom解析xml xml java”表明了本文档的主题是关于如何使用Java中的DOM技术来解析XML文件。 #### 描述分析 描述中提到这是一个适合新手入门的内容,并给出了一个简单的XML示例。该XML文档包含了一个`...

    JAVA实现DOM4J解析XML文件工具

    JAVA实现DOM4J解析XML文件工具

    java中Dom验证XMl文件合法非法

    在Java中,XML文件的合法性验证是通过DOM(Document Object Model)解析器来实现的。DOM解析器将XML文档加载到内存中,并构建一个树形结构,使得开发者可以通过API访问和操作XML文档的各个部分。当涉及到XML文件的...

    java 操作xml文件(包含xml文件和对应jar包)

    Java操作XML文件是Java开发中常见的一项任务,特别是在处理配置、数据交换或存储结构化信息时。XML(Extensible Markup Language)是一种标记语言,它的结构清晰、可读性强,易于机器解析和生成。本篇文章将深入探讨...

    Java解析XML文件的DOM和SAX方式.doc

    Java 解析 XML 文件的 DOM 和 SAX 方式是指在 Java 中使用 Document Object Model(DOM)和 Simple API for XML(SAX)两种方式来解析 XML 文件的技术。下面将详细介绍这两种方式的原理、实现和优缺点。 DOM 方式 ...

    用java读取xml文件的四种方法

    在Java编程中,XML(可扩展标记语言)是一种常见的数据交换格式,用于存储和传输结构化数据。要读取XML文件,Java提供了多种方法。以下是四种常用的方法,每种都有其适用场景和特点: 1. **DOM解析器(Document ...

    java中dom4j读写XML

    Java中的DOM4J库是一个非常流行的、开源的Java XML API,它提供了强大的XML处理功能,包括XML的读取、创建、修改以及写入。DOM4J是基于DOM模型的,但相比标准的Java DOM,它提供了更加简洁和高效的API,使得开发者在...

    JAVA对象序列化保存为XML文件的工具类

    在这些情况下,可能需要使用更强大的库,如JAXB(Java Architecture for XML Binding)或DOM(Document Object Model)API来实现更精细的控制。然而,对于简单的对象序列化需求,`XMLEncoder`和`XMLDecoder`是相当...

    Java DOM 生成XML

    在Java中,DOM API被包含在`javax.xml.parsers`和`org.w3c.dom`这两个包中。 DOM API的核心类包括`DocumentBuilderFactory`、`DocumentBuilder`和`Document`。首先,`DocumentBuilderFactory`用于创建`...

    dom4j解析xml文件(增删改查)

    在“dom4j解析xml文件(增删改查)”这个主题中,我们将深入探讨如何使用DOM4J来实现XML文档的四种基本操作:增加元素、删除元素、更新元素内容以及查询元素。 首先,让我们了解DOM4J的基本用法。在解析XML文件时,...

    DOM_XML.rar_DOM_dom xml_dom xml java_dom解析xml_java解析xml

    XML.rar"可能是一个包含DOM解析XML相关示例的压缩文件,"DOM_dom xml_dom xml java_dom解析xml_java解析xml"这部分描述了文件的主要内容,即关于DOM(Document Object Model)在XML解析中的应用,特别是用Java进行...

    (java)DOM解析XML文件并实现通讯录

    在Java编程语言中,DOM(Document Object Model)是一种解析XML文档的标准方法,它将XML文件转化为一个树形结构,使得开发者可以方便地访问和操作XML文档的每一个元素。本项目"DOM解析XML文件并实现通讯录"就是利用...

    读取XML文件的四种方法

    在Java中,读取XML文件有多种方法,本文将介绍四种常见的方法:DOM、DOM4J、JDOM和SAX。 DOM(Document Object Model) DOM是W3C组织制定的XML文档对象模型,它提供了对XML文档的树形结构表示。使用DOM方法读取XML...

    java实现Xml文件读写

    在Java编程语言中,XML(Extensible Markup Language)文件的读写是常见的数据处理任务,特别是在需要存储结构化数据或与不同系统交换数据时。XML文件因其灵活性和可扩展性而广泛应用于各种应用场景,如配置文件、...

Global site tag (gtag.js) - Google Analytics