为了使用XML文件中的信息,必须解析文件以创建一个Document对象。
Document对象是一个接口,因而不能直接将它实例化。一般情况下,应用程序会相应使用一个工厂。
解析文件是一个三步过程:
1.创建DocumentBuilderFactor. 创建DocumentBuilder
2.创建DocumentBuilder.DocumentBuilder执行实际的解析以创建Document对象。
3.解析文件以创建Document对象。
package Xml;
import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
public class OrderProcesser {
public static void main(String[] args) {
File docFile = new File("orders.xml");
try {
Document doc = null;
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
doc = db.parse(docFile);
System.out.println(doc);
} catch (Exception e) {
e.printStackTrace();
}
}
}
*****
使用DocumentBuilder创建解析器的优点之一在于能够控制DocumentBuilderFactory创建的解析器上的各种设置。可以设置解析器验证文档
*****
Java的DOM Level2实现允许通过以下方法控制解析器的参数:
setCoalescing():决定解析器是否要将CDATA节点转换为文本,以及是否要和周围的文本节点合并。默认值为false
setExpandEntityReferences():确定是否要展开外部实体引用。如果为true,外部数据将插入文档。默认值为true.
setIgnoringComments();是否忽略文件中的注释部分,默认为false
dbf.setValidating(true);是否启动验证功能。默认情况下为false
分享到:
相关推荐
- **DOCX**:是Word 2007及以后版本引入的XML打包格式,文档内容被分解为多个XML文件并封装在一个ZIP容器中,提高了文件的可读性和编辑性。 2. **Apache POI库**: - **Apache POI** 是一个开源项目,专门用于...
首先,需要解析 document.xml 文件,找到 `<w:bookmarkStart>` 标签,然后找到其兄弟节点 `<w:r>` 标签,最后找到 `<w:t>` 标签,并将其内容替换为所需的内容。 5. 使用 getNextSibling() 方法获取兄弟节点 在解析...
在ASP.NET开发中,"Word文档上传并解析内容"是一个常见的功能需求,它涉及到文件上传、Word文档处理以及用户界面的交互。以下是对这个主题的详细讲解。 首先,我们需要了解文件上传的基本流程。在ASP.NET中,我们...
在实际应用中,使用Tika API解析文档通常包括以下步骤: 1. 引入Tika库:在项目中添加Tika的依赖,例如在Maven项目中,可以在pom.xml文件中添加对应的依赖项。 2. 创建Tika实例:通过`Tika tika = new Tika();`创建...
XPDL2.0流程文件解析与生成工具包API文档是一个重要的资源,主要针对那些需要处理和操作XPDL格式流程信息的开发者。XPDL(eXtensible Process Definition Language)是一种XML标准,用于定义和交换业务流程模型。它...
DOM(Document Object Model)是Java处理XML文档的一种常见方式,它将XML文档转换为一棵树形结构,便于遍历和操作。 要解析WSDL文档,我们需要依赖Java的JAX-WS(Java API for XML Web Services)框架。JAX-WS提供...
本文将详细介绍如何使用Java和SuperMap iObjects Java库解析DWG文件并将其转换为JSON格式。SuperMap iObjects Java是一款强大的GIS(地理信息系统)开发工具,能够处理多种地理数据格式,包括DWG。下面我们将逐步...
为了跨平台和软件之间的兼容性,用户经常需要将DOC文件转换为其他格式,如PDF或ODF。 9. **文件修复** 由于DOC文件是二进制格式,如果文件受损,恢复数据可能会很复杂。不过,Word内置了一些错误检查和修复机制,...
这篇文档将详细讨论HEX文件的基本概念、LabVIEW中的HEX文件解析以及如何利用提供的`HEX文件Labview解析.vi`来实现这一功能。 1. **HEX文件格式**: - HEX文件是一种ASCII文本文件,它以十六进制格式记录二进制数据...
java解析PDF格式的文件demo。JAVA实现PDF解析,对PDF文件中的文本内容可输出仅供参考学习,不喜勿喷。
DOM模型将XML文档转换为一棵节点树,每个XML元素、属性、文本等都对应树上的一个节点。 以下是使用QT解析和写入XML的基本步骤: 1. **加载XML文档**: 使用`QDomDocument::parse()`函数或者`QFile`与`QTextStream...
HTTP XML文件解析是网络通信中常见的一种技术,它结合了HTTP协议和XML(可扩展标记语言)的数据格式,广泛应用于Web服务、API交互以及数据交换等领域。本文将深入探讨在线解析HTTP XML文件的相关知识点,包括HTTP...
MHT(Mime HTML)文件是一种将HTML文档与嵌入资源(如图像、样式表等)合并为一个文件的格式,方便在网络上传输。本文将详细介绍如何使用Java语言解析MHT文件并从中提取内容。 #### 二、MHT文件结构简介 MHT文件...
2. **内存消耗小**:与DOM解析器(将整个XML结构转化为内存中的树形结构)相比,SAX解析器对内存的需求较少。 3. **实时性**:因为是事件驱动,解析过程可以与数据处理同时进行,提高了程序的响应速度。 **SAX解析...
- 将解析到的数据转换为适应Android UI的格式,如TextView、EditText等。 - 可以使用`SpannableStringBuilder`和`CharacterStyle`来格式化文本,比如设置字体颜色、大小、粗体等。 5. **性能优化** - 考虑到...
本教程将详细讲解如何解析Word文档,并提供易于理解和复用的代码示例。 首先,我们要了解的是Word文档的格式。Word文档主要有两种格式:.doc和.docx。.docx是基于Open XML标准的,它实际上是多个XML文件的压缩包,...
在Android平台上,解析并显示Microsoft Office格式的文件(如doc, docx, xls, xlsx)是一项...通过查看和学习此类项目,开发者可以更好地理解如何在实际应用中实现这一功能,包括文件解析、转换和在Android上的展示。
- 调用`Save`方法将DOM树保存到文件,或使用`SaveXML`方法将整个文档保存为XML字符串。 7. **错误处理**: - 在处理XML文档时,可能遇到错误。`CXMLDOMDocument`提供了`GetLastError`方法获取错误信息,`...
DOM解析器将整个XML文档加载到内存中,创建一个树形结构的文档对象模型,允许开发者通过节点层级遍历和操作XML数据。DOM解析的特点包括: 1. 完整性:DOM解析器一次性加载整个XML文档,因此可以随时访问任何部分的...
XML文件解析工厂则是处理XML文档的核心工具,它简化了对XML数据的操作,使得开发者能够更加高效地读取、写入和处理XML内容。 在Java中,XML文件解析主要有DOM(Document Object Model)、SAX(Simple API for XML)...