`
zwm
  • 浏览: 280268 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类
最新评论

将文件解析为文档

阅读更多
为了使用XML文件中的信息,必须解析文件以创建一个Document对象。
Document对象是一个接口,因而不能直接将它实例化。一般情况下,应用程序会相应使用一个工厂。

解析文件是一个三步过程:
1.创建DocumentBuilderFactor. 创建DocumentBuilder
2.创建DocumentBuilder.DocumentBuilder执行实际的解析以创建Document对象。
3.解析文件以创建Document对象。


package Xml;

import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;

public class OrderProcesser {

public static void main(String[] args) {
File docFile = new File("orders.xml");

try {
Document doc = null;
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
doc = db.parse(docFile);
System.out.println(doc);
} catch (Exception e) {
e.printStackTrace();
}

}

}

*****
使用DocumentBuilder创建解析器的优点之一在于能够控制DocumentBuilderFactory创建的解析器上的各种设置。可以设置解析器验证文档
*****
Java的DOM Level2实现允许通过以下方法控制解析器的参数:
  setCoalescing():决定解析器是否要将CDATA节点转换为文本,以及是否要和周围的文本节点合并。默认值为false
  setExpandEntityReferences():确定是否要展开外部实体引用。如果为true,外部数据将插入文档。默认值为true.
  setIgnoringComments();是否忽略文件中的注释部分,默认为false
  dbf.setValidating(true);是否启动验证功能。默认情况下为false
分享到:
评论
1 楼 zwm 2006-11-04  
关于DOM


XML节点的不同类型?
将文件解析为文档?
单步调试文档?
编辑文档?
输出文档?
DOM总结?
主题内容
    作为结构的DOM
    作为API的DOM
    确定特性可用性
    基本的XML文件
DOM文档是以层次结构组织的节点或信息片断的集合。
DOM被认为是基于树或基于对象的。
XPath是在XSL转换(XSL  Transformation)以及其他XML技术中用来选择节点的手段。DOM的模块化意味着作为开发人员,您必须知道自己希望使用的特性是否受正在使用的DOM实现所支持。

DOM中定义的接口之一就是DOMImplementation.通过使用hasFeature()方法,可以确定某个特定的特性是否受支持。


import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.DOMImplementation;

public class DOM {
    public static void main(String[] args) {
        try {
            DocumentBuilderFactory bdf = DocumentBuilderFactory.newInstance();
            DocumentBuilder docb = bdf.newDocumentBuilder();
            DOMImplementation domImpl = docb.getDOMImplementation();
            if (domImpl.hasFeature("StyleSheets", "2.0")) {
                System.out.println("Style Sheets are supported.");
            } else {
                System.out.println("Style Sheets are not supported.");
            }
        } catch (Exception ex) {
            ex.printStackTrace();
        }

    }
}

相关推荐

    office word文档解析

    - **DOCX**:是Word 2007及以后版本引入的XML打包格式,文档内容被分解为多个XML文件并封装在一个ZIP容器中,提高了文件的可读性和编辑性。 2. **Apache POI库**: - **Apache POI** 是一个开源项目,专门用于...

    java实现xml解析word文档代码实现

    首先,需要解析 document.xml 文件,找到 `<w:bookmarkStart>` 标签,然后找到其兄弟节点 `<w:r>` 标签,最后找到 `<w:t>` 标签,并将其内容替换为所需的内容。 5. 使用 getNextSibling() 方法获取兄弟节点 在解析...

    Word文档上传并解析内容

    在ASP.NET开发中,"Word文档上传并解析内容"是一个常见的功能需求,它涉及到文件上传、Word文档处理以及用户界面的交互。以下是对这个主题的详细讲解。 首先,我们需要了解文件上传的基本流程。在ASP.NET中,我们...

    利用TikaAPI解析各种文档

    在实际应用中,使用Tika API解析文档通常包括以下步骤: 1. 引入Tika库:在项目中添加Tika的依赖,例如在Maven项目中,可以在pom.xml文件中添加对应的依赖项。 2. 创建Tika实例:通过`Tika tika = new Tika();`创建...

    XPDL2.0流程文件解析与生成工具包API文档

    XPDL2.0流程文件解析与生成工具包API文档是一个重要的资源,主要针对那些需要处理和操作XPDL格式流程信息的开发者。XPDL(eXtensible Process Definition Language)是一种XML标准,用于定义和交换业务流程模型。它...

    Java解析wsdl文档获取具体的方法与参数

    DOM(Document Object Model)是Java处理XML文档的一种常见方式,它将XML文档转换为一棵树形结构,便于遍历和操作。 要解析WSDL文档,我们需要依赖Java的JAX-WS(Java API for XML Web Services)框架。JAX-WS提供...

    java解析DWG文件为json使用superMap

    本文将详细介绍如何使用Java和SuperMap iObjects Java库解析DWG文件并将其转换为JSON格式。SuperMap iObjects Java是一款强大的GIS(地理信息系统)开发工具,能够处理多种地理数据格式,包括DWG。下面我们将逐步...

    office doc二进制文件格式解析

    为了跨平台和软件之间的兼容性,用户经常需要将DOC文件转换为其他格式,如PDF或ODF。 9. **文件修复** 由于DOC文件是二进制格式,如果文件受损,恢复数据可能会很复杂。不过,Word内置了一些错误检查和修复机制,...

    HEX文件Labview解析_hex_hex解析_hex解析_hex文件和labview_bodyvmj_

    这篇文档将详细讨论HEX文件的基本概念、LabVIEW中的HEX文件解析以及如何利用提供的`HEX文件Labview解析.vi`来实现这一功能。 1. **HEX文件格式**: - HEX文件是一种ASCII文本文件,它以十六进制格式记录二进制数据...

    java解析PDF文件

    java解析PDF格式的文件demo。JAVA实现PDF解析,对PDF文件中的文本内容可输出仅供参考学习,不喜勿喷。

    QT解析xml文档 读取写入

    DOM模型将XML文档转换为一棵节点树,每个XML元素、属性、文本等都对应树上的一个节点。 以下是使用QT解析和写入XML的基本步骤: 1. **加载XML文档**: 使用`QDomDocument::parse()`函数或者`QFile`与`QTextStream...

    在线解析HTTP XML文件

    HTTP XML文件解析是网络通信中常见的一种技术,它结合了HTTP协议和XML(可扩展标记语言)的数据格式,广泛应用于Web服务、API交互以及数据交换等领域。本文将深入探讨在线解析HTTP XML文件的相关知识点,包括HTTP...

    java对mht文件解析

    MHT(Mime HTML)文件是一种将HTML文档与嵌入资源(如图像、样式表等)合并为一个文件的格式,方便在网络上传输。本文将详细介绍如何使用Java语言解析MHT文件并从中提取内容。 #### 二、MHT文件结构简介 MHT文件...

    Sax解析XML文件解析

    2. **内存消耗小**:与DOM解析器(将整个XML结构转化为内存中的树形结构)相比,SAX解析器对内存的需求较少。 3. **实时性**:因为是事件驱动,解析过程可以与数据处理同时进行,提高了程序的响应速度。 **SAX解析...

    Android 解析word文档,过程详细,易懂,代码可直接复用-IT计算机-毕业设计.zip

    - 将解析到的数据转换为适应Android UI的格式,如TextView、EditText等。 - 可以使用`SpannableStringBuilder`和`CharacterStyle`来格式化文本,比如设置字体颜色、大小、粗体等。 5. **性能优化** - 考虑到...

    解析word文档,过程详细,易懂,代码可直接复用

    本教程将详细讲解如何解析Word文档,并提供易于理解和复用的代码示例。 首先,我们要了解的是Word文档的格式。Word文档主要有两种格式:.doc和.docx。.docx是基于Open XML标准的,它实际上是多个XML文件的压缩包,...

    Android解析并显示doc,docx,xls,xlsx文件

    在Android平台上,解析并显示Microsoft Office格式的文件(如doc, docx, xls, xlsx)是一项...通过查看和学习此类项目,开发者可以更好地理解如何在实际应用中实现这一功能,包括文件解析、转换和在Android上的展示。

    MFC解析XML文档类

    - 调用`Save`方法将DOM树保存到文件,或使用`SaveXML`方法将整个文档保存为XML字符串。 7. **错误处理**: - 在处理XML文档时,可能遇到错误。`CXMLDOMDocument`提供了`GetLastError`方法获取错误信息,`...

    DOM和SAX解析XML文档

    DOM解析器将整个XML文档加载到内存中,创建一个树形结构的文档对象模型,允许开发者通过节点层级遍历和操作XML数据。DOM解析的特点包括: 1. 完整性:DOM解析器一次性加载整个XML文档,因此可以随时访问任何部分的...

    xml文件解析工厂

    XML文件解析工厂则是处理XML文档的核心工具,它简化了对XML数据的操作,使得开发者能够更加高效地读取、写入和处理XML内容。 在Java中,XML文件解析主要有DOM(Document Object Model)、SAX(Simple API for XML)...

Global site tag (gtag.js) - Google Analytics