在XML文件中由于更多的是描述信息的内容,所以在得到一个XML文档后应该利用程序按照其中元素的定义名称取出对应的内容,这样的操作就称为XML解析。
在XML解析中,W3C定义了SAX和DOM两种解析方式。
DOM树解析所提供的随机访问方式给应用程序开发带来很大的灵活性,它可以任意地控制整个XML文档的内容,然而由于DOM分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档较大或者结果较复杂时,对内存的需求较高。综上,DOM分析器对机器性能的要求比较高,程序的效率并不是十分理想。但是DOM所采用的树结构的思想与XML文档的结果相吻合,同时随机访问带来的方便,所以DOM分析器还是有很广泛的使用价值。
下面是实例简单的描述如何DOM解析XML.
要解析的文件demo01.xml
<?xml version="1.0" encoding="GBK"?>
<addressList>
<linkman>
<name>ss</name>
<email>ss@163.com</email>
</linkman>
<linkman>
<name>dd</name>
<email>dd@163.com</email>
</linkman>
</addressList>
/**
* DOM解析XML文件
*/
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DOMDemo1 {
public static void main(String[] args) {
//①建立DocumentBuilderFactory,用于取得DocumentBuilder
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//②通过DocumentBuilderFactory取得DocumentBuilder
DocumentBuilder builder = null;
try {
builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
//③定义Document对象,通过DocumentBuilder来进行DOM树的转换操作,builder.parse()相当于将所有的XML文档内容读取到内存中
Document doc = null;
try {
doc = builder.parse("D:"+File.separator+"testXML\\demo01.xml");
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
//④由Document对象查找指定的节点
NodeList nl = doc.getElementsByTagName("linkman");
//⑤输出节点的文本内容
for (int i = 0; i < nl.getLength(); i++) {
Element e = (Element)nl.item(i);
System.out.println("姓名: "+e.getElementsByTagName("name").item(0).getFirstChild().getNodeValue());
System.out.println("邮箱: "+e.getElementsByTagName("email").item(0).getFirstChild().getNodeValue());
}
}
}
姓名: ss
邮箱: ss@163.com
姓名: dd
邮箱: dd@163.com
但是有点不明白的是,当我的xml文档内的文本有中文的时候,我把encoding="UTF-8",为什么会报这个错,求大神指教
java.io.UTFDataFormatException: 1 字节 UTF-8 序列的无效字节 1。
at org.apache.xerces.impl.io.UTF8Reader.invalidByte(Unknown Source)
at org.apache.xerces.impl.io.UTF8Reader.read(Unknown Source)
at org.apache.xerces.impl.XMLEntityScanner.load(Unknown Source)
at org.apache.xerces.impl.XMLEntityScanner.skipChar(Unknown Source)
at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl$FragmentContentDispatcher.dispatch(Unknown Source)
at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source)
at org.apache.xerces.parsers.DTDConfiguration.parse(Unknown Source)
at org.apache.xerces.parsers.XMLParser.parse(Unknown Source)
at org.apache.xerces.parsers.DOMParser.parse(Unknown Source)
at org.apache.xerces.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
at dwc.DOMDemo1.main(DOMDemo1.java:35)
Exception in thread "main" java.lang.NullPointerException
at dwc.DOMDemo1.main(DOMDemo1.java:45)
找到一种上面的解决方法 就是把xml文件另存为,转换器或编码为UTF-8,这样再读就没错了。
但是我在网上看到另一种不另存转换的方法,就是
将doc改为
doc = builder.parse(new InputSource(new InputStreamReader(new FileInputStream("D:"+File.separator+"testXML\\demo01.xml"),"UTF-8")));
可是我这样会报错
sun.io.MalformedInputException
at sun.io.ByteToCharUTF8.convert(ByteToCharUTF8.java:194)
at sun.nio.cs.StreamDecoder$ConverterSD.convertInto(StreamDecoder.java:286)
at sun.nio.cs.StreamDecoder$ConverterSD.implRead(StreamDecoder.java:317)
at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:222)
at java.io.InputStreamReader.read(InputStreamReader.java:207)
at org.apache.xerces.impl.XMLEntityScanner.load(Unknown Source)
at org.apache.xerces.impl.XMLEntityScanner.scanName(Unknown Source)
at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanStartElement(Unknown Source)
at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl$FragmentContentDispatcher.dispatch(Unknown Source)
at org.apache.xerces.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source)
at org.apache.xerces.parsers.DTDConfiguration.parse(Unknown Source)
at org.apache.xerces.parsers.XMLParser.parse(Unknown Source)
at org.apache.xerces.parsers.DOMParser.parse(Unknown Source)
at org.apache.xerces.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at dwc.DOMDemo1.main(DOMDemo1.java:39)
Exception in thread "main" java.lang.NullPointerException
at dwc.DOMDemo1.main(DOMDemo1.java:49)
分享到:
相关推荐
Java DOM 解析 XML 实例是 Java 语言中常用的 XML 解析方法之一,使用 W3C 推荐的文档对象模型(Document Object Model,DOM)来解析 XML 文档。DOM 提供了一个树形结构的对象模型,通过遍历树形结构可以访问和操作 ...
在这个例子中,我们将深入探讨如何使用DOM解析XML文件,以理解和掌握XML文档的结构,并进行数据提取、修改和创建。 首先,XML(Extensible Markup Language)是一种标记语言,用于存储和传输数据,具有自描述性和...
本篇文章将深入探讨DOM解析XML文件在Android中的应用实例。 首先,DOM解析的基本思想是将整个XML文件加载到内存中,形成一个树形结构,即DOM树。这样做的优点是解析后的数据可以方便地进行任意位置的查找和修改,但...
总结来说,Android中使用DOM解析XML是一种常见且直观的方式,适合处理小规模的数据。结合ButterKnife库,可以方便地将解析结果与UI组件进行绑定,提高代码的可读性和维护性。但请注意,对于大文件,考虑使用SAX或者...
本教程“DOM解析XML应用实例(入门经典案例)”旨在帮助初学者快速掌握DOM解析XML的基本方法和实践技巧。 XML(Extensible Markup Language)是一种标记语言,常用于存储和传输数据,特别是在Web应用程序中。它具有...
标题“java_dom解析xml xml java”表明了本文档的主题是关于如何使用Java中的DOM技术来解析XML文件。 #### 描述分析 描述中提到这是一个适合新手入门的内容,并给出了一个简单的XML示例。该XML文档包含了一个`...
使用DOM解析XML的基本步骤如下: 1. **导入必要的库**:在Java中,DOM解析功能主要由`javax.xml.parsers`和`org.w3c.dom`包提供。因此,首先需要在代码中导入这些库: ```java import javax.xml.parsers....
使用DOM解析XML文件的步骤如下: 1. 加载XML文件:首先,你需要创建一个`DocumentBuilderFactory`对象,然后通过`newDocumentBuilder()`方法得到一个`DocumentBuilder`实例。接着,调用`parse()`方法,传入XML文件...
标题中的"DOM_XML.rar"可能是一个包含DOM解析XML相关示例的压缩文件,"DOM_dom xml_dom xml java_dom解析xml_java解析xml"这部分描述了文件的主要内容,即关于DOM(Document Object Model)在XML解析中的应用,特别...
本篇文章将深入探讨Android中的DOM解析XML文件,包括其基本原理、实现步骤和一些实用技巧。 ### 1. DOM解析的基本概念 DOM解析是一种将XML文件转换为内存中对象模型的方法。它将XML文档视为一棵树,其中每个元素、...
下面我们将深入探讨DOM解析XML以及如何创建XML。 DOM解析XML的过程分为以下几个步骤: 1. **加载XML文档**:首先,我们需要通过DOM解析器加载XML文档。在JavaScript中,可以使用`DOMParser`对象的`parseFromString...
在 Java 中,DOM 解析允许开发者将整个 XML 文件加载到内存中,形成一个树形结构,然后通过这个结构来访问和操作 XML 的各个部分。 首先,我们需要引入 Java 的核心解析库,即 javax.xml.parsers 命名空间。这个库...
【DOM解析XML】 在Java中,解析XML文档有多种方式,其中DOM(Document Object Model)和SAX(Simple API for XML)是最常见的两种。DOM是一种基于树形结构的XML处理方式,它将整个XML文档加载到内存中,形成一个完整...
DOM解析XML是处理XML数据的一种常见方式,尤其在Java编程中广泛使用。下面我们将深入探讨DOM解析XML的相关知识点。 1. DOM解析原理: DOM解析器读取整个XML文件,将其转换为内存中的对象树,每个XML元素、属性、...
在本文中,我们将深入探讨DOM解析XML文档的相关知识点,包括DOM的基本概念、解析过程、节点操作以及实际应用。 一、DOM基本概念 DOM是一种与平台和语言无关的接口,它允许程序和脚本动态地访问和更新文档的内容、...
在本示例中,我们将深入探讨DOM解析XML的基本原理和实践方法,通过一个简单的示例帮助你理解其核心概念。 XML(eXtensible Markup Language)是一种标记语言,常用于数据交换和存储,具有自描述性和严格的语法规则...
下面将详细介绍在Android中使用DOM解析XML的基本步骤和关键知识点。 1. **导入XML解析库** 在Android项目中,我们不需要额外导入库,因为DOM解析器是Java标准库的一部分,已经包含在Android SDK中。这意味着你可以...
"dom解析xml BS结构"这一主题,意味着我们将探讨如何在基于浏览器的客户端应用(Browser-Server,BS结构)中利用DOM解析XML数据。BS架构中,通常由前端浏览器接收服务器传递的XML数据,并通过JavaScript进行解析和...
在压缩包文件"复件 dom"中,可能包含了示例代码或教程,用于演示如何使用DOM4J和本地DOM解析XML文件。通过查看这些文件,你可以更深入地了解两种方法的具体实现,并在实际项目中选择合适的方式处理XML数据。 总结来...