`

Java解析XML数据(一)——DOM解析

阅读更多

在使用Java解析XML文档之前,我们先来了解了解什么是XML。

 

XML即可扩展的标记语言,可以定义语义标记(标签),是元标记语言。XML不像超文本标记语言HTML,HTML只能使用规定的标记,对于XML,用户可以定义自己需要的标记。XML(eXtensible Markup Language)和HTML(Hyper Text Markup Language)师出同门,都是从SGML(Standard Generalized Markup Language)延伸而出的标记语言。

 

一、解析数据之前,先创建一个XML文档

 

<?xml version="1.0" encoding="UTF-8"?>
<books>
	<book isbn="223">
		<title>三体</title>
		<author>刘慈欣</author>
		<price>59</price>
	</book>
	<book isbn="456">
		<title>失控</title>
		<author>KK</author>
		<price>99</price>
	</book>
	<book isbn="789">
		<title>冰与火</title>
		<author>乔治马丁</author>
		<price>129</price>
	</book>
</books>
 可以看到,XML的编写与HTML相比,用户可以自定义标签,当然,标签的自定义也需要符合面向对象编程中的逻辑思想。

 

 

二、DOM解析原理

DOM,Document Object Model,文档对象模型。DOM是html和xml文档的编程接口规范,和平台、语言是无关的。利用dom规范,能够实现dom 文档和xml之间的相互转换,遍历、操作相应dom文档的内容。

 

DOM规范的核心就是树模型

 

此外,JDOM是Java和DOM的结合体。JDOM 致力于建立一个完整的基于 Java 平台的、通过 Java 代码来访问、操作并输出 XML 数据。JDOM是用Java语言读、写、操作XML的新API函数。

 

DOM解析的原理如下图所示。



 

三、利用Eclipse创建一个Java项目,创建一个与XML文档相对应的类Book.java,如下:

 

public class Book {

	// 书版本号
	private String isbn;
	
	// 书标题
	private String title;
	
	// 书作者
	private String author;
	
	// 书价格
	private int price;

	public Book() {
		
	}
	
	/**
	 * 构造方法
	 * 
	 * @param isbn
	 *            版本号
	 * @param title
	 *            标题
	 * @param author
	 *            作者
	 * @param price
	 *            价格
	 */
	public Book(String isbn, String title, String author, int price) {
		super();
		this.isbn = isbn;
		this.title = title;
		this.author = author;
		this.price = price;
	}

	/**
	 * 获得书版本号
	 * 
	 * @return 版本号
	 */
	public String getIsbn() {
		return isbn;
	}

	/**
	 * 设置书版本号
	 * 
	 * @param isbn
	 *            版本号
	 */
	public void setIsbn(String isbn) {
		this.isbn = isbn;
	}

	/**
	 * 获得书标题名字
	 * 
	 * @return 标题
	 */
	public String getTitle() {
		return title;
	}

	/**
	 * 设置书标题名字
	 * 
	 * @param title
	 *            标题名字
	 */
	public void setTitle(String title) {
		this.title = title;
	}

	/**
	 * 获得书的作者名字
	 * 
	 * @return 作者名字
	 */
	public String getAuthor() {
		return author;
	}

	/**
	 * 设置书的作者名字
	 * 
	 * @param author
	 *            作者名字
	 */
	public void setAuthor(String author) {
		this.author = author;
	}

	/**
	 * 获得书的价格
	 * 
	 * @return 价格
	 */
	public int getPrice() {
		return price;
	}

	/**
	 * 设置书的价格
	 * 
	 * @param price
	 *            价格
	 */
	public void setPrice(int price) {
		this.price = price;
	}

	/**
	 * 重写Object继承下来的toString方法,用于将书的字段变成字符串对象
	 */
	@Override
	public String toString() {
		return "Book [isbn=" + isbn + ", title=" + title + ", author=" + author
				+ ", price=" + price + "]";
	}

}
 

 

四、将第一步中的book.xml放置在该项目的目录下,便于java中使用相对路径找到该文件

 

五、创建一个包含main(主方法)的主类,用于解析book.xml文档,为其创建一个readXML的静态方法,因为要在main方法中进行调用,具体代码如下:

 

public class RWTest {

	public static void main(String[] args) {
		readXML();
	}
        private static void readXML() {
		// 1.获得解析器工厂
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		try {
			// 2.通过工厂获得解析器
			DocumentBuilder builder = factory.newDocumentBuilder();
			// 3.指定要解析的xml文件
			File file = new File("book.xml");
			// 4.解析数据:file ----> doc(树形结构)
			Document doc = builder.parse(file);
			// 创建一个列表用来保存book信息
			List<Book> list = new ArrayList<>();
			/*
			 * 节点 Node 1 元素节点 Element 2 属性节点 Attr 3 文本节点 Text
			 */
			// 通过标签取该xml文件中所有的Book标签,返回一个链表
			NodeList nodeList = doc.getElementsByTagName("book");
			// 解析每一个book元素,并将解析的数据存放到Book对象中
			for (int i  = 0; i < nodeList.getLength(); i++) {
				// 从nodeList中获得结点元素
				Element eBook = (Element) nodeList.item(i);
				Attr aIsbn = eBook.getAttributeNode("isbn");
				String isbn = aIsbn.getValue();
				Element eTitle = (Element) eBook.getElementsByTagName("title").item(0);
				String title = eTitle.getTextContent();
				String author = eBook.getElementsByTagName("author").item(0).getFirstChild().getNodeValue();
				String strPrice = eBook.getElementsByTagName("price").item(0).getTextContent();
				int price = Integer.parseInt(strPrice);
				// 将解析的数据存储到Book对象
				Book book = new Book(isbn, title, author, price);
				// 将book对象存放到list列表中
				list.add(book);
				// System.out.println(eTitle.getTextContent());
			}
			// 输出list
			for (Book b : list) {
				System.out.println(b);
			}
		} catch (ParserConfigurationException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (SAXException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
}
 
六、运行效果截图:

 
七、利用Java语言创建XML文档
在第五步创建的RWTest.java类(主类)中,再添加一个静态方法writeXML,然后再main方法中之直接调用,查看其效果。
private static void writeXML() {
		// 保存书的list列表
		ArrayList<Book> list = new ArrayList<>();
		// 添加两本书
		list.add(new Book("111", "Java语言学习", "Oracle", 39));
		list.add(new Book("222", "Android编程学习", "Google", 49));
		// Object ------> XML
		// 1.生成doc树形结构
		// (1)创建文档解析器
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		try {
			// (2)通过工厂获得解析器对象
			DocumentBuilder builder = factory.newDocumentBuilder();
			Document doc = builder.newDocument();
			Element root = doc.createElement("books");
			// (3)遍历对象列表,生成book子树
			for (int i = 0; i < list.size(); i++) {
				Element book = doc.createElement("book");
				// 设置book的属性和子结点
				/*// 设置book的isbn属性————————方法一
				book.setAttribute("isbn", list.get(i).getIsbn());*/
				// 设置book的isbn属性————————方法二
				Attr attrIsbn = doc.createAttribute("isbn");
				attrIsbn.setValue(list.get(i).getIsbn());
				book.setAttributeNode(attrIsbn);
				// 设置book的子元素结点:title——————方法一
				// 创建title元素结点
				Element title = doc.createElement("title");
				title.setTextContent(list.get(i).getTitle());
				// 设置book的子元素结点:author——————方法二
				// 创建author元素结点
				Element author = doc.createElement("author");
				// 创建一个文本结点
				Text text = doc.createTextNode(list.get(i).getAuthor());
				author.appendChild(text);
				// 设置book的子元素结点:price——————采用方法一添加
				// 创建price元素结点
				Element price = doc.createElement("price");
				price.setTextContent(String.valueOf(list.get(i).getPrice()));
				// 将子结点元素添加到book结点中
				book.appendChild(title);
				book.appendChild(author);
				book.appendChild(price);
				// book对象已经 成功转成了book子树
				root.appendChild(book);
			}
			doc.appendChild(root);
			// 2.将树形结构写入磁盘文件,并保存为xml文件
			// (1)创建一个转换器对象
			Transformer transformer = TransformerFactory.newInstance().newTransformer();
			// (2)创建源对象(树形结构)
			Source source = new DOMSource(doc);
			// (3)创建目标对象(xml文件)
			Result result = new StreamResult(new File("book2.xml"));
			// (4)开始转换
			transformer.transform(source, result);
			// (5)转换成功
			System.out.println("转换成功");
		} catch (ParserConfigurationException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (TransformerConfigurationException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (TransformerFactoryConfigurationError e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (TransformerException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
 
注意:创建XML的时候需要指定XML文档所在的磁盘文件位置,所以在代码中最好先直接以名字指明,这样只要刷新项目就可以看到新建好的XML文档(我这里显示的是book2.xml),如下图所示。
 直接打开book2.xml可以看到根据代码生成好的内容,如下图所示。

 

 

后面还会继续将利用Sax解析和第三方包的方法来解析XML文档。

 

谢谢您的关注和阅读,文章不当之处还请您不吝赐教~~~微笑微笑微笑

 

 

 

 

  • 大小: 29.8 KB
  • 大小: 13.4 KB
  • 大小: 3.4 KB
  • 大小: 18.1 KB
分享到:
评论

相关推荐

    java解析xml——dom

    ### Java解析XML——DOM详解 #### 一、DOM解析概念 **Document Object Model (DOM)**是一种平台和语言中立的接口,它允许程序和脚本动态地访问和更新文档的内容、结构和样式。DOM最初是为HTML设计的,但后来也被...

    使用java解析XML文件,解析完之后将解析结果导入mysql数据库中

    本教程将介绍如何使用Java解析XML文件,并将解析结果导入MySQL数据库。 首先,我们需要引入处理XML的Java库——JAXB(Java Architecture for XML Binding)和DOM(Document Object Model)API。JAXB用于对象与XML...

    XML解析器————

    例如,对于DOM解析,可以创建`DOMParser`实例,然后使用`parse()`方法解析XML文档;对于SAX解析,可以实现`ContentHandler`接口,并注册到`SAXParser`中。同时,可以通过`XMLSchemaValidator`进行XML Schema验证。 ...

    xml数据前后台解析:jdom与dom4j源码,程序可以跑

    本文将深入探讨XML数据在前后台解析的过程中,重点介绍两种主流的Java XML解析库——JDOM和DOM4J,并提供实际运行的程序示例。同时,我们还会讨论如何使用jQuery在前端解析XML并展示数据。 首先,让我们了解XML的...

    手把手教你通过java解析xml(csdn)————程序.pdf

    本教程将带你逐步了解如何使用Java解析XML文件。 首先,我们需要明白XML的基本结构。XML文档由元素(Element)、属性(Attribute)、文本内容(Text Content)和注释(Comment)组成。在给定的XML示例中,`...

    Android创建与解析XML(二)——详解Dom方式

    Dom方式创建与解析XML文档是一种使用编程语言,如Java,在Android平台实现的方式。这种方式利用了DOM(文档对象模型)的API,其中JAXP(Java API for XML Processing)提供的DocumentBuilder类是用来创建和解析XML...

    Java与XML读写之DOM篇

    Java与XML的交互是开发中常见的一种数据处理方式,特别是在需要处理结构化数据时。DOM(Document Object Model)是一种在Java中处理XML的标准方法,它将XML文档转换为一棵对象树,使得我们可以方便地访问和修改XML...

    java解析XML所需要的完整包(包括XStream.jar,dom4j.jar和xpull/xpp.jar)

    例如,你可以使用`Document document = DocumentHelper.parseText(xmlString)`来解析XML文本,然后通过`Element root = document.getRootElement()`获取根元素。 3. **xpp3-1.1.4c.jar**: 这个库是XPull解析器的...

    Java解析xml的包--xerces.jar 用于开发xml相关的内空的包..zip

    Java解析XML的包——Xerces.jar是Java开发中用于处理XML文档的重要工具。XML(eXtensible Markup Language)是一种结构化数据表示语言,广泛应用于数据交换、配置存储和文档处理等领域。Xerces.jar包含了Apache ...

    Java解析XML的方法

    通过对Java解析XML的四种方法——DOM、SAX、StAX和JDOM的介绍,我们可以看到每种方法都有其适用的场景。在实际应用中,根据具体的项目需求和资源限制,选择合适的解析方式是非常重要的。希望本文能够帮助开发者更好...

    java工具类——dom4j

    dom4j是sourceforge.net上的一个开源项目,主要用于对XML的解析。

    Java中四种XML解析技术分析对比

    DOM解析器将整个XML文档加载到内存中,形成一个树形结构,即DOM树。这种解析方式允许开发者通过节点遍历、查找和修改XML文档。DOM的优点在于方便访问和操作任何部分的XML,但缺点是占用大量内存,对于大型XML文档不...

    解析xml的jar包

    解析XML是将XML文档转换为程序可以理解的数据结构的关键步骤。本文将深入探讨XML解析的基本概念、常用方法以及相关的Java库——JDOM。 XML文档由一系列元素构成,每个元素都包含标签、属性和内容。解析XML的过程...

    java 解析xml

    本篇文章将深入探讨Java解析XML的几种主要方法,以及相关的知识点。 首先,Java提供了两种主要的API来解析XML:DOM(Document Object Model)和SAX(Simple API for XML)。DOM解析器将整个XML文档加载到内存中,...

    dom4j---xml解析jar包

    在Java环境中,解析XML文档时,我们通常会遇到各种库,其中DOM4J是一个非常流行的、功能强大的开放源代码库。这个库不仅简化了XML处理,还提供了XPath和XSLT的支持,使其成为Java开发者处理XML的首选工具之一。 **...

    dom4j实战(一)——使用dom4j从XML中读取数据源配置

    这篇名为"dom4j实战(一)——使用dom4j从XML中读取数据源配置"的博客文章将深入探讨如何利用DOM4J从XML文件中读取数据源配置。 首先,我们需要理解DOM4J的基本概念。DOM4J是基于DOM模型的,DOM(Document Object ...

    用dom4j解析xml文件

    本篇文章将深入探讨如何使用DOM4J来解析XML文件,以及通过示例代码来展示其基本操作。 首先,我们需要理解DOM4J的工作原理。DOM4J采用的是DOM(Document Object Model)模型,它将整个XML文档加载到内存中形成一棵...

    Java Web 开发实战经典(基础篇)

    010302_XML解析 —— DOM 010303_XML解析 —— SAX 010304_XML解析 —— JDOM 010305_XML解析 —— DOM4J 010306_使用JavaScript操作DOM 010401_Tomcat服务器的安装及配置 020501_注释及Scriptlet 020502_page指令 ...

    Android 创建与解析XML Dom方式

    Android SDK还提供了另一种解析XML的方式——`XmlPullParser`,它结合了DOM和SAX的优点,既允许向前查找,又不会一次性加载整个文档,适合Android资源文件的解析。 总之,理解DOM方式在Android中的应用是开发者必备...

Global site tag (gtag.js) - Google Analytics