转自:
here
本文分别介绍了 JDOM 和 XPATH,以及结合两者进行 XML 编程带来的好处。
前言
XML 是一种优秀的数据打包和数据交换的形式,在当今XML大行于天下,如果没有听说过它的大名,那可真是孤陋寡闻了。用XML描述数据的优势显而易见,它具有结构简单,便于人和机器阅读的双重功效,并弥补了关系型数据对客观世界中真实数据描述能力的不足。W3C组织根据技术领域的需要,制定出了XML的格式规范,并相应的建立了描述模型,简称DOM。各种流行的程序设计语言都纷纷根据这一模型推出了自己的XML解析器,在JAVA世界里,APACHE组织开发的XERCES应该是流行最广功能最为强大的XML解析器之一。但是由于W3C在设计DOM模型时,并不是针对某一种语言而设计,因此为了通用性,加入了许多繁琐而不必要的细节,使JAVA程序员在开发XML的应用程序过程中感到不甚方便,因此JDOM作为一种新型的XML解析器横空出世,它不遵循DOM模型,建立了自己独立的一套JDOM模型(注意JDOM决不是DOM扩展,虽然名字差不多,但两者是平行的关系),并提供功能强大使用方便的类库,使JAVA程序员可以更为高效的开发自己的XML应用程序,并极大的减少了代码量,因此它很快得到了业内的认可,如JBUILDER这样的航空母舰级的重磅产品都以JDOM为XML解析引擎,足见其名不虚传。
有了XML数据的描述标准,人们自然就会想到应该有一种查询语言可以在XML中查找任意节点的数据,就像SQL语句可以在关系性数据库中执行查询操作一样,于是XQUERY和XPATH顺应潮流,应运而生。由于XQUERY较为复杂,使用不甚方便,XPATH渐渐成为主流,我们只需对XPATH进行学习,便可以应付所有的查询要求。在JDOM发布的最新的V1.0bata10版中,已经加入了对 XPATH的支持,这无疑是令开发者十分激动的。
学会JDOM和XPATH,你便不再是XML的入门者,在未来的开发生涯中,就像特种兵的多用匕首,为你披荆斩棘,助你勇往直前。闲言少叙,学习还要脚踏实地,从头开始。
XPATH速成篇
XPATH 遵循文档对象模型(DOM)的路径格式,由于每个XML文档都可以看成是一棵拥有许多结点的树,每个结点可以是以下七个类型之一:根(root)、元素(element)、属性(attribute)、正文(text)、命名空间(namespace)、处理指令(processing instruction)和注释(comment)。XPATH的基本语法由表达式构成。在计算表达式的值之后产生一个对象,这种对象有以下四种基本类型:节点集合、布尔型、数字型和字符串型。XPATH基本上和在文件系统中寻找文件类似,如果路径是以"/"开头的,就表明该路径表示的是一个绝对路径,这和在UNIX系统中关于文件路径的定义是一致的。以"//"开头则表示在文档中的任意位置查找。
不谈泛泛的理论,学习XPATH还要从实例学起最为快捷,并有助于你举一反三。
下面的样例XML文档,描述了某台电脑中硬盘的基本信息(根节点<HD>代表硬盘,<disk>标签代表硬盘分区,从它的name 属性可以看出有两个盘符名称为"C"和"D"的分区;每个分区下都包含<capacity>,<directories><files>三个节点,分别代表了分区的空间大小、目录数量、所含文件个数):
<?xml version="1.0" encoding="UTF-8"?>
<HD>
<disk name="C">
<capacity>8G</capacity>
<directories>200</directories>
<files>1580</files>
</disk>
<disk name="D">
<capacity>10G</capacity>
<directories>500</directories>
<files>3000</files>
</disk>
</HD>
你在XML文档中使用位置路径表达式来查找信息,这些表达式有很多种组成方式。
结点元素的查找是你将要碰到的最频繁的查找方式。在上面这个XML文档例子中,根HD包含disk结点。你可以使用路径来查找这些结点,用正斜杠(/)来分隔子结点,返回所有与模式相匹配的元素。下面的XPATH 语句返回所有的disk元素:
/HD/disk
"*"代表"全部"的意思。/HD/* 代表HD下的全部节点。
下面的XPATH将返回任意节点下的名称为disk的全部节点:
//disk
下面的XPATH将返回名称为disk,name属性为'C'的全部节点:
/HD/disk[@name='C']
节点的附加元素,比如属性,函数等都要用方括号扩起来,属性前面要加上@号
下面的XPATH将返回文件个数为1580的files节点:
/HD/disk/files[text()='1580']
大家注意到上面包含一个text(),这就是XPATH的一个函数,它的功能是取出当前节点的文本。
下面的XPATH将返回文件个数为1580的分区:
/HD/disk/files[text()='1580']/parent::*
最后的parent::*表示这个元素的所有的父节点的集合。
XPATH中一些有用的函数:
string concat (string, string, string*) 联接两个字符串
boolean starts-with (string, string) 判断某字符串是否以另一字符串开头
boolean contains (string, string) 判断某字符串是否包含另一字符串
string substring (string, number, number) 取子字符串
number string-length (string) 测字符串长度
number sum (node-set) 求和
number floor (number) 求小于此数的最大整数值
number ceiling (number) 求大于此数最小整数值
用JDOM解析XML
JDOM 模型的全部类都在org.jdom.*这个包里,org.jdom.input.*这个包里包含了JDOM的解析器,其中的DOMBuilder的功能是将DOM模型的Document解析成JDOM模型的Document;SAXBuilder的功能是从文件或流中解析出符合JDOM模型的XML树。由于我们的上面提到的XML样例存储在一个名称为sample.xml的文件中,很显然我们应该采用后者作为解析工具。下面程序演示了jdom的基本功能,即解析一个xml文档,并挑选一些内容输出到屏幕上。
import java.util.*;
import org.jdom.*;
import org.jdom.input.SAXBuilder;
public class Sample1 {
public static void main(String[] args) throws Exception{
SAXBuilder sb=new SAXBuilder();
Document doc=sb.build("sample.xml");
Element root=doc.getRootElement();
List list=root.getChildren("disk");
for(int i=0;i<list.size();i++){
Element element=(Element)list.get(i);
String name=element.getAttributeValue("name");
String capacity=element.getChildText("capacity");
String directories=element.getChildText("directories");
String files=element.getChildText("files");
System.out.println("磁盘信息:");
System.out.println("分区盘符:"+name);
System.out.println("分区容量:"+capacity);
System.out.println("目录数:"+directories);
System.out.println("文件数:"+files);
System.out.println("-----------------------------------");
}
}
}
程序的输出结果:
磁盘信息:
分区盘符:C
分区容量:8G
目录数:200
文件数:1580
-----------------------------------
磁盘信息:
分区盘符:D
分区容量:10G
目录数:500
文件数:3000
-----------------------------------
JDOM+XPATH进阶篇
说了那么多JDOM和XPATH的好处,终于到了英雄有用武之地的时候了。
JDOM 的关于XPATH的api在org.jdom.xpath这个包里。看看这个包下,只有一个类,JDOM就是如此简洁,什么事都不故弄玄虚的搞得那么复杂。这个类中的核心的api主要是两个selectNodes()和selectSingleNode()。前者根据一个xpath语句返回一组节点;后者根据一个xpath语句返回符合条件的第一个节点。
下面的程序我们用JDOM+XPATH实现了上一个程序同样的功能,你可以从中学到不少运用XPATH 的知识:
import java.util.*;
import org.jdom.*;
import org.jdom.input.SAXBuilder;
import org.jdom.xpath.XPath;
public class Sample2 {
public static void main(String[] args) throws Exception {
SAXBuilder sb = new SAXBuilder();
Document doc = sb.build("sample.xml");
Element root = doc.getRootElement();
List list = XPath.selectNodes(root, "/HD/disk");
for (int i = 0; i > list.size(); i++) {
Element disk_element = (Element) list.get(i);
String name = disk_element.getAttributeValue("name");
String capacity = ( (Text) XPath.selectSingleNode(disk_element,
"//disk[@name='" + name + "']/capacity/text()")).getTextNormalize();
String directories = ( (Text) XPath.selectSingleNode(disk_element,
"//disk[@name='" + name + "']/directories/text()")).getTextNormalize();
String files = ( (Text) XPath.selectSingleNode(disk_element,
"//disk[@name='" + name + "']/files/text()")).getTextNormalize();
System.out.println("磁盘信息:");
System.out.println("分区盘符:" + name);
System.out.println("分区容量:" + capacity);
System.out.println("目录数:" + directories);
System.out.println("文件数:" + files);
System.out.println("-----------------------------------");
}
}
}
输出结果:
磁盘信息:
分区盘符:C
分区容量:8G
目录数:200
文件数:1580
-----------------------------------
磁盘信息:
分区盘符:D
分区容量:10G
目录数:500
文件数:3000
-----------------------------------
结语
技术在日新月异的发展。永远没有学过后,便可以一劳永逸的技术。XML的发展一日千里。W3C作为INTERNET方面的权威组织指导着互联网技术的发展方向。新技术的出现大都围绕着W3C制订的标准,但往往有些“旁门左道”的另类功法却能产生惊人的杀伤力。JDOM就是这众多旁门中的一朵奇葩。就像 J2EE大行其道的今天,有许多开源组织仍旧在默默的打造着自己的独家兵器,谁又能说在不久的将来,他们不会成为划时代的创造呢? 君不见Hibernate的兴起正在有力的震撼着J2EE中EJB架构的基石。只要是成型的框架,必然有薄弱的软肋。新的技术只要能攻入对方这一弱点,便可在业界站一席之地。本文只起抛砖引玉的作用,相信读者在吃过这道快餐之后,一定会发现窗外有更美丽的风景等待我们去游历。
参考资料
* W3C发布的关于XPATH的权威文档请访问 http://www.w3.org/TR/2002/WD-DOM-Level-3-XPath-20020328
* JDOM官方网站可以下载最新JDOM类库 http://www.jdom.org
分享到:
相关推荐
压缩包内的资源,如 "在 Java 中使用 DOM 和 XPath 进行有效的 XML 处理.mht" 和 "JDOM-XPATH编程指南.mht",很可能是关于如何在Java中结合DOM和XPath的教程。MHT文件是一种网页归档格式,通常包含HTML内容和相关...
Java XML编程指南主要涵盖了在Java平台上使用XML技术进行开发的各种概念和实践方法。XML(Extensible Markup Language)是一种用于标记数据的语言,它被广泛应用于数据交换、配置存储以及Web服务等场景。Java作为...
此外,JDOM还支持XPath查询,允许开发者通过表达式直接定位到XML文档中的特定节点,提高了代码的可读性和效率。同时,JDOM还支持事件驱动的SAX解析和DOM解析,适应不同的应用场景。 总之,JDOM 2.0.2作为Java开发中...
Java XML 编程指南 XML(可扩展标记语言)是一种用于存储和传输数据的标准化格式,广泛应用于Web服务、配置文件、数据交换等场景。Java作为一种强类型、面向对象的编程语言,与XML的结合提供了丰富的处理XML文档的...
此外,JDOM还支持XPath查询,允许开发者轻松定位XML文档中的特定元素。 使用JDOM进行XML处理的基本步骤通常包括以下几点: 1. 创建一个`SAXBuilder`实例,用于从XML文件构建`Document`对象。 2. 使用`build`方法...
5. **XPath支持**:JDOM 1.1引入了对XPath的支持,这使得能够通过简洁的表达式快速定位XML文档中的特定节点,增强了数据查找和操作的能力。 6. **命名空间处理**:XML中的命名空间对于管理和区分具有相同标签名但...
JDOM项目官网提供完整的API文档、用户指南和示例代码,是学习和解决问题的重要资源。此外,Stack Overflow等技术论坛上也有大量关于JDOM的问题和解答,可以帮助开发者解决实际问题。 总结,JDOM是Java中处理XML的...
- 《Java语言与XML处理教程:SAX,DOM,JDOM,JAXP与TrAX指南》【美】Elliotte Rusty Harold著 - **相关资源**: - [XML四种解析方法的比较](http://blog.chinaunix.net/u/25176/showart_379827.html) - [XML解析...
9. **DOM和JDOM**:在Java编程中,DOM4J和JDOM是常用的XML处理库,它们提供了操作XML文档的API,简化了XML的解析和生成。 10. **XML与数据库**:XML也可以作为数据库中的数据格式,如XML数据库,提供了一种非结构化...
本资源“XML编程从入门到精通(PDF)”是一本旨在帮助读者全面理解并熟练运用XML的指南。 XML的基础知识包括以下几个方面: 1. **XML的基本结构**:XML文档由元素、属性、文本内容和注释等组成。元素是XML的核心,...
另一方面,www.pudn.com.txt可能是一个文本文件,其中包含了关于这个项目的来源、作者信息或者使用指南,因为www.pudn.com是一个知名的编程资源网站。 在Java中集成XML,通常涉及到以下几个核心概念: 1. **DOM...
《Java and XML(英文第三版)_java_xml_birdsolc_源码》是关于Java与XML集成编程的一本权威指南,特别适合于那些希望深入理解如何在Java应用程序中有效地使用XML技术的开发者。这本书详细阐述了Java平台上的XML处理...
“利用Java技术进行XML编程1.pdf”是主要的学习资源,它详细介绍了如何使用Java API来操作XML。这个PDF可能涵盖以下关键知识点: 1. **DOM解析器**:DOM(Document Object Model)是一种将XML文档转换为内存中的树...
这可能需要使用XPath表达式来定位XML文档中的特定节点,然后将找到的数据与用户界面组件关联起来。 【标签】:“java”表明这个项目使用的是Java编程语言,这是一种广泛应用的面向对象的语言,尤其适合开发桌面应用...
API文档`dom4jAPI帮助文档.chm`会涵盖DOM、SAX和JDOM等解析器的使用,以及XPath查询、XML文档建模和事件处理等相关功能。 3. **jQuery**:jQuery是一个广泛使用的JavaScript库,它简化了HTML文档遍历、事件处理、...
在实际开发中,还有一些辅助工具可以简化XML的处理,例如XML Schema(XSD)用于验证XML文档是否符合预定义的结构,XPath用于查找XML文档中的特定部分,而XSLT则用于转换XML文档的结构。 此外,对于大型项目,可能...
Java作为一种广泛使用的编程语言,具有跨平台性、安全性高、面向对象等特性,能够处理复杂的业务逻辑。将XML与Java结合,可以实现数据的高效处理和传输,特别是在Web服务、企业级应用集成等方面有着广泛的应用。 ##...
这些章节式的结构通常表示一个教程或参考指南的组织方式,其中每个目录可能对应教程的不同部分。XSLTViewer可能是用于查看和测试XSLT转换的工具,XSLT是XML的一种样式表语言,用于转换XML文档。 在Java中,XML被...