概述
解析XML文档方面有不少的方法,也有不少的工具包可用,这里介绍的是来自Apache Jakarta的Digester,使用其解析XML文件非常方便而不需要过多的关心底层的具体解析过程。
Digester最早出现在Struts中,后来随着Struts的发展以及其的公用性而被提到commens中独自立项,其底层实现的是SAX解析。当前版本为:1.5
正文
1. 安装与配置
使用Digester需要如下几个软件包:
Digester ,BeanUtils, Collections, Commens-Logging,还有一个遵循SAX(Simple API for XML)2.0或JAXP(Java API for XML Parsing) 1.1规范的XML解析器,如Xerces。相关下载地址见附录。如果需要使用log4j做为日志输出,则亦请下载之。
将下载来的zip包解压,并将其中的jar文件拷贝到你的工程文件的lib目录中,并在工程classpath中包含上述jar文件的路径。
在您工程的类目录(如classes)新建一commons-logging.properties文件,内容为:
org.apache.commons.logging.Log=org.apache.commons.logging.impl.Log4Jlogger
这表明系统将使用log4j做为日志输出,再建一log4j.proerties文件,内容请参看log4j文档或其他参考资料。
Digester据说最早是为解析struts的配置文件开发的,后来慢慢的就发展成一个轻量,快速,单向(只能从xml到java对象)的一个绑定框架,在运行时实现绑定,无需定义xml文件的DTD或Schema,简单快速。
一、使用Digester的步骤
1. 创建一个Digester的实例。完成parse后,实例可以被安全的重用,但实例不是线程安全的。
2. 设置配置属性
3. 加入处理规则
4. 调用digester.parse()方法。
二、从一个例子说起
先看一个Digester文档上的简单例子
对象树
package mypackage;
public class Foo ...{
public void addBar(Bar bar);
public Bar findBar(int id);
public Iterator getBars();
public String getName();
public void setName(String name);
}
package mypackage;
public class Bar ...{
public int getId();
public void setId(int id);
public String getTitle();
public void setTitle(String title);
}
XML文档片段
<foo name="The Parent">
<bar id="123" title="The First Child"/>
<bar id="456" title="The Second Child"/>
</foo>
解析代码
Digester digester = new Digester();
digester.setValidating(false);
digester.addObjectCreate("foo", "mypackage.Foo");
digester.addSetProperties("foo");
digester.addObjectCreate("foo/bar", "mypackage.Bar");
digester.addSetProperties("foo/bar");
digester.addSetNext("foo/bar", "addBar", "mypackage.Bar");
Foo foo = (Foo) digester.parse();
从例子可以看到Digester的执行步骤是扫描xml文档,匹配特定的xml节点,在每一个节点按照预定的处理规则操纵对象,包括创建对象,设置对象属性,建立对象树等。
三、节点匹配规则
<a> -- Matches pattern "a"
<b> -- Matches pattern "a/b"
<c/> -- Matches pattern "a/b/c"
<c/> -- Matches pattern "a/b/c"
</b>
<b> -- Matches pattern "a/b"
<c/> -- Matches pattern "a/b/c"
<c/> -- Matches pattern "a/b/c"
<c/> -- Matches pattern "a/b/c"
</b>
</a>
可以看到匹配规则非常简单,此外,匹配还支持通配符,像*/a就匹配任意层次内的<a>。
一个特定的XML元素可以被匹配多次,所对应的处理规则执行的顺序如下:如果是begin和body方法,按照规则被加入到Digester的顺序执行,如果是end方法,则相反(参见后面处理规则)。
对于通配符匹配,当一个确定的匹配发生时(如果多个通配符匹配发生,最长的一个被认为是一个确定的匹配),通配符匹配将被忽略。这个意思就是说,当规则A被加入到*/a时,意思是这个规则匹配任意一个<a>元素,但是如果规则C被加入到x/a,则A对于<x><a>的匹配会被或略。假设规则A和B匹配*/a,如果想给x/a加入规则C,则需要给x/a重复加入规则A和规则B,就像下面这样:
Rule ruleA = new ObjectCreateRule();
Rule ruleB = new SetNextRule();
Rule ruleC = new SetPropertiesRule();
digester.addRule("*/a", ruleA);
digester.addRule("*/a", ruleB);
digester.addRule("x/a", ruleA);
digester.addRule("x/a", ruleB);
digester.addRule("x/a", ruleC);
四、处理规则
处理规则的目的就是定义当匹配发生时做什么事情。每一个处理规则都是org.apache.commons.digester.Rule接口的实现类。当匹配发生时Rule接口的回调方法被调用,执行相应的操作。
Rule接口的方法:
begin 当进入匹配元素时调用
body 当进入匹配元素的内容时调用
end 当离开匹配元素时调用
finish 当paser结束时调用
常见的内置处理规则
ObjectCreateRule:进入匹配元素时调用,创建一个特定的java对象。
SetPropertiesRule:进入匹配元素时调用,利用Java的反射API设置栈顶对象的属性,要求Java对象的属性名匹配XML元素的属性名。
SetNextRule:离开匹配元素时调用,digester分析下一个栈顶对象,调用该对象的指定属性的setter方法,将当前栈顶对象作为参数传入到该方法,同时弹出当前栈顶对象。
SetTopRule:和SetNextRule含义相同,分析栈顶对象,调用该对象指定属性的setter方法,将下一个栈顶对象作为参数传给该方法(典型会被调用的方法是setParent)。
CallMethodRule:调用栈顶对象指定的方法。设置这个规则需要指出调用的方法名,参数个数,参数Java类型(可选),参数值一般是匹配元素的body content,用CallParamRule指定。
CallParamRule :标识CallMethodRule中的方法参数。参数值可能是匹配元素的某个属性,或匹配元素的body content。
Digester的处理过程
Digester使用堆栈来存储对象,当ObjectCreateRule被执行时,将对象压入栈,像SetPropertiesRule,SetTopRule,CallMethodRule等规则都是对栈顶对象的操作。当SetNextRule被执行时,弹出栈顶对象,下一个栈顶对象成为栈顶对象,最后返回对象树的根节点。
<!--EndFragment-->
分享到:
相关推荐
标题“利用commons-digester解析XML”涉及到的是Java开发中的一种处理XML文档的工具——Apache Commons Digester。这个库提供了一种方便的方式来映射XML文档结构到Java对象,从而简化了XML数据的处理过程。 Apache ...
3. **解析 XML**:创建好 Digester 实例后,使用 `parse` 方法读取 XML 文件并执行预定义的规则。代码示例如下: ```java Digester digester = new Digester(); digester.setValidating(false); // 关闭验证,...
本文将深入探讨如何使用Digester解析XML文件,以及在实际项目中如何应用。 首先,让我们了解什么是Apache Commons Digester。这是一个Java库,它的主要功能是读取XML文件,并基于一系列预先定义的规则(Rule),...
这个"digester解析XML文件实例"是一个很好的学习资源,帮助开发者理解如何在实际项目中运用Digester。 首先,我们要了解Digester的基本工作原理。Digester通过定义一系列规则(Rules),当解析到XML文档中特定的...
**Digester** 是Apache Commons项目中的一个库,它专门用于解析XML文档,并基于规则将其转换为Java对象。Digester通过匹配XML元素结构来调用对象的方法或创建新对象,减少了手动解析XML的复杂性。这在配置驱动的Java...
这个“org.apache.commons.digester解析XML.rar”压缩包包含了一个测试工程,它演示了如何使用Digester库来解析XML文件并映射到Java对象上。下面将详细介绍这个库的功能、使用方法以及在实际开发中的应用。 1. **...
要使用Digester解析XML文档,首先需要创建一个 `org.apache.commons.digester.Digester` 类的实例,并配置必要的模式和规则,最后调用 `parse()` 方法。 以下是一个简单的示例代码: ```java import org.apache....
在示例代码中, DigesterDriver演示了如何配置 Digester来解析XML文件,创建`Catalog`对象并填充其`Book`和`Magazine`子对象,以及相关的`Article`对象。每个元素的属性通过`addBeanPropertySetter()`设置,而对象...
在Java开发中,Struts框架提供了一个强大的工具——Digester,用于解析XML文件并自动创建、配置Java对象。本文将详细介绍如何使用Digester处理具有嵌套结构的XML文档,并通过一个具体的实例——"DigesterXmlTest"来...
《digester解析XML详解》 在Java开发中,XML作为一种数据交换格式,广泛应用于配置文件、数据传输等场景。为了方便地将XML文档解析为Java对象,Apache组织提供了一个名为Digester的工具库,它允许开发者通过规则来...
**使用Digester解析XML并验证** 1. **设置 Digester 规则** 在使用Digester之前,我们需要定义一系列规则,告诉Digester在遇到XML文档的哪些元素时执行什么操作。这些规则通常涉及到创建新对象、设置对象属性或者...
《使用Digester解析XML的深度指南》 在Java开发中,处理XML文件是常见的任务,而Apache Commons Digester库提供了一种高效且便捷的方式来解析XML并将其映射到Java对象。本教程将深入探讨如何使用Digester来读取XML...
Digester的使用基于一系列预定义或自定义的规则,这些规则决定了XML文档的元素与Java对象之间的映射关系。当解析XML时,它会按照这些规则触发相应的Java代码执行,简化了从XML到业务逻辑的转换过程。学习 Digester,...
在Java代码中,我们需要加载`rule.xml`并应用它到Digester实例上,然后解析XML文件: ```java Digester digester = new Digester(); digester.setRulesLoader(new ClassPathResourceRulesLoader("rule.xml")); ...
值得注意的是,为了确保配置文件能够被正确地解析,XML文档配置文件必须使用DTD(Document Type Definition,文档类型定义),而DTD正是`xmlrules`包的一部分。 #### Digester与XML规则文件 在实际应用中,我们...
这个示例演示了如何使用Apache Commons Digester解析XML文件,将XML数据转换为Java对象。通过定义规则,我们可以轻松地处理复杂的XML结构,并将它们映射到Java对象模型中。这在处理大量配置数据或需要从XML文件加载...
以下是一个简单的示例,展示了如何使用Digester解析XML: ```java package mypackage; public class Foo { // ... (Foo类的属性和方法) } public class Bar { // ... (Bar类的属性和方法) } // XML文档片段: ...
4. **解析XML文件**:最后,通过调用`digester.parse()`方法来解析XML文件,并将解析结果填充到Java对象中。 #### 示例代码 以下是一个简化的`deregister`方法示例,展示了如何使用Digester从XML文件中读取图表...