使用 dom4j 解析 XML

hn_archer

浏览: 132974 次
性别:
来自: 河南

最近访客更多访客>>

jacktan123

starlyd

alpenliebe

cocpp

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

JavaEE初级 - XML

dom4j是一种解析XML文档的开放源代码的XML框架。从性能上来说，这个框架已经远远的超过了W3C DOM、JDOM了。而且，dom4j支持XPath。

dom4j的API里面包含一个解析XML文档的工具，我们使用这个解析器创建一个示例XML文档，清单1.catalog.xml。然后使用同一个解析器修改catalog.xml，清单2是修改生的XML文档，catalog-modified.xml。

清单1.示例XML文档（catalog.xml）

<?xml version="1.0" encoding="UTF-8"?>
<catalog>
 <!--An XML Catalog-->
 <?target instruction?>
 <journal title="XML Zone" publisher="IBM developerWorks">
   <article level="Intermediate" date="December-2001">
     <title>Java configuration with XML Schema</title>
     <author>
       <firstname>Marcello</firstname>
       <lastname>Vitaletti</lastname>
     </author>
   </article>
 </journal>
</catalog>

清单2.修改后的XML文档（catalog-modified.xml）

<?xml version="1.0" encoding="UTF-8"?>
<catalog>
<!--An XML catalog-->
<?target instruction?>
    <journal title="XML Zone" publisher="IBM developerWorks">
       <article level="Introductory" date="October-2002">
           <title>Create flexible and extensible XML schemas</title>
           <author>
              <firstname>Ayesha</firstname>
              <lastname>Malik</lastname>
           </author>
       </article>
    </journal>
</catalog>

一：创建catalog.xml

// 1：使用DocumentHelper类创建一个文档实例。DocumentHelper是生成XML文档节点的dom4j API 工厂类。
Document document = DocumentHelper.createDocument();

// 2：使用addElement()方法创建根元素catalog。addElement()用于向XML文档中啬元素。
Element catalogElement = document.addElement("catalog");

// 3：在catalog元素中使用addComment()方法添加注释“An XML catalog”。
catalogElement.addComment("An XML catalog");

// 4：在catalog元素中使用addProcessingInstruction()方法增加一个处理指令。
catalogElement.addProcessingInstruction("target", "text");

// 5：在catalog元素中使用addElement()方法啬journal元素。
Element journalElement = catalogElement.addElement("journal");

// 6：使用addAttribute()方法向journal元素添加title和publisher属性。
journalElement.addAttribute("title", "XML Zone");
journalElement.addAttribute("publisher", "IBM developerWorks");

// 7：向journal元素中添加article元素，并添加level和date属性。
Element articleElement = journalElement.addElement("article").addAttribute(
    "level", "Intermediate").addAttribute("date", "December-2001");

// 8：向article元素中添加title元素，author元素。
Element titleElement = articleElement.addElement("title");
titleElement.setText("Java configuration with XML Schema");

Element authorElement = articleElement.addElement("author");

Element firstNameElement = authorElement.addElement("firstname");
firstNameElement.setText("Marcello");

Element lastNameElement = authorElement.addElement("lastname");
lastNameElement.setText("Vitaletti");

// 9：还可以用addDocType()方法向文件加入文档类型说明
document.addDocType("catalog", null, "file://c:/Dtds/catalog.dtd");
// 这样就会身XML文档中添加文档类型说明：
// <!DOCTYPE catalog SYSTEM “file://c:/Dtds/catalog.dtd">
// 如果文档 要作用文档类型定义（DTD）文档验证则必须有Doctype。

// 10：把Document写入文件
try {
  XMLWriter output = new XMLWriter(new FileWriter("e:/catalog.xml"));
  output.write(document);
  output.close();
} catch (IOException e) {
  System.out.println(e.getMessage());
}

经过以上10个过程，我们创建了catalog.xml文档。下面我们把catalog.xml修改一下，并生成catalog-modified.xml。

二：创建catalog-modified.xml

// 1：使用 SAXReader 解析 XML 文档 catalog.xml：
SAXReader saxReader = new SAXReader();
Document documentOld = saxReader.read(new File("e:/catalog.xml"));

// 2：使用XPath表达式从article元素中获得level节点列表，如果level属性值是“Intermediate”则改为“Introductory”。
List list = documentOld.selectNodes("//article/@level");
Iterator iter = list.iterator();
while (iter.hasNext()) {
  Attribute attribute = (Attribute) iter.next();

  if (attribute.getValue().equals("Intermediate"))
    attribute.setValue("Introductory");
}

// 3：修改title
/*
 * 1：遍历所有article元素 2：遍历article元素下的title元素 3：比较修改
 */
list = document.selectNodes("//article");
iter = list.iterator();
while (iter.hasNext()) {
  Element element = (Element) iter.next();
  Iterator iterator = element.elementIterator("title");
  while (iterator.hasNext()) {
    Element titleElement1 = (Element) iterator.next();
    if (titleElement1.getText()
        .equals("Java configuration with XML Schema"))
      titleElement1.setText("Create flexible and extensible XML schema");
  }
}

以过多次修改，得到catalog-modified.xml的Document对象，再写入文件！

从上面的例子，我们可以看出，dom4j里最常用的几个地方是：

1：枚举（Iterator）

// 枚举所有子节点

for ( Iterator i = root.elementIterator(); i.hasNext(); ) {

Element element = (Element) i.next();

// do something

}

// 枚举名称为foo的节点

for ( Iterator i = root.elementIterator("foo"); i.hasNext();) {

Element foo = (Element) i.next();

// do something

}

// 枚举属性

for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {

Attribute attribute = (Attribute) i.next();

// do something

}

2：递归

public void treeWalk(Element element) {

for (int i = 0, size = element.nodeCount(); i < size; i++) {

Node node = element.node(i);

if (node instanceof Element) {

treeWalk((Element) node);

} else {

// do something....

}

3：得到想要的节点的对象，对XPath的良好支持

public void bar(Document document) {

List list = document.selectNodes("//foo/bar");

Node node = document.selectSingleNode("//foo/bar/author");

String name = node.valueOf("@name");

}

例如，如果你想查找XHTML 文档中所有的超链接，下面的代码可以实现：

public void findLinks(Document document) throws

DocumentException {

List list = document.selectNodes( //a/@href );

for (Iterator iter = list.iterator(); iter.hasNext(); ) {

Attribute attribute = (Attribute) iter.next();

String url = attribute.getValue();

}

4：XML----String转换

// XML 转字符串

Document document = ...;

String text = document.asXML();

// 字符串转XML

String text = "<person><name>James</name></person>";

Document document = DocumentHelper.parseText(text);

下面的例子,是一个运用递归,复制文件的例子:

Dom4jDemo2 dom4jDemo = new Dom4jDemo2();

// ------------源---------------

SAXReader saxReader = new SAXReader();

Document docSource = saxReader.read(new File("e:\\jcmReponse.xml"));

Element rootSource = docSource.getRootElement();

// ------------目标-------------

Document docTarget = DocumentHelper.createDocument();

Element rootTarget = docTarget.addElement(rootSource.getNamespacePrefix() +":"+rootSource.getName());

dom4jDemo.treeWalk(iteratorSource,return1);

dom4jDemo.writeNewXml(docTarget, "e:\\b.xml");

// 写入

public void writeNewXml(Document doc, String fileName) {

try {

OutputFormat format = OutputFormat.createPrettyPrint();

XMLWriter writer = new XMLWriter(new FileWriter(fileName), format);

writer.write(doc);

writer.close();

} catch (IOException e) {

e.printStackTrace();

}

// 递归

private void treeWalk(Element element, Element targetE) {

for (int i = 0, size = element.nodeCount(); i < size; i++) {

Node node = element.node(i);

Element eTemp = null;

if (node instanceof Element) {

String nameSpacePrefix = ((Element) node).getNamespacePrefix();

if(nameSpacePrefix == null || "".equals(nameSpacePrefix))

eTemp = targetE.addElement(node.getName());

else

eTemp = targetE.addElement(nameSpacePrefix + ":"+ node.getName());

eTemp.setText(node.getText());

for (Iterator ite = ((Element) node).attributeIterator(); ite.hasNext();) {

Attribute atr = (Attribute) ite.next();

eTemp.addAttribute(atr.getNamespacePrefix() + ":"

+ atr.getName(), atr.getValue());

}

treeWalk((Element) node, eTemp);

}

分享到：

dom4j 常见异常 | XStream

2012-04-05 12:45
浏览 714
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论