`
forlab
  • 浏览: 133997 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

使用SAX和dom4j解析XML文档

 
阅读更多

声明:类容为学习传智播客方立勋教学视频,总结。

一:SAX采用事件处理方式解析XML文档: 解析器 事件处理器(有多个处理器)

a:解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个文档了。
b:解析器只要解析到xml文档的一个组成部分,就会调用时间处理器的一个方法,同时把当前解析到的内容作为方法的参数传递给事件处理器。
得到解析器是模版代码:
		// 获取sax解析工厂
		SAXParserFactory factory = SAXParserFactory.newInstance();
		// 获取sax解析器
		SAXParser sp = factory.newSAXParser();
		// 获取sax读取器
		XMLReader reader = sp.getXMLReader();
		// 设置内容处理器
		reader.setContentHandler(new TagValue());
		// 读取xml内容
		reader.parse("src/dom.xml");
 
我们的主要工作就是写事件处理器。
有两种方式:
a:实现ContentHandler接口
b:继承DefaultHandler类,覆盖我们需要的方法。
二:dom4j解析xml文档
模版开始代码:
    @Test  
    public void read() throws DocumentException{  
        SAXReader reader = new SAXReader();  
        Document doc = reader.read(new File("src/Book.xml"));  
          
        Element root = doc.getRootElement();  
        Element book = (Element) root.elements().get(1);  
        String value = book.element("书名").getText();  
        System.out.println(value);        
    }  
 写回文档的代码:
  
XMLWriter writer = new XMLWriter(new FileWriter("src/Book.xml"));  
writer.write(doc);  
writer.close();  
 
dom4j有一个提取根标签的方法,很不错。
官方的说明文档很详细,基本一看就会了。就不在赘述了。
下面叙述一点XPath。w3cschool上面有这方面的讲解。但是讲解最好的个人认为是:http://zvon.org/xxl/XPathTutorial/General_chi/examples.html

实例:
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.junit.BeforeClass;
import org.junit.Test;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

/**
 * sax解析xml文档
 * 
 * @author forlab
 * @version 2012-12-19
 */
public class Sax {

	public static void main(String[] args) {
		try {
			ReadXml();
		} catch (ParserConfigurationException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (SAXException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
	@BeforeClass
	public static void setUpBeforeClass() throws Exception {
	}

	
	public static void ReadXml() throws ParserConfigurationException, SAXException,
			IOException {
		// 获取sax解析工厂
		SAXParserFactory factory = SAXParserFactory.newInstance();
		// 获取sax解析器
		SAXParser sp = factory.newSAXParser();
		// 获取sax读取器
		XMLReader reader = sp.getXMLReader();
		// 设置内容处理器
		BeanListHandler handler = new BeanListHandler();
		reader.setContentHandler(handler);
		// 读取xml内容
		reader.parse("src/dom.xml");
		List list = handler.getBooks();
	}
}

class ListHander implements ContentHandler {

	@Override
	public void setDocumentLocator(Locator locator) {
		// TODO Auto-generated method stub

	}

	@Override
	public void startDocument() throws SAXException {
		// TODO Auto-generated method stub

	}

	@Override
	public void endDocument() throws SAXException {
		// TODO Auto-generated method stub

	}

	@Override
	public void startPrefixMapping(String prefix, String uri)
			throws SAXException {
		// TODO Auto-generated method stub

	}

	@Override
	public void endPrefixMapping(String prefix) throws SAXException {
		// TODO Auto-generated method stub

	}

	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes atts) throws SAXException {
		System.out.println("<"+qName+">");
		//获取元素节点的属性值
		for(int i=0;atts!=null && i<atts.getLength();i++){
			String attName = atts.getQName(i);
			String attValue = atts.getValue(i);
			System.out.println(attName+"="+attValue);
		}
	}

	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		System.out.println("<"+qName+">");
	}

	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		// TODO Auto-generated method stub
		System.out.println(new String(ch, start, length));
	}

	@Override
	public void ignorableWhitespace(char[] ch, int start, int length)
			throws SAXException {
		// TODO Auto-generated method stub

	}

	@Override
	public void processingInstruction(String target, String data)
			throws SAXException {
		// TODO Auto-generated method stub

	}

	@Override
	public void skippedEntity(String name) throws SAXException {
		// TODO Auto-generated method stub

	}

}

//继承类代码实现更容易
class TagValue extends DefaultHandler {
	private String currentName;
	private int needNum = 1;
	private int currentNum;

	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes atts) throws SAXException {
		// TODO Auto-generated method stub
		currentName = qName;
		if(currentName.equals("作者")){
			currentNum++;
		}
	}

	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		// TODO Auto-generated method stub
		currentName = null;
	}

	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		// TODO Auto-generated method stub
		if ("作者".equals(currentName) && currentNum == needNum ) {
			System.out.println(new String(ch, start, length));
		}
	}
}

class BeanListHandler extends DefaultHandler{
    private List list = new ArrayList();
    private String currentTag;
    private Book book;
	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		currentTag = qName;
		if("书".equals(currentTag)){
			book = new Book();
		}
	}

	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		if("书".equals(qName)){list.add(book);
		book = null;
		}
		currentTag = null;
	}

	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		System.out.println("内容="+new String(ch,start,length));
		if("书名".equals(currentTag)){
			String value = new String(ch,start,length);
			book.setName(value);
		}
		if("作者".equals(currentTag)){
			
			String value = new String(ch,start,length);
			book.setAuthor(value);
		}
		if("售价".equals(currentTag)){
			String value = new String(ch,start,length);
			book.setPrice(value);
		}
	}
	
  public List getBooks(){
	  return list;
  }
	
}
 

 

import java.io.File;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import org.junit.BeforeClass;
import org.junit.Test;


/**
 * @author forlab
 * @version 2012-12-19
 */
public class Dom4j {

	@BeforeClass
	public static void setUpBeforeClass() throws Exception {
	}
	/**
	 * 利用xpath技术,查找dom.xml中name属性值为forlab的元素
	 * @throws DocumentException
	 */
	@Test
	public void valid() throws DocumentException{
		String username = "forlab";
		SAXReader reader = new SAXReader();
		Document document = reader.read(new File("src/dom.xml"));
		Node node = document.selectSingleNode("//作者[@name='"+username+"']");
		if(node==null){
			System.out.println("用户名或者密码错误!");
		}else{
			System.out.println("恭喜登陆成功!");
		}
	}
}
   相关资料:http://www.blogjava.net/junglesong/archive/2008/02/21/181196.html
分享到:
评论

相关推荐

    Java使用sax、dom、dom4j解析xml文档

    Java提供了多种解析XML的API,包括SAX(Simple API for XML)、DOM(Document Object Model)以及DOM4J。下面我们将详细探讨这些解析方式及其在实际开发中的应用。 1. SAX解析器: SAX是一种基于事件驱动的解析器,...

    分别使用DOM和DOM4j解析XML文件

    使用DOM解析XML的基本步骤如下: 1. 创建DocumentBuilderFactory实例。 2. 使用DocumentBuilderFactory创建DocumentBuilder实例。 3. 使用DocumentBuilder的parse()方法解析XML文件,得到Document对象。 4. 通过...

    dom4j解析xml详解

    ### DOM4J解析XML详解 #### 一、DOM4J简介与特性 DOM4J是一个由dom4j.org开发的开源XML解析包,专为Java平台设计,它不仅支持DOM、SAX和JAXP标准,还巧妙地融入了Java集合框架,使其成为Java开发者在处理XML数据时...

    dom4j解析xml文件的压缩包

    5. **事件驱动解析(SAX)**:除了传统的DOM解析外,DOM4J还支持SAX解析器,这种解析方式适用于处理大型XML文件,因为它不需要一次性加载整个文档到内存。 6. **Namespace支持**:DOM4J提供了对XML命名空间的全面...

    用DOM SAX JDom dom4j 对xml文档解析实例

    本文将深入探讨DOM、SAX、JDom和dom4j四种流行的Java XML解析器,以及它们在处理XML文档时的特点和用法。 1. DOM(Document Object Model) DOM是W3C推荐的一种解析XML的标准方法。它将XML文档表示为一个树形结构,...

    dom4j下sax解析xml

    在提供的“analysis_xml”项目中,很可能包含了一个示例,演示了如何使用dom4j的SAX解析器解析XML文件。这样的测试项目有助于理解SAX解析的工作原理,并在实际开发中应用。 总结起来,dom4j库提供了DOM和SAX两种XML...

    使用sax,pull,dom4j解析XML

    在Java中,有三种主要的解析XML的方式:SAX(Simple API for XML)、Pull解析器和DOM4J。下面将详细介绍这三种方法以及它们在Eclipse 4.8和Java 1.8环境下的使用。 1. **SAX解析器** SAX是一种基于事件驱动的解析...

    java dom4j解析xml

    Java DOM4J解析XML是一种常见的处理XML文档的技术,它提供了灵活且高效的API,使得开发者能够方便地读取、写入、修改以及操作XML文件。DOM4J是Java中一个非常强大的XML处理库,它结合了DOM、SAX和JDOM的优点,同时也...

    XML的四种解析器(dom,sax,jdom,dom4j)原理及性能比较,超详细

    常见的 XML 解析器有 DOM、SAX、JDOM 和 DOM4J 等。每种解析器都有其特点和优缺,选择合适的解析器对应用程序的性能和开发效率有很大影响。 1. DOM 解析器 DOM(Document Object Model)是 W3C 官方标准,用于表示...

    SAX解析XML文件实例

    一个项目同时用dom解析和sax解析xml文件貌似会报错,项目框架建一直是用sax和dom4j解析xml文件的。当我用dom解析xml文件。导入包后就报错识别不了xml文件的编码格式。于是做了一个sax解析xml文件的实例

    DOM4J 解析XML

    在解析XML时,DOM4J有两种主要的解析方式:SAX和DOM。SAX是一种基于事件的解析器,适用于处理大型XML文档,因为它不会将整个文档加载到内存中。DOM,即文档对象模型,会构建一个完整的XML树,适合小型或中等大小的...

    解析XML的dom、sax和dom4j的jar包

    使用DOM解析XML需要的jar包通常包含在Java的标准库中,无需额外引入。 2. SAX (Simple API for XML) SAX是一种事件驱动的解析器,它不会一次性加载整个XML文档,而是逐行读取并触发相应的事件。这种方式对内存占用...

    dom4j-jar与dom4j解析xml文档介绍

    "以及解析xml文档所用的pdf文档说明"则表明还有一个PDF文档,可能详细介绍了如何使用dom4j来解析XML文件,包括各种方法、类和接口的使用示例。 **dom4j解析XML文档知识点:** 1. **dom4j简介**:dom4j是一个开放...

    dom4j解析XML所需jar包

    1. **DOM4J API**:DOM4J提供了一组直观的类和接口来操作XML文档,如`Element`代表XML元素,`Attribute`代表属性,`Document`表示整个XML文档,还有`Namespace`处理命名空间。通过这些API,开发者可以轻松地创建、...

    使用dom4j解析XML

    【使用dom4j解析XML】 dom4j是一个强大的开源XML框架,它提供了处理XML文档的各种功能,包括解析、创建、修改等。相比W3C DOM API,dom4j的优势在于其内置的XPath支持,允许更方便地定位和操作XML文档中的节点。 *...

    dom4j解析xml

    在提供的文件列表中,`Test.java`可能包含使用DOM4J解析XML的示例代码。通常,这样的代码会包含以下部分: ```java import org.dom4j.Document; import org.dom4j.DocumentHelper; import org.dom4j.Element; // ...

    用dom4j解析xml文件

    本篇文章将深入探讨如何使用DOM4J来解析XML文件,以及通过示例代码来展示其基本操作。 首先,我们需要理解DOM4J的工作原理。DOM4J采用的是DOM(Document Object Model)模型,它将整个XML文档加载到内存中形成一棵...

    dom4j解析XML文档.ppt

    DOM4J是一个强大的Java库,专门用于解析XML文档。它提供了简单易用的API,使得开发者可以更加方便地处理XML数据。DOM4J的核心优势在于它的面向接口编程设计,这使得它能够在不同的解析机制间灵活切换,如DOM、SAX和...

    使用DOM4j解析XML文件

    在使用DOM4j解析XML文件时,首先需要导入DOM4j的相关包,如`SAXReader`用于读取XML文件,`Document`表示整个XML文档,`Element`表示XML文档中的元素,以及`Attribute`表示元素的属性。以下是一个使用DOM4j解析XML...

Global site tag (gtag.js) - Google Analytics