`
hwy584624785
  • 浏览: 47253 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

XML解析之-SAX解析

阅读更多

在android开发中,我们经常使用SAX解析来解析xml数据,和DOM相比,它对大的优点就是节省内存。

SAX的原理 

SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。大多数SAX实现都会产生以下类型的事件:
在文档内每一XML元素接受解析的前后触发元素事件。 
在文档的开始和结束时触发文档处理事件。 
在处理文档的DTD或Schema时产生DTD或Schema事件。 
任何元数据通常都由单独的事件交付。 
产生错误事件用来通知主机应用程序解析错误。 
对于如下文档:
<doc>
<para>Hello, world!</para>
</doc>

在解析文档的过程中会产生如下一系列事件:

start document
start element: doc
start element: para
characters: Hello, world!
end element: para
end element: doc
end document
一个完整的SAX处理过程涉及如下几个步骤:
(1)创建事件处理程序。 
(2)创建SAX解析器。
(4)对文档进行解析,将每个事件发送给处理程序。
(3)将事件处理程序分配给解析器。

SAX的优缺点 
SAX的优点: 
解析速度快 
ContentHandler对象可以是多个 
内存消耗少 
SAX的缺点: 
必须实现事件处理程序 
不能修改文档 
不能随机访问 

 


SAX解析器对文档的解析过程是一种边解析边执行的过程 ,SAX解析器对文档的解析过程中,无需把整个文档都加载到内存中使用SAX解析器时,可以注册多个ContentHandler对象,并行接收事件,SAX解析器对文档的解析是顺序进行的,使用SAX对文档进行解析,只能访问文档内容,无法做到向文档中添加节点,更不能删除和修改文档中的内容。

SAX的常用接口介绍 
ContentHandler接口 
ContentHandler是Java类包中一个特殊的SAX接口,位于org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。 
ContentHandler接口的方法有以下几种: 
void startDocument() 
void characters(char[ ] ch, int start, int length) 
void endDocument()
void startElement(String uri, String localName, String qName, Attributes atts) 
void endElement(String uri, String localName, String qName) 
DTDHandler接口 
DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。 
DTDHandler接口包括以下两个方法: 
void startDocumevoid notationDecl(String name, String publicId, String systemId) nt() 
void unparsedEntityDecl(String name, String publicId, String systemId, String notationName) 
接收注释声明事件的通知
接收未解析的实体声明事件的通知 
EntityResolver接口 
EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。 
该接口只有一个方法,如下: 
public InputSource resolveEntity(String publicId, String systemId) 
允许应用程序解析外部实体。并返回一个InputSource类的对象或者为null,用于读取实体信息 
解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。 
ErrorHandler接口 
ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。 
该接口的方法如下: 
void error(SAXParseException exception) 
void fatalError(SAXParseException exception) 
接收可恢复的错误通知 
接收不可恢复的错误通知 
void warning(SAXParseException exception) 
接收警告的通知

理论就介绍这里,下面动手写代码来实现一个简单的xml解析。

这里我们使用到android的单元测试来测试我们所写的SAX解析代码。

 

要使用android单元测试,必须在AndroidManifest.xml文件中进行一些配置

AndroidManifest.xml文件的application节点下假如以下代码:

<uses-library android:name="android.test.runner" />

 在manifest节点下加入以下代码:

 

 

 

 

 

 

 

 

 

<instrumentation android:name="android.test.InstrumentationTestRunner"
  android:targetPackage="weiyong.huang.xml" android:label="Tests for My App" />
  <!-- android:label标签名字随便我们取 -->

接下来就是编码了,我定义了3个类,一个是javabean类,一个是实现SAX解析的功能类,一个是用于测试的类和一个测试用的xml文件。

javabean类:Person.java

 

 

 

 

 

 

public class Person {
	private Integer id;
	private String name;
	private Short age;
	public Person(){}//无参构造器
	
	public Person(Integer id, String name, Short age) {
		this.id = id;
		this.name = name;
		this.age = age;
	}
	
	public Integer getId() {
		return id;
	}
	public void setId(Integer id) {
		this.id = id;
	}
	public String getName() {
		return name;
	}
	public void setName(String name) {
		this.name = name;
	}
	public Short getAge() {
		return age;
	}
	public void setAge(Short age) {
		this.age = age;
	}
	@Override
	public String toString() {
		return "Person [age=" + age + ", id=" + id + ", name=" + name + "]";
	}
}

 SAX解析的功能类:SAXPersonService.java

 

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import cn.itcast.domain.Person;
/**
 * 采用SAX解析XML内容
 */
public class SAXPersonService {
	
	public List<Person> getPersons(InputStream inStream) throws Throwable{
		SAXParserFactory factory = SAXParserFactory.newInstance();
		SAXParser parser = factory.newSAXParser();
		PersonParser personParser = new PersonParser();
		parser.parse(inStream, personParser);
		inStream.close();
		return personParser.getPersons();
	}

	private final class PersonParser extends DefaultHandler{
		private List<Person> persons = null;
		private String tag = null;//用来存放xml标签
		private Person person = null;

		public List<Person> getPersons() {
			return persons;
		}

		//开始读文档,我们在此方法中可以完成一些必要的初始化工作
		@Override
		public void startDocument() throws SAXException {
			persons = new ArrayList<Person>();
		}
		
		/**
		 * @param uri 名称空间 URI,如果元素没有任何名称空间 URI,或者没有正在执行名称空间处理,则为空字符串。
		 * @param localName 本地名称(不带前缀),如果没有正在执行名称空间处理,则为空字符串。/
		 * @param qName 限定的名称(带有前缀),如果限定的名称不可用,则为空字符串。
		 * @param attributes 附加到元素的属性。如果没有属性,则它将是空的 Attributes 对象。 
		 * @throws SAXException
		 * @see org.xml.sax.helpers.DefaultHandler#startElement(java.lang.String, java.lang.String, java.lang.String, org.xml.sax.Attributes)
		 */
		@Override
		public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
			if("person".equals(localName)){
				person = new Person();
				person.setId(new Integer(attributes.getValue(0)));
			}
			tag = localName;
		}
		
		@Override
		public void characters(char[] ch, int start, int length)
				throws SAXException {
			if(tag!=null){
				String data = new String(ch, start, length);//获取文本节点的数据
				if("name".equals(tag)){
					person.setName(data);
				}else if("age".equals(tag)){
					person.setAge(new Short(data));
				}
			}
		}

		@Override
		public void endElement(String uri, String localName, String qName)
				throws SAXException {
			if("person".equals(localName)){
				persons.add(person);
				person = null;
			}
			tag = null;//当读完一个元素的内容时,我们要把tag清空,以继续读下面的标签
		}
	}
}

 测试类:PersonServiceTest.java

这里需要注意一点,在android测试的时候,我们最好把测试类放在和android启动的Activity类的同包下。

 

import java.io.InputStream;
import java.io.StringWriter;
import java.util.ArrayList;
import java.util.List;
import cn.itcast.domain.Person;
import cn.itcast.service.DOMPersonService;
import cn.itcast.service.PULLPersonService;
import cn.itcast.service.SAXPersonService;
import android.test.AndroidTestCase;
import android.util.Log;

public class PersonServiceTest extends AndroidTestCase {
	private static final String TAG = "PersonServiceTest";

	public void testSAXGetPersons() throws Throwable{
		SAXPersonService service = new SAXPersonService();
		InputStream inStream = getClass().getClassLoader().getResourceAsStream("target.xml");
		List<Person> persons = service.getPersons(inStream);
		for(Person person : persons){
			Log.i(TAG, person.toString());    
		}
	}
}

 

测试用的xml文件: target.xml

<?xml version="1.0" encoding="UTF-8"?>
<persons>
	<person id="23">
		<name>liming</name>
		<age>30</age>
	</person>
	<person id="20">
		<name>lixiangmei</name>
		<age>25</age>
	</person>
</persons>

到此,我们完成了SAX解析的全部编码工作。

 

下面开始进行测试工作:对PersonServiceTest的testSAXGetPersons()方法进行单元测试,再在android的LogCat添加一个PersonServiceTest过滤器。我们可以在这个过滤器里面看到如下结果:

 

Person [age=30, id=23, name=liming]
Person [age=25, id=20, name=lixiangmei]

 由此,我们的SAX解析目标xml文件顺利完成,哈哈,是不是比较简单!!!

1
0
分享到:
评论

相关推荐

    java解析xml数据---sax解析器

    SAX解析的基本工作原理是通过事件处理器(如ContentHandler、EntityResolver等)来接收XML文档的解析事件,如开始文档、结束文档、开始元素、结束元素、字符数据等。当解析器遇到这些事件时,会调用相应的处理器方法...

    Android网络之数据解析----SAX方式解析XML数据

    1. 创建XML解析器:首先,我们需要创建一个XMLReader对象,它是SAX解析器的接口,可以通过XMLReaderFactory类来实例化。 2. 设置事件处理器:然后,我们为XMLReader对象设置一个ContentHandler,这是一个接口,包含...

    Xml-GET-SAX.zip_get2326

    这个例子对于初学者来说是一个很好的起点,可以了解HTTP请求与XML解析的基本结合。 总结,本教程主要介绍了XML的基础知识、GET方法在Web开发中的作用以及SAX解析器的工作原理和使用方法。通过实践"Xml-GET-SAX"项目...

    XML四种解析方式------DOM SAX JDOM DOM4J

    JDOM是Java特有的XML解析库,它提供了更符合Java习惯的API来操作XML。与DOM类似,JDOM也创建一个文档对象模型,但它的设计更简洁,易于使用。相比DOM,JDOM的性能稍好,因为它减少了对象创建和内存使用,但对大型XML...

    SAX解析XML文件实例

    SAX解析XML文件的实例。一个项目同时用dom解析和sax解析xml文件貌似会报错,项目框架建一直是用sax和dom4j解析xml文件的。当我用dom解析xml文件。导入包后就报错识别不了xml文件的编码格式。于是做了一个sax解析xml...

    XML解析之SAX解析DEMO

    本文将深入探讨XML解析中的SAX(Simple API for XML)解析方法,并结合一个具体的Android 4.0网络编程示例进行详细讲解。 SAX解析是一种基于事件驱动的解析方式,它不会一次性加载整个XML文档到内存,而是逐行读取...

    读取RSS-SAX解析XML实例(java版)

    而SAX(Simple API for XML)是一种事件驱动的XML解析器,它不像DOM(Document Object Model)那样将整个XML文档加载到内存中,而是逐行解析,因此对于大型XML文件,SAX解析更高效。 标题"读取RSS-SAX解析XML实例...

    dom-sax解析XML文件-java

    SAX解析器采用事件驱动的方式,逐行读取XML文件,当遇到元素开始、结束、属性、文本等事件时,会触发相应的回调函数。这种方式内存占用低,适合处理大文件,但操作XML数据不如DOM直观,需要编写事件处理器来处理这些...

    XML-Parser-2.41.tar.gz

    在这个场景中,"XML-Parser-2.41.tar.gz" 是一个特定版本的XML解析器,它被用作飞鸽工具安装过程中的依赖项,这意味着飞鸽工具在运行或安装时需要这个解析器来正确处理XML数据。 飞鸽工具可能是一个通信软件、开发...

    XML解析器-简单工厂模式.doc

    《XML解析器与简单工厂模式》 XML(eXtensible Markup Language)是一种标记语言,广泛用于数据交换、配置文件存储等场景。在Java中,处理XML文档时,我们通常会使用解析器,其中SAX(Simple API for XML)解析器是...

    Sax解析XML文件解析

    SAX(Simple API for XML)是XML解析的一种方法,它以事件驱动的方式处理XML文档,非常适合处理大体积的XML文件,因为它不需要一次性加载整个文件到内存,而是逐行读取,因此节省了资源。 **SAX解析XML的基本原理:...

    xml解析工具-静态分析.rar

    本压缩包"xml解析工具-静态分析.rar"提供了一个方便的工具,用于对APP客户端进行完整性校验,特别强调了其简单易用的操作流程。 在XML解析过程中,主要涉及以下几个核心概念: 1. **XML文档结构**:XML文档由一...

    xml-apis-2.0.2.jar ecside 依赖包之一

    这个特定的版本可能包含了XML解析器如Apache Xerces或IBM XML4J,以及相关的接口和类,比如DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)等解析方式。 DOM是XML数据的...

    android学习笔记1--SAX解析XML

    ### Android学习笔记1—SAX解析XML #### SAX解析XML概览 在Android开发中,XML文件被广泛用于布局设计、资源定义等场景。而为了处理这些XML文件,开发者需要了解不同的XML解析技术,其中SAX(Simple API for XML)...

    XML-Parser-2.36.rar_ XML-Parser-2.36_XML-Parser-2.36

    2. **API接口**:为开发者提供的编程接口,包括创建解析器对象、设置解析选项、注册事件处理函数(对于SAX解析器)等方法,以便于在程序中使用XML解析器。 3. **错误处理**:当解析过程中遇到问题时,如语法错误、...

    xml.rar_android_android sax_android sax xml_java xml_sax

    本资料包“xml.rar”主要关注Android环境下的XML解析,特别是SAX解析器,同时也涵盖了DOM和Pull解析方式。 1. XML基本概念: XML是一种自描述性的标记语言,它通过标签来定义数据结构。每个XML文档都包含元素、...

    xml文件解析SAX

    SAX(Simple API for XML)是XML解析的一种方式,它以事件驱动的方式处理XML文档,适用于处理大型XML文件,因为它不需要一次性加载整个文档到内存中。 在SAX解析中,XML文档被读取一次,遇到特定的元素、属性或其他...

    XML-java.rar_XML SAX_sax_sax xml_sax 解析 xml_xml using dom

    本压缩包文件“XML-java.rar”包含了关于使用Java解析XML的实例,特别强调了SAX解析器的使用,并且提到了使用JDOM和JOM4J这两个Java库来处理XML。 1. **DOM解析**:DOM是一种树型结构,它将整个XML文档加载到内存中...

    sax解析xml文件

    SAX(Simple API for XML)是一种轻量级的XML解析技术,主要用于读取XML文档。相较于DOM(Document Object Model)解析器,SAX解析器占用更少的内存和处理时间,因为它不会一次性加载整个XML文档到内存,而是采用...

    Android 比较通用的xml解析方法-IT计算机-毕业设计.zip

    相比之下,SAX解析是一种事件驱动的解析方式,它不需要一次性加载整个XML文档。当解析器遇到XML元素时,会触发相应的事件回调,如开始元素、结束元素、字符数据等。在Android中,我们可以使用`org.xml.sax.helpers....

Global site tag (gtag.js) - Google Analytics