`
爪哇岛岛主
  • 浏览: 38923 次
  • 性别: Icon_minigender_1
  • 来自: 杭州(也就是天堂)
社区版块
存档分类
最新评论

xml解析技术漫谈

    博客分类:
  • SGML
阅读更多
xml有哪些解析技术?区别是什么?
DOM:
   处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。
下面给出一个DOM解析xml文件的例子。
package parse.impl;

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import parse.ParseXml;

import vo.Person;

public class DomXml implements ParseXml{

	public List<Person> getPersons(InputStream inputStream) throws Exception {
		
		List<Person> persons = new ArrayList<Person>();
		Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(inputStream);
		Element element = document.getDocumentElement();
		
	
		/**
		 * 获取person标签
		 */
		NodeList personNodes = element.getElementsByTagName("person");

		/**
		 * 逐个处理person
		 */
		for(int i=0;i<personNodes.getLength();i++){
			Element personElement = (Element)personNodes.item(i);
			Person person = new Person();
			
			//取出id
			person.setIdCard(Integer.parseInt(personElement.getAttribute("idCard")));
			
			//person的子节点
			NodeList childNodes = personElement.getChildNodes();
			
			//逐个处理子节点
			for(int j=0;j<childNodes.getLength();j++){
				System.out.println("节点"+j+":"+childNodes.item(j).getNodeName());
				//判断是否是元素节点
				if(childNodes.item(j).getNodeType()==Node.ELEMENT_NODE){
					
					//判断子节点名称
					if("name".equals(childNodes.item(j).getNodeName())){
						person.setName(childNodes.item(j).getFirstChild().getNodeValue());
					}else if("age".equals(childNodes.item(j).getNodeName())){
						person.setAge(Integer.parseInt(childNodes.item(j).getFirstChild().getNodeValue()));
					}else if("sex".equals(childNodes.item(j).getNodeName())){
						person.setSex(childNodes.item(j).getFirstChild().getNodeValue());
					}
				}
			}
			persons.add(person);
		}
		return persons;
	}
}

该例子的运行结果为:
节点0:#text
节点1:name
节点2:#text
节点3:age
节点4:#text
节点5:sex
节点6:#text
节点0:#text
节点1:name
节点2:#text
节点3:age
节点4:#text
节点5:sex
节点6:#text
idcard:1001,name:周健儿,age:52,sex:女

SAX:
     SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问
同样给出一个例子。
package parse.impl;

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import parse.ParseXml;
import vo.Person;

public class SaxXml extends DefaultHandler implements ParseXml  {

	List<Person> persons = new ArrayList<Person>();
	protected void init(InputStream inputStream){
		try{
			SAXParserFactory spFactory = SAXParserFactory.newInstance();
			SAXParser parser = spFactory.newSAXParser();
			parser.parse(inputStream, new SaxXml());
		}catch(Exception e){
			e.printStackTrace();
		}
	}
	public List<Person> getPersons(InputStream inputStream) throws Exception {
		
		init(inputStream);
		return persons;
	}

	@Override
	public void endDocument() throws SAXException {
		System.out.println("解析完毕");
	}

	@Override
	public void skippedEntity(String name) throws SAXException {
		System.out.println("这个在哪里"+name);
	}
	
	/**
	 * 开始标记调用
	 */
	@Override
	public void startElement(String uri, String localName, String name,
			Attributes attributes) throws SAXException {
		
		
		for(int i=0;i<attributes.getLength();i++){
			System.out.println("节点属性名称:"+attributes.getQName(i));
			System.out.println("节点属性值:"+attributes.getValue(i));
		}
		
	}
	
	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		
		System.out.println("节点数据:"+new String(ch,start,length));
	}
	/**
	 * 文件打开时调用该方法
	 */
	@Override
	public void startDocument() throws SAXException {
		System.out.println("开始解析xml文档");
	}

	
}

运行结果:
开始解析xml文档

	


STAX:Streaming API for XML (StAX)
      
分享到:
评论

相关推荐

    XML解析技术研究XML解析技术研究

    XML解析技术是XML应用的核心,它涉及将XML文档转换为可处理的结构化数据。XML,全称为eXtensible Markup Language,是一种元语言,用于描述结构化数据,独立于编程语言、操作系统和传输协议。W3C联盟自1996年开始...

    易语言 xml解析 易语言 xml解析 教程 带源码

    易语言XML解析是编程领域中的一个重要主题,尤其对于使用易语言进行开发的程序员来说,理解并掌握XML(可扩展标记语言)的解析方法是至关...通过深入学习和实践,开发者能够熟练运用XML解析技术,实现高效的数据操作。

    C# XML解析方式

    - **简介**:DOM(Document Object Model)是另一种常用的XML解析技术,它将整个XML文档加载到内存中,并构建一个树状结构,允许程序对文档进行任意操作。 - **特点**: - **灵活性高**:可以任意访问和修改文档中的...

    XML解析器示例

    在LabVIEW(Laboratory Virtual Instrument Engineering Workbench)这个强大的图形化编程环境中,XML解析器是处理和操作XML数据的关键工具。本示例主要展示了如何在LabVIEW中实现XML文件的加载、保存和解析。 首先...

    基于XML解析技术的Visio图与应用程序间的数据交互

    3. DOM模型的使用及解析过程:在XML技术中,文档对象模型(DOM)是一个跨平台的接口,它允许程序和脚本动态地访问和更新文档的内容、结构和样式。DOM模型将XML文件以树状结构呈现,每个节点表示XML文件中的一个元素...

    XML解析工具

    读取和设置xml配置文件是最常用的操作,试用了几个C++的XML解析器,个人感觉TinyXML是使用起来最舒服的,因为它的API接口和Java的十分类似,面向对象性很好。 TinyXML是一个开源的解析XML的解析库,能够用于C++,...

    解析xml解析xml解析xml解析xml解析xml

    本篇文章将深入探讨XML解析的基本概念、解析方式以及在实际应用中的重要性。 一、XML的基本结构 1. 元素:XML文档的核心是元素,元素以尖括号 `和 `&gt;` 包裹,如 `&lt;element&gt;`。元素可以包含其他元素、属性和文本。...

    xml 解析 xml 解析几何

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,它以其结构化、自解释...无论是解析配置文件、交换数据还是构建复杂的XML结构,理解并熟练掌握XML解析技术对于任何IT专业人员来说都至关重要。

    Java中四种XML解析技术分析对比

    为了处理XML文档,Java提供了多种解析技术。本篇文章将深入探讨四种主要的XML解析技术——DOM、SAX、StAX以及JAXB,并进行详细的分析与对比。 1. DOM(Document Object Model) DOM解析器将整个XML文档加载到内存中...

    XML解析技术是XML应用的关键

    ### XML解析技术是XML应用的关键 #### 概述 随着信息技术的发展,XML(可扩展标记语言)作为一种标准化的数据表示和交换格式,在多个领域得到广泛应用。XML文档具备良好的结构化特性,能够实现跨平台、跨系统的...

    XML应用的基石:XML解析技术

    ### XML应用的基石:XML解析技术 #### 一、引言 XML(可扩展标记语言)作为一种被W3C组织认可的文档数据格式标准,在近年来得到了广泛应用。它源自SGML(标准通用标记语言),保留了SGML的主要功能,同时简化了其...

    java心电图xml解析.zip

    通过研究这个“java心电图xml解析.zip”中的源码,可以深入理解如何在实际项目中应用XML解析技术,以及如何处理特定领域(如医疗)的数据。同时,这也提供了一个学习和实践Java XML解析能力的好机会。

    XML解析和生成工具

    本文将深入探讨XML解析和生成工具的相关知识,以及如何利用提供的`Markup.cpp`和`Markup.h`文件进行操作。 XML的结构: XML文档由一系列元素构成,每个元素都有一个开始标签和结束标签,如 `&lt;tag&gt;` 和 `&lt;/tag&gt;`。...

    几种XML解析技术及工具比较

    本文将深入探讨四种主要的XML解析技术及其工具,并通过对比分析,帮助你选择适合项目需求的XML处理方式。 1. DOM(Document Object Model) DOM是W3C推荐的一种XML和HTML的标准API,它将XML文档视为一个树形结构,...

    iphone开发之xml解析

    在提供的文档中,如"XML解析技术研究.doc"、"DOM和SAX概念的总结.doc"等,可以深入探讨XML解析的细节,包括解析过程、性能比较、错误处理等。"stu_XML_34_1"和"tea_XML2"可能包含XML解析的实例代码,帮助理解实际...

    ios 简单xml解析DEMO绝对可用

    在iOS开发中,XML(eXtensible Markup Language)是一种常用的...记住,实践是最好的老师,动手尝试并理解DEMO中的代码,你将更深入地掌握XML解析技术。遇到问题不要轻易放弃,多研究、多思考,你的技能将会得到提升。

    适合嵌入式系统的开源XML解析器

    "minixml"就是这样一个专为嵌入式系统设计的开源XML解析器,它提供DOM(Document Object Model)支持,使得开发者能够方便地处理XML文档。 minixml的核心特性包括: 1. **轻量级**:minixml设计时考虑了嵌入式系统...

    STM32解析XML

    在本文中,我们将深入探讨如何在STM32F107上使用minixml库解析XML(可扩展标记语言)文档,这对于那些初次尝试在嵌入式环境中处理XML数据的开发者来说,是非常有价值的。 XML是一种通用的数据交换格式,它允许结构...

Global site tag (gtag.js) - Google Analytics