`

JAVA解析XML的几种方法

    博客分类:
  • XML
阅读更多
1. 解析方式 DOM与SAX

目前解析XML有两种方式DOM和SAX,它们的解析原理不相同。

DOM是树形结构解析,解析之前全部加载入内存,适合对XML的随机访问。由于加载到内存,所以处理大型文件时其性能下降的非常厉害。

SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问。

2. JAVA解析XML的4种方法

其中DOM是DOM方式解析, JDOM,DOM4J,SAX是SAX方式解析。一般公司都使用DOM4J和JDOM,因为编码比较简单。

这里介绍简单,可以根据各自需要进行封装。

假设XML的格式为:
<?xml version="1.0" encoding="GB2312" standalone="no"?>
<campany name="maymay">
	<department>
		<name>Human Resource</name>
		<employees>
			<staff>Ying Liu</staff>
			<staff>Hongwei Dai</staff>
			<staff>Fang Liu</staff>
		</employees>
	</department>
</campany>


定义JAVA接口:
package xml;

public interface XmlDocument {
	

	/**
	 * 
	 * @param fileName:文件路径及名称
	 */
	public void createXml(String fileName);

	/**
	 * 
	 * @param fileName:文件路径及名称
	 */
	public void parserXml(String fileName);
}


2.1. DOM方法

所需包已经在JDK中。

package xml;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.PrintWriter;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DomParse implements XmlDocument {
	private Document document;
	private String fileName;

	public DomParse() {
		try {
			DocumentBuilderFactory factory = DocumentBuilderFactory
					.newInstance();
			DocumentBuilder builder = factory.newDocumentBuilder();
			this.document = builder.newDocument();
			
		} catch (ParserConfigurationException e) {
			System.out.println(e.getMessage());
		}
	}

	public void createXml(String fileName) {

		Element root = this.document.createElement("campany");
		root.setAttribute("name", "maymay");
		this.document.appendChild(root);

		Element department = this.document.createElement("department");
		root.appendChild(department);

		Element name = this.document.createElement("name");
		name.appendChild(this.document.createTextNode("Human Resource"));

		department.appendChild(name);

		Element employees = this.document.createElement("employees");
		department.appendChild(employees);

		Element staff1 = this.document.createElement("staff");
		Element staff2 = this.document.createElement("staff");
		Element staff3 = this.document.createElement("staff");
		
		staff1.appendChild(this.document.createTextNode("Ying Liu"));
		staff2.appendChild(this.document.createTextNode("Hongwei Dai"));
		staff3.appendChild(this.document.createTextNode("Fang Liu"));

		employees.appendChild(staff1);
		employees.appendChild(staff2);
		employees.appendChild(staff3);

		TransformerFactory tf = TransformerFactory.newInstance();

		try {
			Transformer transformer = tf.newTransformer();
			DOMSource source = new DOMSource(document);
			transformer.setOutputProperty(OutputKeys.ENCODING, "gb2312");
			transformer.setOutputProperty(OutputKeys.INDENT, "yes");
			PrintWriter pw = new PrintWriter(new FileOutputStream(fileName));
			StreamResult result = new StreamResult(pw);
			transformer.transform(source, result);

		} catch (TransformerConfigurationException e) {
			System.out.println(e.getMessage());
		} catch (IllegalArgumentException e) {
			System.out.println(e.getMessage());
		} catch (FileNotFoundException e) {
			System.out.println(e.getMessage());
		} catch (TransformerException e) {
			System.out.println(e.getMessage());
		}
	}

	public void parserXml(String fileName) {
		try {
			DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
			DocumentBuilder db = dbf.newDocumentBuilder();
			Document document = db.parse(fileName);
			NodeList campanys = document.getChildNodes();
			
			for (int i = 0; i < campanys.getLength(); i++) {
				Node departments = campanys.item(i);
				
				NodeList department = departments.getChildNodes();
				
				for (int j = 0; j < department.getLength(); j++) {
					Node node = department.item(j);
					NodeList meta = node.getChildNodes();
					
					for (int k = 0; k < meta.getLength(); k++) {
						System.out.println(meta.item(k).getNodeName()
								+ ":" + meta.item(k).getTextContent());
					}
				}
			}
			
		} catch (FileNotFoundException e) {
			System.out.println(e.getMessage());
		} catch (ParserConfigurationException e) {
			System.out.println(e.getMessage());
		} catch (SAXException e) {
			System.out.println(e.getMessage());
		} catch (IOException e) {
			System.out.println(e.getMessage());
		}
	}
}


2.2. SAX解析

所需包已经在JDK中。
package xml;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SaxParse implements XmlDocument {
	
	public void createXml(String fileName) {
		System.out.println("<<" + fileName + ">>");
	}

	public void parserXml(String fileName) {
		SAXParserFactory saxfac = SAXParserFactory.newInstance();
		try {
			SAXParser saxparser = saxfac.newSAXParser();
			InputStream is = new FileInputStream(fileName);
			saxparser.parse(is, new MySAXHandler());
		} catch (ParserConfigurationException e) {
			e.printStackTrace();
		} catch (SAXException e) {
			e.printStackTrace();
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

class MySAXHandler extends DefaultHandler {
	boolean hasAttribute = false;
	Attributes attributes = null;

	public void startDocument() throws SAXException {
		System.out.println("begin");
	}

	public void endDocument() throws SAXException {
		System.out.println("end");
	}

	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		if (qName.equals("campany")) {
			return;
		}
		if (attributes.getLength() > 0) {
			this.attributes = attributes;
			this.hasAttribute = true;
		}
	}

	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		if (hasAttribute && (attributes != null)) {
			for (int i = 0; i < attributes.getLength(); i++) {
				System.out.println("--"+attributes.getQName(0)+":"
						+ attributes.getValue(0));
			}
		}
	}

	public void characters(char[] ch, int start, int length)
			throws SAXException {
		System.out.println(new String(ch, start, length));
	}
}



2.3. JDOM解析

需要jdom1.0.jar

package xml;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.List;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;
import org.jdom.output.XMLOutputter;

public class JDomParse implements XmlDocument {

	/**
	 * 
	 */
	public void createXml(String fileName) {
		Document document;
		Element root;
		root = new Element("campany");
		root.setAttribute("name", "MayMay");
		document = new Document(root);

		Element department = new Element("department");
		root.addContent(department);

		Element name = new Element("name");
		name.setText("Human Resource");
		department.addContent(name);

		Element employees = new Element("employees");
		department.addContent(employees);

		Element staff1 = new Element("staff");
		staff1.setText("Ying Liu");
		employees.addContent(staff1);

		Element staff2 = new Element("staff");
		staff2.setText("Hongwei Dai");
		employees.addContent(staff2);

		Element staff3 = new Element("staff");
		staff3.setText("Fang Liu");
		employees.addContent(staff3);

		XMLOutputter XMLOut = new XMLOutputter();
		try {
			XMLOut.output(document, new FileOutputStream(fileName));

		} catch (FileNotFoundException e) {
			e.printStackTrace();

		} catch (IOException e) {
			e.printStackTrace();

		}

	}

	/**
	 * 
	 */
	public void parserXml(String fileName) {
		SAXBuilder builder = new SAXBuilder(false);

		try {
			Document document = builder.build(fileName);
			Element campany = document.getRootElement();

			System.out.println("--campany.name:"
					+ campany.getAttributeValue("name"));

			Element department = campany.getChild("department");

			System.out.println("--department.name:"
					+ department.getChild("name").getText());

			List staffs = department.getChildren("employees");
			System.out.println("--staffs.size:"+staffs.size());
			
			for (int i = 0; i < staffs.size(); i++) {
				
				Element staff = (Element) staffs.get(i);
				System.out.println("--"+staff.getName() + ":"+staff.getValue());
			}
		} catch (JDOMException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}



2.4. DOM4J解析

需要dom4j-1.4.jar

package xml;

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.Writer;
import java.net.MalformedURLException;
import java.util.Iterator;
import java.util.Map;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;


public class Dom4jParse implements XmlDocument {
	
	/**
	 * 
	 */
	public void createXml(String fileName) {
		Document document = DocumentHelper.createDocument();
		
		Element campany = document.addElement("campany");
		campany.setAttributeValue("name", "maymay");
		
		Element department = campany.addElement("department");
		Element name = department.addElement("name");
		name.setText("Human Resource");
		
		Element employees = department.addElement("employees");
		
		Element staff1 = employees.addElement("staff");
		staff1.setText("Ying Liu");
		
		Element staff2 = employees.addElement("staff");
		staff2.setText("Hongwei Dai");
		
		Element staff3 = employees.addElement("staff");
		staff3.setText("Fang Liu");
		
		try {
			Writer fileWriter = new FileWriter(fileName);
			XMLWriter xmlWriter = new XMLWriter(fileWriter);
			xmlWriter.write(document);
			xmlWriter.close();
		} catch (IOException e) {
			System.out.println(e.getMessage());
		}
	}

	public void parserXml(String fileName) {
		File inputXml = new File(fileName);
		SAXReader saxReader = new SAXReader();
		try {
			Document document = saxReader.read(inputXml);
			Element campany = document.getRootElement();
			System.out.println("--campany.name:"+campany.attributeValue("name"));
			
			for (Iterator i = campany.elementIterator(); i.hasNext();) {
				Element department = (Element) i.next();
				
				for (Iterator j = department.elementIterator(); j.hasNext();) {
					Element node = (Element) j.next();
					System.out.println(node.getName() + ":" + node.getStringValue());
				}
			}
		} catch (DocumentException e) {
			System.out.println(e.getMessage());
		} catch (MalformedURLException e) {
			System.out.println(e.getMessage());
		}
	}
}


2.5. 测试
package xml;

public class XMLParseDemo {
	
	public static void main(String[] args){
		//JDomParse jdom = new JDomParse();
		//jdom.createXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
		//jdom.parserXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
		
		//Dom4jParse dom4j = new Dom4jParse();
		//dom4j.createXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
		//dom4j.parserXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
		
		//DomParse dom = new DomParse();
		//dom.createXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
		//dom.parserXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
		
		SaxParse sax= new SaxParse();
		sax.parserXml("G:\\StudyEnviroment\\studyworkspace\\practice\\src\\xml\\Campany.xml");
	}

}
分享到:
评论

相关推荐

    java解析XML的4种经典方法

    Java解析XML的四种经典方法主要涵盖DOM、SAX、StAX和JDOM这四种方式,每种方法都有其独特的优势和适用场景。 1)DOM(JAXP Crimson 解析器) DOM(Document Object Model)是W3C推荐的一种XML解析标准,它将XML...

    java解析XML的四种方式

    ### Java解析XML的四种方式详解 #### 一、DOM(Document Object Model) DOM是一种平台和语言中立的接口,它将XML文档表示为一个树结构,使得程序可以创建、读取、更新或删除树中的元素。DOM实现了W3C的标准,能够...

    Java解析XML的四种方法比较

    Java解析XML时,主要有四种方法:DOM(Document Object Model)、SAX(Simple API for XML)、StAX(Streaming API for XML)以及JAXB(Java Architecture for XML Binding)。这四种方法各有特点,适用于不同的场景...

    java解析xml的4种经典方法

    总结起来,这四种方法各有优势,选择哪种取决于具体需求。DOM适合小型文件,易于操作;SAX适合大型文件,节省内存;StAX提供了流式处理,更加灵活;JDOM则提供了一种更简洁的DOM替代方案。根据实际项目的需求,...

    java的XML四种解析方法汇总

    JAVA xml 的四种解析方式,(1)Dom生成和解析XML文档 (2)SAX生成和解析XML文档(3)DOM4J生成和解析XML文档 (4)JDOM生成和解析XML

    java 解析XML性能对比分析Demo

    本文将深入探讨几种不同的XML解析方法,并通过实际的“Java解析XML性能对比分析Demo”来展示它们的性能差异。我们将讨论DOM、SAX、JDOM、DOM4J和JAXB这五种解析器,以及它们各自的特点和适用场景。 1. DOM(文档...

    java解析xml——dom

    ### Java解析XML——DOM详解 #### 一、DOM解析概念 **Document Object Model (DOM)**是一种平台和语言中立的接口,它允许程序和脚本动态地访问和更新文档的内容、结构和样式。DOM最初是为HTML设计的,但后来也被...

    Java解析XML.zip

    本压缩包“Java解析XML.zip”包含了两个关键的第三方库:jaxen-1.1.1.jar和dom4j-1.6.1.jar,它们是Java解析XML文件的重要工具。 首先,让我们了解一下**DOM4J**。DOM4J是一个强大的Java XML API,它提供了灵活且高...

    Java操作XML几种方法.pdf

    Java操作XML主要涉及三种方法:DOM、SAX和JDOM。每种方法都有其特点和适用场景,下面将详细讲解这三种方法以及它们在处理XML时的工作原理。 1. DOM(Document Object Model)解析: DOM是一种基于树形结构的XML...

    java心电图xml解析.zip

    每种方法都有其优缺点,适用于不同的场景。 1. DOM解析:DOM是将整个XML文档加载到内存中,形成一个树形结构,可以方便地遍历和修改整个文档。但DOM解析器占用内存较大,适合小型或中型XML文件。在心电图数据解析中...

    解析XML文件的四种方式整合

    这四种方法各有优缺点,具体选择取决于应用场景。DOM适合需要频繁查询和修改XML的场景;SAX适用于处理大型文件,但编程复杂度较高;StAX在性能和灵活性之间取得了平衡;JDOM则提供了更友好的API,降低了开发难度。...

    java dom 解析 xml 实例

    Java 中有多种方法可以解析 XML 文档,其中最常用的两种方法是使用基于事件的 XML 简单 API(Simple API for XML,SAX)和基于树和节点的文档对象模型(Document Object Model,DOM)。Sun 公司提供了 Java API for ...

    java解析XML几种方式小结

    【Java解析XML】 在Java中,解析XML文档有多种方式,本文主要总结了四种常见的方法,包括DOM、SAX、StAX以及JAXB。每种方法都有其特点和适用场景,下面逐一介绍。 1. DOM(Document Object Model)解析: DOM是一种...

    Java 解析 Xml

    本文将详细介绍Java中解析XML的几种主要方法,并进行对比,以帮助开发者选择最适合自己的解决方案。 1. DOM(Document Object Model)解析器: DOM解析器将整个XML文档加载到内存中,构建一个树形结构的DOM节点模型...

    关于解析XML的几种方式

    DOM(Document Object Model)是一种基于树形结构的XML文档表示方法,它将XML文档转换为一系列可以被Java或其他编程语言操作的对象。DOM解析器会读取整个XML文档,并在内存中创建一个完整的文档对象模型,这使得...

    java 解析xml类映射数据库 数据库操作 反射机制 源码

    本程序集的核心是利用Java解析XML文件,将XML中的数据映射到数据库,并通过反射机制进行数据库操作。下面将详细阐述这些知识点。 首先,XML解析在Java中通常有两种方式:DOM(Document Object Model)和SAX(Simple...

    java xml文件解析

    在Java中,有多种解析XML文件的方式,包括DOM (Document Object Model)、SAX (Simple API for XML) 和 DOM4J。这些方法各有优势和局限性,选择哪一种取决于具体的应用场景和需求。 #### 二、DOM 解析方式 DOM 解析...

    java解析XML详解.pdf

    本文将详细介绍Java解析XML的几种常用技术。 ### DOM(Document Object Model) DOM是W3C组织推荐的处理XML的一种接口规范。它将XML文档视为一个树形结构,并将文档中的每个元素、属性、注释等都视为树中的一个...

    java解析xml常用的几种方式总结

    本文将总结Java中解析XML的几种主要方法,包括DOM(文档对象模型)、SAX(简单API for XML)和StAX(流式API for XML)。 ### DOM解析 DOM解析器将整个XML文件加载到内存中,创建一个树形结构表示XML文档。这种...

Global site tag (gtag.js) - Google Analytics