第一种:DOM。
DOM的全称是Document Object Model,也即文档对象模型。在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树),应用程序正是通过对这个对象模型的操作,来实现对XML文档数据的操作。通过DOM接口,应用程序可以在任何时候访问XML文档中的任何一部分数据,因此,这种利用DOM接口的机制也被称作随机访问机制。
DOM接口提供了一种通过分层对象模型来访问XML文档信息的方式,这些分层对象模型依据XML的文档结构形成了一棵节点树。无论XML文档中所描述的是什么类型的信息,即便是制表数据、项目列表或一个文档,利用DOM所生成的模型都是节点树的形式。也就是说,DOM强制使用树模型来访问XML文档中的信息。由于XML本质上就是一种分层结构,所以这种描述方法是相当有效的。
DOM树所提供的随机访问方式给应用程序的开发带来了很大的灵活性,它可以任意地控制整个XML文档中的内容。然而,由于DOM分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档比较大或者结构比较复杂时,对内存的需求就比较高。而且,对于结构复杂的树的遍历也是一项耗时的操作。所以,DOM分析器对机器性能的要求比较高,实现效率不十分理想。不过,由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合,同时鉴于随机访问所带来的方便,因此,DOM分析器还是有很广泛的使用价值的。
- import java.io.File;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import org.w3c.dom.Document;
- import org.w3c.dom.Element;
- import org.w3c.dom.NodeList;
- public class DomTest1
- {
- public static void main(String[] args) throws Exception
- {
- // step 1: 获得dom解析器工厂(工作的作用是用于创建具体的解析器)
- DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
- // System.out.println("class name: " + dbf.getClass().getName());
- // step 2:获得具体的dom解析器
- DocumentBuilder db = dbf.newDocumentBuilder();
- // System.out.println("class name: " + db.getClass().getName());
- // step3: 解析一个xml文档,获得Document对象(根结点)
- Document document = db.parse(new File("candidate.xml"));
- NodeList list = document.getElementsByTagName("PERSON");
- for(int i = 0; i < list.getLength(); i++)
- {
- Element element = (Element)list.item(i);
- String content = element.getElementsByTagName("NAME").item(0).getFirstChild().getNodeValue();
- System.out.println("name:" + content);
- content = element.getElementsByTagName("ADDRESS").item(0).getFirstChild().getNodeValue();
- System.out.println("address:" + content);
- content = element.getElementsByTagName("TEL").item(0).getFirstChild().getNodeValue();
- System.out.println("tel:" + content);
- content = element.getElementsByTagName("FAX").item(0).getFirstChild().getNodeValue();
- System.out.println("fax:" + content);
- content = element.getElementsByTagName("EMAIL").item(0).getFirstChild().getNodeValue();
- System.out.println("email:" + content);
- System.out.println("--------------------------------------");
- }
- }
- }
- import java.io.File;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import org.w3c.dom.Attr;
- import org.w3c.dom.Comment;
- import org.w3c.dom.Document;
- import org.w3c.dom.Element;
- import org.w3c.dom.NamedNodeMap;
- import org.w3c.dom.Node;
- import org.w3c.dom.NodeList;
- /**
- * 使用递归解析给定的任意一个xml文档并且将其内容输出到命令行上
- * @author zhanglong
- *
- */
- public class DomTest3
- {
- public static void main(String[] args) throws Exception
- {
- DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
- DocumentBuilder db = dbf.newDocumentBuilder();
- Document doc = db.parse(new File("student.xml"));
- //获得根元素结点
- Element root = doc.getDocumentElement();
- parseElement(root);
- }
- private static void parseElement(Element element)
- {
- String tagName = element.getNodeName();
- NodeList children = element.getChildNodes();
- System.out.print("<" + tagName);
- //element元素的所有属性所构成的NamedNodeMap对象,需要对其进行判断
- NamedNodeMap map = element.getAttributes();
- //如果该元素存在属性
- if(null != map)
- {
- for(int i = 0; i < map.getLength(); i++)
- {
- //获得该元素的每一个属性
- Attr attr = (Attr)map.item(i);
- String attrName = attr.getName();
- String attrValue = attr.getValue();
- System.out.print(" " + attrName + "=\"" + attrValue + "\"");
- }
- }
- System.out.print(">");
- for(int i = 0; i < children.getLength(); i++)
- {
- Node node = children.item(i);
- //获得结点的类型
- short nodeType = node.getNodeType();
- if(nodeType == Node.ELEMENT_NODE)
- {
- //是元素,继续递归
- parseElement((Element)node);
- }
- else if(nodeType == Node.TEXT_NODE)
- {
- //递归出口
- System.out.print(node.getNodeValue());
- }
- else if(nodeType == Node.COMMENT_NODE)
- {
- System.out.print("<!--");
- Comment comment = (Comment)node;
- //注释内容
- String data = comment.getData();
- System.out.print(data);
- System.out.print("-->");
- }
- }
- System.out.print("</" + tagName + ">");
- }
- }
第二种:SAX
SAX的全称是Simple APIs for XML,也即XML简单应用程序接口。与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读写XML数据的方式。当使用SAX分析器对XML文档进行分析时,会触发一系列事件,并激活相应的事件处理函数,应用程序通过这些事件处理函数实现对XML文档的访问,因而SAX接口也被称作事件驱动接口。
- import java.io.File;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.helpers.DefaultHandler;
- public class SaxTest1
- {
- public static void main(String[] args) throws Exception
- {
- //step1: 获得SAX解析器工厂实例
- SAXParserFactory factory = SAXParserFactory.newInstance();
- //step2: 获得SAX解析器实例
- SAXParser parser = factory.newSAXParser();
- //step3: 开始进行解析
- parser.parse(new File("student.xml"), new MyHandler());
- }
- }
- class MyHandler extends DefaultHandler
- {
- @Override
- public void startDocument() throws SAXException
- {
- System.out.println("parse began");
- }
- @Override
- public void endDocument() throws SAXException
- {
- System.out.println("parse finished");
- }
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException
- {
- System.out.println("start element");
- }
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException
- {
- System.out.println("finish element");
- }
- }
- import java.io.File;
- import java.util.Stack;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.helpers.DefaultHandler;
- public class SaxTest2
- {
- public static void main(String[] args) throws Exception
- {
- SAXParserFactory factory = SAXParserFactory.newInstance();
- SAXParser parser = factory.newSAXParser();
- parser.parse(new File("student.xml"), new MyHandler2());
- }
- }
- class MyHandler2 extends DefaultHandler
- {
- private Stack<String> stack = new Stack<String>();
- private String name;
- private String gender;
- private String age;
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException
- {
- stack.push(qName);
- for(int i = 0; i < attributes.getLength(); i++)
- {
- String attrName = attributes.getQName(i);
- String attrValue = attributes.getValue(i);
- System.out.println(attrName + "=" + attrValue);
- }
- }
- @Override
- public void characters(char[] ch, int start, int length)
- throws SAXException
- {
- String tag = stack.peek();
- if("姓名".equals(tag))
- {
- name = new String(ch, start,length);
- }
- else if("性别".equals(tag))
- {
- gender = new String(ch, start, length);
- }
- else if("年龄".equals(tag))
- {
- age = new String(ch, start, length);
- }
- }
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException
- {
- stack.pop(); //表示该元素已经解析完毕,需要从栈中弹出
- if("学生".equals(qName))
- {
- System.out.println("姓名:" + name);
- System.out.println("性别:" + gender);
- System.out.println("年龄:" + age);
- System.out.println();
- }
- }
- }
第三种JDOM:
JDOM是一个开源项目,它基于树型结构,利用纯Java的技术对XML文档实现解析、生成、序列化以及多种操作。(http://jdom.org)
•JDOM 直接为JAVA编程服务。它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念等),把SAX和DOM的功能有效地结合起来。
•JDOM是用Java语言读、写、操作XML的新API函数。在直接、简单和高效的前提下,这些API函数被最大限度的优化。
jdom创建xml
- import java.io.FileWriter;
- import org.jdom.Attribute;
- import org.jdom.Comment;
- import org.jdom.Document;
- import org.jdom.Element;
- import org.jdom.output.Format;
- import org.jdom.output.XMLOutputter;
- public class JDomTest1
- {
- public static void main(String[] args) throws Exception
- {
- Document document = new Document();
- Element root = new Element("root");
- document.addContent(root);
- Comment comment = new Comment("This is my comments");
- root.addContent(comment);
- Element e = new Element("hello");
- e.setAttribute("sohu", "www.sohu.com");
- root.addContent(e);
- Element e2 = new Element("world");
- Attribute attr = new Attribute("test", "hehe");
- e2.setAttribute(attr);
- e.addContent(e2);
- e2.addContent(new Element("aaa").setAttribute("a", "b")
- .setAttribute("x", "y").setAttribute("gg", "hh").setText("text content"));
- Format format = Format.getPrettyFormat();
- format.setIndent(" ");
- // format.setEncoding("gbk");
- XMLOutputter out = new XMLOutputter(format);
- out.output(document, new FileWriter("jdom.xml"));
- }
- }
JDOM解析xml
- import java.io.File;
- import java.io.FileOutputStream;
- import java.util.List;
- import org.jdom.Attribute;
- import org.jdom.Document;
- import org.jdom.Element;
- import org.jdom.input.SAXBuilder;
- import org.jdom.output.Format;
- import org.jdom.output.XMLOutputter;
- public class JDomTest2
- {
- public static void main(String[] args) throws Exception
- {
- SAXBuilder builder = new SAXBuilder();
- Document doc = builder.build(new File("jdom.xml"));
- Element element = doc.getRootElement();
- System.out.println(element.getName());
- Element hello = element.getChild("hello");
- System.out.println(hello.getText());
- List list = hello.getAttributes();
- for(int i = 0 ;i < list.size(); i++)
- {
- Attribute attr = (Attribute)list.get(i);
- String attrName = attr.getName();
- String attrValue = attr.getValue();
- System.out.println(attrName + "=" + attrValue);
- }
- hello.removeChild("world");
- XMLOutputter out = new XMLOutputter(Format.getPrettyFormat().setIndent(" "));
- out.output(doc, new FileOutputStream("jdom2.xml"));
- }
- }
Dom4j
- import java.io.FileOutputStream;
- import java.io.FileWriter;
- import org.dom4j.Document;
- import org.dom4j.DocumentHelper;
- import org.dom4j.Element;
- import org.dom4j.io.OutputFormat;
- import org.dom4j.io.XMLWriter;
- public class Test1
- {
- public static void main(String[] args) throws Exception
- {
- // 创建文档并设置文档的根元素节点 :第一种方式
- // Document document = DocumentHelper.createDocument();
- //
- // Element root = DocumentHelper.createElement("student");
- //
- // document.setRootElement(root);
- // 创建文档并设置文档的根元素节点 :第二种方式
- Element root = DocumentHelper.createElement("student");
- Document document = DocumentHelper.createDocument(root);
- root.addAttribute("name", "zhangsan");
- Element helloElement = root.addElement("hello");
- Element worldElement = root.addElement("world");
- helloElement.setText("hello");
- worldElement.setText("world");
- helloElement.addAttribute("age", "20");
- XMLWriter xmlWriter = new XMLWriter();
- xmlWriter.write(document);
- OutputFormat format = new OutputFormat(" ", true);
- XMLWriter xmlWriter2 = new XMLWriter(new FileOutputStream("student2.xml"), format);
- xmlWriter2.write(document);
- XMLWriter xmlWriter3 = new XMLWriter(new FileWriter("student3.xml"), format);
- xmlWriter3.write(document);
- xmlWriter3.close();
- }
- }
- import java.io.File;
- import java.util.Iterator;
- import java.util.List;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import org.dom4j.Document;
- import org.dom4j.Element;
- import org.dom4j.io.DOMReader;
- import org.dom4j.io.SAXReader;
- public class Test2
- {
- public static void main(String[] args) throws Exception
- {
- SAXReader saxReader = new SAXReader();
- Document doc = saxReader.read(new File("student2.xml"));
- Element root = doc.getRootElement();
- System.out.println("root element: " + root.getName());
- List childList = root.elements();
- System.out.println(childList.size());
- List childList2 = root.elements("hello");
- System.out.println(childList2.size());
- Element first = root.element("hello");
- System.out.println(first.attributeValue("age"));
- for(Iterator iter = root.elementIterator(); iter.hasNext();)
- {
- Element e = (Element)iter.next();
- System.out.println(e.attributeValue("age"));
- }
- System.out.println("---------------------------");
- DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
- DocumentBuilder db = dbf.newDocumentBuilder();
- org.w3c.dom.Document document = db.parse(new File("student2.xml"));
- DOMReader domReader = new DOMReader();
- //将JAXP的Document转换为dom4j的Document
- Document d = domReader.read(document);
- Element rootElement = d.getRootElement();
- System.out.println(rootElement.getName());
- }
- }
- import java.io.FileWriter;
- import org.jdom.Attribute;
- import org.jdom.Document;
- import org.jdom.Element;
- import org.jdom.output.Format;
- import org.jdom.output.XMLOutputter;
- public class Test3
- {
- public static void main(String[] args) throws Exception
- {
- Document document = new Document();
- Element root = new Element("联系人列表").setAttribute(new Attribute("公司",
- "A集团"));
- document.addContent(root);
- Element contactPerson = new Element("联系人");
- root.addContent(contactPerson);
- contactPerson
- .addContent(new Element("姓名").setText("张三"))
- .addContent(new Element("公司").setText("A公司"))
- .addContent(new Element("电话").setText("021-55556666"))
- .addContent(
- new Element("地址")
- .addContent(new Element("街道").setText("5街"))
- .addContent(new Element("城市").setText("上海"))
- .addContent(new Element("省份").setText("上海市")));
- XMLOutputter output = new XMLOutputter(Format.getPrettyFormat()
- .setIndent(" ").setEncoding("gbk"));
- output.output(document, new FileWriter("contact.xml"));
- }
- }
相关推荐
总结来说,Java提供了多种解析XML的方法,包括DOM、SAX和JAXB等。对于处理多级嵌套的XML,DOM和JAXB在操作上更为便捷,而SAX则适用于处理大规模文件。在具体选择时,应根据项目需求和资源限制进行权衡。
JAVA 解析xml多种方法 JAVA 解析xml多种方法 JAVA 解析xml多种方法 JAVA 解析xml多种方法 JAVA 解析xml多种方法 JAVA 解析xml多种方法 JAVA 解析xml多种方法
在Java中,有多种方式可以解析XML文档,主要包括DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。每种方法都有其优缺点,适用于不同的场景。 1. DOM解析:DOM是将整个...
### Java解析XML字符串 在给定的代码示例中,我们看到了如何使用JDOM库来解析一个XML字符串,并对其进行操作。下面我们将详细解析这个过程: 1. **初始化XML源**:首先,将XML字符串转化为`StringReader`对象,这...
在Java中,有多种方式可以解析XML文件,主要包括DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。 **DOM解析:** DOM解析器将整个XML文件加载到内存中,形成一个树形...
目前,Java 中有多种 XML 解析技术,但哪一种最适合我们呢?在这篇文章中,我们将对 Java 中四种主流的 XML 解析技术进行比较和分析。 一、 DOM(JAXP Crimson 解析器) DOM 是一种基于树或基于对象的 XML 解析...
Java 可以使用多种方式来解析 Word 文档,包括使用 Apache POI 库、Java2Word 库等。然而,这些库都有其自己的局限性,例如 POI 库只能获取 Word 文档中的书签,而不能进行操作。Java2Word 库可以实现 Word 文档的...
在Java中,有多种方式可以解析XML文档,包括DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。下面我们将详细探讨这些解析方法以及相关的API。 1. DOM解析器:DOM解析器...
在 Java 中,解析 XML 文件是一件常见的任务,而 JDOM 是一个流行的开源库,用于解析和处理 XML 文件。本文将详细介绍如何使用 JDOM 解析 XML 文件。 JDOM 介绍 JDOM 是一个开源项目,基于树型结构,利用纯 Java ...
在Java中,我们可以使用`javax.xml.parsers.DocumentBuilderFactory`和`javax.xml.parsers.DocumentBuilder`来创建并解析XML文档。例如: ```java DocumentBuilderFactory factory = DocumentBuilderFactory.new...
Java提供了多种库来处理XML,如DOM(文档对象模型)、SAX(简单API for XML)和StAX(流式API for XML)。对于大量数据,SAX和StAX通常比DOM更高效,因为它们不需要一次性加载整个XML文档到内存中。DOM适合小到中等...
总的来说,“Java解析XML.zip”提供的这两个库为Java开发者提供了强大的XML处理能力,使他们能够在Java应用程序中方便地解析、操作和查询XML数据。通过学习和掌握DOM4J和JAXEN,开发者可以更高效地处理XML任务,提升...
Java在线解析XML是一种常见的编程任务,特别是在处理Web服务、数据交换或者从XML文件中提取信息时。XML(Extensible Markup Language)是一种结构化数据格式,它允许数据以自定义的标签进行组织,使得数据的传输和...
本篇文章将重点讲解XML在Java中的解析方式,特别是DOM和SAX解析。 1. DOM解析: DOM(Document Object Model)是W3C推荐的一种处理XML文档的标准模型。它将整个XML文档加载到内存中,构建一个树形结构,允许开发者...
Java提供了多种解析XML的技术,包括DOM(Document Object Model)、SAX(Simple API for XML)以及本文将详细介绍的StAX(Streaming API for XML)。StAX是一种基于事件驱动的API,适用于大量或流式XML数据的处理。 ...
在Java中,有多种方式来解析XML,主要包括DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。 1. DOM解析:DOM将整个XML文档加载到内存中,创建一个树形结构,允许开发者...
Java作为一门流行的编程语言,提供了多种方式来解析XML文档,以便开发者能够有效地读取、操作和转换XML数据。本文将深入探讨Java解析XML的各种方法及其应用场景,旨在为读者提供全面而深入的理解。 ### Java解析XML...
在Java中,有多种库可用于解析XML,如DOM(Document Object Model),SAX(Simple API for XML),以及StAX(Streaming API for XML)。 1. DOM解析:它加载整个XML文档到内存中,创建一个树形结构,允许开发者在...
为了处理XML文档,Java提供了多种解析XML的方法,包括DOM(Document Object Model)、SAX(Simple API for XML)和StAX(Streaming API for XML)。本文将详细介绍如何创建一个Java通用的XML解析工具类,以便于在...
Java作为一款强大的编程语言,提供了多种方式来解析XML文档,以提取其中的数据或进行相关操作。本文将深入探讨Java解析XML的四种主要方法。 1. DOM(Document Object Model)解析: DOM解析器将整个XML文档加载到...