`
sysu_zeh
  • 浏览: 28673 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论

java解析xml之一:使用SAX与DOM

阅读更多

一.概要

  用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
  
  JAXP接口包含了三个包:
  
  (1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
  
  (2)org.xml.sax  用于对XML进行语法分析的事件驱动的XML简单API(SAX)
  
  (3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。

二.实例

1.所需xml文件

Test.xml

  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <books>  
  3.   <book email="zeh2007@126.com">  
  4.   <name>C++编程思想</name>  
  5.   <price>60.0</price>  
  6.   </book>  
  7. </books>  

students.xml

  1. <?xml version="1.0" encoding="gb2312"?>  
  2. <?xml-stylesheet type="text/xsl" href="students.xsl"?>  
  3. <students>  
  4.   <student sn="04378066">  
  5.      <name>ldz</name>  
  6.      <age>23</age>  
  7.   </student>  
  8.   <student sn="04378069">  
  9.      <name>zeh</name>  
  10.      <age>21</age>  
  11.   </student>  
  12. </students>  

 2.将xml文件转化为dom:

  1. package domParser;   
  2.   
  3. import java.io.File;   
  4. import java.io.IOException;   
  5. import javax.xml.parsers.DocumentBuilder;   
  6. import javax.xml.parsers.DocumentBuilderFactory;   
  7. import javax.xml.parsers.ParserConfigurationException;   
  8. import javax.xml.transform.Transformer;   
  9. import javax.xml.transform.TransformerConfigurationException;   
  10. import javax.xml.transform.TransformerException;   
  11. import javax.xml.transform.TransformerFactory;   
  12. import javax.xml.transform.dom.DOMSource;   
  13. import javax.xml.transform.stream.StreamResult;   
  14. //下面主要是org.xml.sax包的类   
  15. import org.w3c.dom.Document;   
  16. import org.w3c.dom.Element;   
  17. import org.w3c.dom.Node;   
  18. import org.w3c.dom.NodeList;   
  19. import org.w3c.dom.Text;   
  20. import org.xml.sax.SAXException;   
  21.   
  22.   
  23. public class DOMConvert {   
  24.   
  25.     public static void main(String[] args) {   
  26.         //DOM解析器的工厂实例   
  27.         DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();   
  28.         try {   
  29.             //从DOM工厂获得DOM解析器   
  30.             DocumentBuilder db=dbf.newDocumentBuilder();   
  31.             //解析XML文档的输入流,得到一个Document   
  32.             Document doc=db.parse(new File("xmlFil/students.xml"));   
  33.             //建立一个XML节点   
  34.             Element eltStu=doc.createElement("student");   
  35.             Element eltName=doc.createElement("name");   
  36.             Element eltAge=doc.createElement("age");   
  37.                
  38.             Text textName=doc.createTextNode("yyr");   
  39.             Text textAge=doc.createTextNode("22");   
  40.                
  41.             eltName.appendChild(textName);   
  42.             eltAge.appendChild(textAge);   
  43.                
  44.             eltStu.appendChild(eltName);   
  45.             eltStu.appendChild(eltAge);   
  46.             eltStu.setAttribute("sn","04378072");   
  47.             //将此节点插入根的孩子中   
  48.             Element root=doc.getDocumentElement();   
  49.             root.appendChild(eltStu);   
  50.             //获取stuent标签节点   
  51.             NodeList nl=root.getElementsByTagName("student");   
  52.             //删除第一个节点   
  53.             root.removeChild(nl.item(0));   
  54.             //获取第一个节点   
  55.             Element eltStuChg=(Element)nl.item(0);   
  56.             //获取age标签节点   
  57.             Node nodeAgeChg=eltStuChg.getElementsByTagName("age").item(0);   
  58.             nodeAgeChg.getFirstChild().setNodeValue("20");   
  59.            
  60.             int len=nl.getLength();   
  61.             for(int i=0;i
  62.                 Element elt=(Element)nl.item(i);   
  63.                 System.out.println("编号:" + elt.getAttribute("sn"));   
  64.                    
  65.                 Node nodeName=elt.getElementsByTagName("name").item(0);   
  66.                 Node nodeAge=elt.getElementsByTagName("age").item(0);   
  67.                    
  68.                 String name=nodeName.getFirstChild().getNodeValue();   
  69.                 String age=nodeAge.getFirstChild().getNodeValue();   
  70.                    
  71.                 System.out.println("姓名:"+name);   
  72.                 System.out.println("年龄:" + age);   
  73.                    
  74.                 System.out.println("--------------------");   
  75.             }   
  76.             //实例化一个转换工厂   
  77.             TransformerFactory tff=TransformerFactory.newInstance();   
  78.             //获取一个转换实例   
  79.             Transformer tf=tff.newTransformer();   
  80.             //设置输出属性   
  81.             tf.setOutputProperty("encoding","gb2312");   
  82.             //根据Document对象新建一个DOM数据源   
  83.             DOMSource source=new DOMSource(doc);   
  84.             //定义输出流   
  85.             StreamResult result=new StreamResult(new File("convert.xml"));   
  86.             //从数据源转换至输出流   
  87.             tf.transform(source,result);   
  88.         }   
  89.         catch (ParserConfigurationException e) {   
  90.             e.printStackTrace();   
  91.         }    
  92.         catch (SAXException e) {   
  93.             e.printStackTrace();   
  94.         }    
  95.         catch (IOException e) {   
  96.             e.printStackTrace();   
  97.         }    
  98.         catch (TransformerConfigurationException e) {   
  99.             e.printStackTrace();   
  100.         }   
  101.         catch (TransformerException e) {   
  102.             e.printStackTrace();   
  103.         }   
  104.     }   
  105. }

3.解析DOM树

  1. package domParser;   
  2.   
  3. import java.io.FileInputStream;   
  4. import java.io.FileNotFoundException;   
  5. import java.io.IOException;   
  6. import java.io.InputStream;   
  7. import javax.xml.parsers.DocumentBuilder;   
  8. import javax.xml.parsers.DocumentBuilderFactory;   
  9. import javax.xml.parsers.ParserConfigurationException;   
  10. //下面主要是org.xml.sax包的类   
  11. import org.w3c.dom.Document;   
  12. import org.w3c.dom.Element;   
  13. import org.w3c.dom.Node;   
  14. import org.w3c.dom.NodeList;   
  15. import org.xml.sax.SAXException;   
  16.   
  17.   
  18. public class DomParser {   
  19.   
  20.     public DomParser() {   
  21.         //DOM解析器的工厂实例   
  22.         DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();   
  23.         try {   
  24.             //从DOM工厂获得DOM解析器   
  25.             DocumentBuilder dombuilder=domfac.newDocumentBuilder();   
  26.             //把要解析的XML文档转化为输入流   
  27.             InputStream is=new FileInputStream("Test.xml");   
  28.             //解析XML文档的输入流,得到一个Document   
  29.             Document doc=dombuilder.parse(is);   
  30.             //得到XML文档的根节点   
  31.             Element root=doc.getDocumentElement();   
  32.             //得到节点的子节点   
  33.             NodeList books=root.getChildNodes();   
  34.             if(books!=null) {   
  35.                 for(int i=0;i
  36.                     Node book=books.item(i);   
  37.                     if(book.getNodeType()==Node.ELEMENT_NODE) {   
  38.                         //取得节点的属性值   
  39.                         String email=book.getAttributes().getNamedItem("email").getNodeValue();   
  40.                         System.out.println(email);   
  41.                         //轮循子节点   
  42.                         for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()) {   
  43.                             if(node.getNodeType()==Node.ELEMENT_NODE) {   
  44.                                 if(node.getNodeName().equals("name")) {   
  45.                                     String name=node.getNodeValue();   
  46.                                     node.setNodeValue("Java编程思想");   
  47.                                     String name1=node.getFirstChild().getNodeValue();   
  48.                                     System.out.println(name);   
  49.                                     System.out.println(name1);   
  50.                                 }   
  51.                                 if(node.getNodeName().equals("price")) {   
  52.                                     String price=node.getFirstChild().getNodeValue();   
  53.                                     System.out.println(price);   
  54.                                 }   
  55.                             }   
  56.                         }   
  57.                     }   
  58.                 }   
  59.             }   
  60.         }    
  61.         catch (ParserConfigurationException e) {   
  62.             e.printStackTrace();   
  63.         }    
  64.         catch (FileNotFoundException e) {   
  65.             e.printStackTrace();   
  66.         }    
  67.         catch (SAXException e) {   
  68.             e.printStackTrace();   
  69.         }    
  70.         catch (IOException e) {   
  71.             e.printStackTrace();   
  72.         }   
  73.     }   
  74.     public static void main(String[] args)    
  75.     {   
  76.         new DomParser();   
  77.     }   
  78. }  

4.打印DOM树

  1. package domParser;   
  2.   
  3. import java.io.File;   
  4. import java.io.IOException;   
  5. import javax.xml.parsers.DocumentBuilder;   
  6. import javax.xml.parsers.DocumentBuilderFactory;   
  7. import javax.xml.parsers.ParserConfigurationException;   
  8. //下面主要是org.xml.sax包的类   
  9. import org.w3c.dom.*;   
  10. import org.xml.sax.SAXException;   
  11.   
  12. public class DOMPrinter{   
  13.     //打印指定节点(节点名:节点值)   
  14.     public static void printNodeInfo(Node node){   
  15.         System.out.println(node.getNodeName()+" : "+node.getNodeValue());   
  16.     }   
  17.     //递归打印全部节点   
  18.     public static void printNode(Node node){   
  19.         short nodeType=node.getNodeType();   
  20.         //判断节点类型   
  21.         switch(nodeType){   
  22.             //前缀节点   
  23.             case Node.PROCESSING_INSTRUCTION_NODE:   
  24.                 System.out.println("-----------PI start-----------");   
  25.                 printNodeInfo(node);   
  26.                 System.out.println("-----------PI end-----------");   
  27.                 break;   
  28.             //元素节点   
  29.             case Node.ELEMENT_NODE:   
  30.                 System.out.println("-----------Element start-----------");   
  31.                 printNodeInfo(node);   
  32.                 System.out.println("-----------Element end-----------");   
  33.                 //打印节点属性值   
  34.                 NamedNodeMap attrs=node.getAttributes();   
  35.                 int attrNum=attrs.getLength();   
  36.                 for(int i=0;i
  37.                     Node attr=attrs.item(i);   
  38.                     System.out.println("-----------Attribute start-----------");   
  39.                     printNodeInfo(attr);   
  40.                     System.out.println("-----------Attribute end-----------");   
  41.                 }   
  42.                 break;   
  43.             //文本节点   
  44.             case Node.TEXT_NODE:   
  45.                 System.out.println("-----------Text start-----------");   
  46.                 printNodeInfo(node);   
  47.                 System.out.println("-----------Text end-----------");   
  48.                 break;   
  49.             default:   
  50.                 break;   
  51.         }   
  52.         //递归打印节点信息   
  53.         Node child=node.getFirstChild();   
  54.         while(child!=null){   
  55.             printNode(child);   
  56.             child=child.getNextSibling();   
  57.         }   
  58.     }   
  59.        
  60.     public static void main(String[] args){   
  61.         //DOM解析器的工厂实例   
  62.         DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();   
  63.         try{   
  64.             //从DOM工厂获得DOM解析器   
  65.             DocumentBuilder db=dbf.newDocumentBuilder();   
  66.             //解析XML文档的输入流,得到一个Document   
  67.             Document doc=db.parse(new File("students.xml"));   
  68.             //打印节点   
  69.             printNode(doc);   
  70.         }   
  71.         catch (ParserConfigurationException e){   
  72.             e.printStackTrace();   
  73.         }   
  74.         catch (SAXException e){   
  75.             e.printStackTrace();   
  76.         }   
  77.         catch (IOException e){   
  78.             e.printStackTrace();   
  79.         }   
  80.     }   
  81. }  

 

分享到:
评论
1 楼 Java小菜哈 2011-07-04  
大哥,你有没有试过的,解析DOM数的时候还是个死循环。

相关推荐

    Java使用sax、dom、dom4j解析xml文档

    Java提供了多种解析XML的API,包括SAX(Simple API for XML)、DOM(Document Object Model)以及DOM4J。下面我们将详细探讨这些解析方式及其在实际开发中的应用。 1. SAX解析器: SAX是一种基于事件驱动的解析器,...

    Java解析XML文件的DOM和SAX方式.doc

    Java 解析 XML 文件的 DOM 和 SAX 方式是指在 Java 中使用 Document Object Model(DOM)和 Simple API for XML(SAX)两种方式来解析 XML 文件的技术。下面将详细介绍这两种方式的原理、实现和优缺点。 DOM 方式 ...

    XML.rar_XML SAX_XML java_dom xml_java xml_java解析xml

    Java作为一种强大的编程语言,提供了多种处理XML的API,如DOM、SAX和StAX等。本篇文章将重点讲解XML在Java中的解析方式,特别是DOM和SAX解析。 1. DOM解析: DOM(Document Object Model)是W3C推荐的一种处理XML...

    java解析xml数据---sax解析器

    Java解析XML数据主要涉及到的是对XML文档的读取和处理,SAX(Simple API for XML)解析器是一种基于事件驱动的解析方式,适用于处理大型XML文件。与DOM(Document Object Model)解析器不同,SAX不需要一次性加载...

    SAX解析XML文件实例

    一个项目同时用dom解析和sax解析xml文件貌似会报错,项目框架建一直是用sax和dom4j解析xml文件的。当我用dom解析xml文件。导入包后就报错识别不了xml文件的编码格式。于是做了一个sax解析xml文件的实例

    XML-java.rar_XML SAX_sax_sax xml_sax 解析 xml_xml using dom

    本压缩包文件“XML-java.rar”包含了关于使用Java解析XML的实例,特别强调了SAX解析器的使用,并且提到了使用JDOM和JOM4J这两个Java库来处理XML。 1. **DOM解析**:DOM是一种树型结构,它将整个XML文档加载到内存中...

    解析XML的dom、sax和dom4j的jar包

    在Java中,解析XML有多种方法,主要包括DOM、SAX和DOM4J。下面将详细介绍这三种解析方式及其对应的jar包。 1. DOM (Document Object Model) DOM是一种基于树形结构的XML解析方法,它将整个XML文档加载到内存中,...

    java xml 4 种 解析xml 方法 sax jdom dom stAX

    下面将详细介绍这四种解析XML的方法。 1. SAX(Simple API for XML) SAX是一种事件驱动的解析器,它不会一次性加载整个XML文档到内存中,而是逐行读取,当遇到文档中的元素、属性等时,会触发相应的事件处理器方法...

    XML的四种解析器(dom,sax,jdom,dom4j)原理及性能比较,超详细

    DOM4J 是一个基于 Java 的 XML 解析器,提供了与 DOM 相似的 API,但是性能更好。DOM4J 解析器的优点是: * 性能更好,占用内存较少 * 提供了与 DOM 相似的 API,易于使用 然而,DOM4J 解析器也存在一些缺点: * ...

    dom4j下sax解析xml

    在提供的“analysis_xml”项目中,很可能包含了一个示例,演示了如何使用dom4j的SAX解析器解析XML文件。这样的测试项目有助于理解SAX解析的工作原理,并在实际开发中应用。 总结起来,dom4j库提供了DOM和SAX两种XML...

    java 解析XML性能对比分析Demo

    本文将深入探讨几种不同的XML解析方法,并通过实际的“Java解析XML性能对比分析Demo”来展示它们的性能差异。我们将讨论DOM、SAX、JDOM、DOM4J和JAXB这五种解析器,以及它们各自的特点和适用场景。 1. DOM(文档...

    java操作xml dom dom4j sax jdom

    例如,使用`DocumentBuilderFactory`创建`DocumentBuilder`,然后用`parse()`方法解析XML文件,最后通过`getElementsByTagName()`等方法访问节点。 2. SAX(Simple API for XML) 与DOM不同,SAX是基于事件驱动的...

    java 解析xml 多级

    以下是一个使用Java DOM解析XML的步骤: 1. 引入必要的库: 需要引入`javax.xml.parsers`包,包含DOM解析器的主要类。 2. 创建解析器工厂: 使用`DocumentBuilderFactory`创建一个解析器工厂实例,然后通过`...

    Sax解析XML文件解析

    总结,SAX解析XML是一种高效且节省内存的处理方式,适用于处理大量XML数据。通过实现回调接口,我们可以根据XML文档的结构执行相应的操作,而无需一次性加载整个文件。了解并熟练掌握SAX解析技术,有助于我们在处理...

    JAVA读XML:sax,dom,jdom,dom4j的比较以及选择.doc

    它在解析XML文件时,会按顺序触发一系列事件,如开始元素、结束元素等,用户需要自定义事件处理器来响应这些事件。SAX的优点在于它不需要一次性将整个XML文件加载到内存,内存消耗相对较小,适合处理大型XML文档。但...

    j2ee10:xml01:dom解析和sax解析

    本主题主要探讨两种解析XML的方法:DOM(Document Object Model)解析和SAX(Simple API for XML)解析。 首先,DOM解析是一种将整个XML文档加载到内存中的解析方式,它构建了一个树形结构,允许开发者通过节点层级...

    JAVA 解析XML生成XML文档实例

    JAVA 解析XML和生成XML文档源码。比较全 1.DOM生成和解析XML文档 2.SAX生成和解析XML文档 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML

    Java解析XML文档(二):sax读取xml文件导出excel

    本文将深入讲解如何使用SAX(Simple API for XML)解析XML文档,并将解析结果导出到Excel文件中。SAX是一种事件驱动的解析方式,相比DOM(Document Object Model)解析,它更节省内存,适用于处理大型XML文件。 ...

Global site tag (gtag.js) - Google Analytics