`

网络传输数据解析(SAX)

阅读更多

    来到公司时间已经快有五个月了,虽然在整个公司不算什么老员工,但是在我们Android组已经差不多算是最初的了,呵呵,距离元老级的还差的远啊,不仅是时间,更是技术。
    最近,公司不断扩大Android组,所以又见到了新的面孔,而我们的PM也给我们分配了一个小小的任务,给新人讲解Android知识,不仅是对过去的总结,也是对新人的跟快的直接的知道。我的分配任务其实算最少的,也就是网络解析XML数据,本来我以为是通过不同的方法:DOM/SAX/PULL。但是鉴于实用性所以只是让我们做SAX方面的总结并且做出PPT,模版也给我们了,好了,不扯淡了,现在就开始SAX解析XML的总结。
   
|--所用到的关键字:XML/SAX
    XML:(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。
    SAX:SAX(simple API for XML)是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM,SAX 可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂。
|--对比SAX和DOM解析XML
    |--JAVA 解析 XML 通常有两种方式:DOM 和SAX。DOM(文档对象模型)是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题。
    |--手机的内存本来就小,考虑性能和充分利用资源的条件下,所以在做手机开发的时候我们一般不用DOM解析。
    |--其实Android已经给我们嵌入了PULL了,我们不需要再添加第三方jar包来支持,我们在以后再说,其实PULL和SAX解析很相似,都是轻量级的解析。
    |--SAX和DOM优缺点比较
        SAX:优点:
        1、逐行扫描文档,一边扫描一边解析
        2、可以在解析文档的任意时刻来停止解析
        SAX:缺点:
        1、操作复杂
        2、添加或删除内容比较麻烦
       
        DOM:优点
        1、全部装载内存,对各个节点的操作灵活
        2、对于节点的添加于删除比较方便灵活
        3、简单,便于操作
        DOM:缺点
        1、消耗内存
        2、需要全部转载到内存才可以解析,如果文件大的话,时间和内存都够呛
|--SAX的工作原理
    SAX,它既是一个接口,也是一个软件包.但作为接口,SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
   
    大多数SAX都会产生以下类型的事件:
  1.在文档的开始和结束时触发文档处理事件。
  2.在文档内每一XML元素接受解析的前后触发元素事件。
  3.任何元数据通常由单独的事件处理
  4.在处理文档的DTD或Schema时产生DTD或Schema事件。
  5.产生错误事件用来通知主机应用程序解析错误。
   
    |--SAX解析文档过程举例
        对于一个XML文档举例来说
          <doc>
      <para>Hello,World!</para>
      </doc>
      其解析的过程为:
      1.start document
      2.start element:doc......
      3.start element:para.....
      4.characters:Hello,World!
      5.end element:para......
      6.end element;doc......
      7.end document
    |--对于解析过程中的每一步都会有事件发生,都会触发相应接口中的事件处理程序。
        编写程序的步骤为:
        (1)创建事件处理程序(也就是编写ContentHandler的实现类,一般继承自DefaultHandler类,采用adapter模式)
        (2)创建SAX解析器
        (3)将事件处理程序分配到解析器
        (4)对文档进行解析,将每个事件发送给事件处理程序
    |--SAX 模型
        过程:
      1.首先SAXParserFactory来创建一个SAXParserFactory实例
      SAXParserFactory factory = SAXParserFactory.newInstance();
      2.根据SAXParserFactory实例来创建SAXParser
      3.SAXParser产生SAXReader
      XMLReader reader = factory.newSAXParser().getXMLReader();
      4.XMLReader 加载XML,然后解析XML,在解析的过程中触发相对于接口中的事件处理程序
    |--SAX接口介绍
      |--ContentHandler接口 (主要用到的接口)
          ContentHandler是Java类包中一个特殊的SAX接口,位于 org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。
          ContentHandler接口的方法有以下几种:
          void startDocument()
          void endDocument()
          void startElement(String uri, String localName, String qName, Attributes atts)
          void endElement(String uri, String localName, String qName)
          void characters(char[ ] ch, int start, int length)
      |--DTDHandler接口
            DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。
              DTDHandler接口包括以下两个方法
              void startDocumevoid notationDecl(String name, String publicId, String systemId) nt()
              void unparsedEntityDecl(String name, String publicId, String systemId, String notationName)
      |--EntityResolver接口
          EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。
          该接口只有一个方法,如下:
          public InputSource resolveEntity(String publicId, String systemId)
          解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。
      |--ErrorHandler接口
          ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。
          该接口的方法如下:
          void error(SAXParseException exception)
          void fatalError(SAXParseException exception)
          void warning(SAXParseException exception)

分享到:
评论

相关推荐

    Android网络之数据解析----SAX方式解析XML数据

    总结,Android网络数据解析中,SAX解析XML是一种高效的处理方式,尤其适用于处理大型或结构复杂的XML数据。通过创建自定义的ContentHandler并监听XML解析事件,开发者可以实现灵活且高效的XML数据处理逻辑。在实际...

    SAX解析网络编程

    在IT行业中,网络编程是构建分布式系统和网络应用的基础,而数据解析则是处理网络传输信息的关键环节。SAX(Simple API for XML)是一种基于事件驱动的XML解析方式,它在网络编程中扮演着重要角色,特别是在处理大型...

    Sax解析XML文件解析

    在IT领域,XML(eXtensible Markup Language)是一种用于存储和传输数据的标准化格式,广泛应用在各种系统间的数据交换、配置文件以及Web服务中。SAX(Simple API for XML)是XML解析的一种方法,它以事件驱动的方式...

    天气预报接口,通过sax 解析接口数据

    本案例主要涉及的是一个天气预报接口,该接口返回的数据格式为XML,我们使用SAX(Simple API for XML)进行解析。接下来,我们将深入探讨天气预报接口、SAX解析以及如何处理XML数据。 首先,天气预报接口是一个API...

    android使用SAX解析xml

    在Android开发中,XML(可扩展标记语言)是一种常见的数据交换格式,用于传输和存储数据。SAX(Simple API for XML)是一种事件驱动的解析器,...在实际项目中,可以根据需求定制解析逻辑,实现灵活的数据解析和处理。

    XML通过sax解析JSON格式

    XML(eXtensible Markup Language)和JSON(JavaScript Object Notation)是两种广泛使用的数据交换格式,它们在Web服务和应用程序之间传输数据时起到关键作用。XML是一种结构化语言,而JSON更轻量级,通常用于前端...

    Sax解析xml文件

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,广泛应用于软件开发、Web服务和数据交换等领域。在Android和Java编程中,处理XML文件是常见的任务,而SAX(Simple API for XML)是一种轻量...

    Android XML解析之SAX解析

    在处理大量数据或网络传输时,SAX解析是很好的选择。不过,对于结构简单的XML,DOM或Pull解析可能会更简单易用。 通过SaxXmlDemo这个示例项目,你可以看到如何将以上步骤结合到实际应用中,运行示例以了解SAX解析的...

    sax解析xml尤其是获取元素的值或者内容

    在IT行业中,XML(eXtensible Markup Language)是一种用于存储和传输数据的标准化格式,尤其在Web服务、配置文件和数据交换等领域广泛应用。SAX(Simple API for XML)是XML解析的一种方式,它采用事件驱动模型,...

    SAX解析XML实例

    在IT行业中,XML(eXtensible Markup Language)是一种用于存储和传输数据的标准化格式,尤其在Web应用程序、配置文件和数据交换中广泛使用。理解如何解析XML文档是开发过程中的重要技能。本篇我们将深入探讨SAX...

    android xml 的解析 sax dom pull 解析

    XML(eXtensible Markup Language)是一种用于存储和交换数据的标记语言,广泛应用于Android应用程序中,用于存储配置、数据传输等。在Android开发中,有三种主要的XML解析技术:SAX(Simple API for XML)、DOM...

    SDcard数据访问SAX解析XML文件

    XML(eXtensible Markup Language)是一种结构化数据格式,广泛用于存储和传输数据。本话题将深入探讨如何在Android系统中利用SAX(Simple API for XML)解析XML文件,并将这些数据存取到SD卡上。 首先,让我们理解...

    dom4j下sax解析xml

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标准格式,广泛应用于Web应用程序、配置文件、数据交换等领域。DOM(Document Object Model)和SAX(Simple API for XML)是两种主要的XML解析方法。在...

    SAX对xml文档进行解析

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,广泛应用于Web服务、配置文件、数据交换等领域。在处理大型XML文件时,由于内存限制,我们通常选择流式解析方法,如SAX(Simple API for XML...

    XML的两种解析sax和dom

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,广泛应用于Web应用程序、数据交换和配置文件等领域。在处理XML文档时,有两大主流解析方式:SAX(Simple API for XML)和DOM(Document ...

    Android XML解析 SAX DOM Pull

    XML(eXtensible Markup Language)是用于存储和传输数据的一种结构化格式,广泛应用于Android应用开发中。在Android中,有三种主要的XML解析方式:SAX(Simple API for XML)、DOM(Document Object Model)和Pull ...

    DOM和SAX解析XML文档

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,广泛应用于Web应用程序、数据交换和配置文件等领域。解析XML文档是理解和操作这些数据的关键步骤,主要有两种主要方法:DOM(Document ...

    SAX解析XML源码

    XML(eXtensible Markup Language)是一种用于标记数据的语言,广泛应用于网络数据交换和应用程序间的数据传输。在Android开发中,处理XML数据时,我们常常会遇到两种主要的解析方式:DOM(Document Object Model)...

    SAX类解析XML

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,广泛应用于Web服务、配置文件和数据交换等领域。在处理大型XML文档时,SAX(Simple API for XML)解析器是一种高效的流式解析方法,它不会一...

    Pull和SAX 解析的实例

    在Android开发中,处理XML数据是常见的任务,而Pull解析器和SAX解析器是两种常用的轻量级、低内存占用的XML解析方式。本文将详细介绍这两种解析方式,并通过一个具体的XmlPullParserDemo实例来深入理解它们的工作...

Global site tag (gtag.js) - Google Analytics