`
seaizon
  • 浏览: 145129 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

XML解析技术研究(转)(一)

    博客分类:
  • java
阅读更多

摘要 XML 作为过去十年中出现的最流行的技术之一,得到了广泛的应用,而其中 XML 解析技术是 XML 应用的关键。本文介绍了 XML 解析技术的研究动向,分析和比较了 4 XML 解析技术的优劣,并归纳总结了应用系统设计中选取合适的 XML 解析技术的原则。

1  引言

XML(eXtensible Markup Language ,可扩展标记语言 ) 是由 World Wide Web 联盟 (W3C) 定义的元语言,即一种关于语言的语言。 XML 的设计源于 SGML (Standard Generalized Markup Language ,标淮通用标记语言 ) ,是 SGML 的子集,其目的是为了促进 Internet 上结构化文档的交换。简单的说, XML 是一组规则和准则的集合,用于以无格式文本来描述结构化数据 [1] 1996 W3C 联盟就开始从事 XML 的标准化工作,并于 1998 2 10 发布了 XML1.0

XML 的出现给分布式计算领域带来了重大影响,其力量源于它的数据独立性 [1] XML 是纯数据描述,与编程语言、操作系统或传输协议无关,从而将数据从以代码为中心的基础结构所产生的约束中解放出来,让数据能够在 Web 上更自由的流通。

然而 XML 本身只是以纯文本对数据进行编码的一种格式,要想利用 XML ,或者说利用 XML 文件中所编码的数据,必须先将数据从纯文本中解析出来,因此,必须有一个能够识别 XML 文档中信息的解析器,用来解释 XML 文档并提取其中的数据。然而,根据数据提取的不同需求,又存在着多种解析方式,不同的解析方式有着各自的优缺点和适用环境。选择合适的 XML 解析技术能够有效提升应用系统的整体性能,因此,了解和区分各种不同的 XML 解析技术就显得尤为重要。

2  XML 解析技术分析

所有的 XML 处理都从解析开始,无论是使用 XSLT Java 语言,第一步都是要读入 XML 文件,解码结构和检索信息等等,这就是解析,即把代表 XML 文档的一个无结构的字符序列转换为满足 XML 语法的结构化组件的过程。

2.1 XML 解析技术的分类

根据从 XML 中获取数据的简易性,性能和最终所得到的数据模型的不同, XML 解析技术大致可分为以下四类:

1)       面向文档的流式解析;

2)       面向文档的对象式解析;

3)       面向文档的指针式解析;

4)       面向应用的对象式解析;

这四类解析技术分别处于不同的抽象层次,适用于不同的应用场景,有着各自的优缺点。针对具体的应用需求,选择合适的解析技术,往往能够减少内存消耗,缩短处理时间,更方便地获取数据,提高应用系统的整体性能。

2.2 面向文档的流式解析技术

流式解析是一种基于事件的解析过程,解析器顺序读取 XML 文档,产生一个对应的事件流,并向事件处理程序发送所捕获的各种事件,如元素开始和元素结束等,而事件处理程序则通过不同的方法处理这些事件。

流式解析是将 XML 文档作为一个数据流来处理,因此,它具有类似于流媒体的优点,能够立即开始读取数据,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,不需要将整个文档一次加载到内存中,使得在处理大型文档时具有较好的时间和空间上的效率。然而效率的代价是易用性的降低,流式解析编程较为复杂,程序员需要负责更多的操作。并且由于应用程序没有以任何方式存储数据,所以使得更改数据或在数据流中往后移是不可能的。再加上它的单遍解析特性,意味着它也不支持随机访问。

流式解析又分为两种解析方式:推式解析 (SAX) 和拉式解析 (StAX) 。这两种方式的主要区别在于是由解析器还是应用程序控制读循环 ( 读入文件的循环 )

2.2.1 推式解析 (SAX 解析技术 )

SAX(Simple API for XML) 解析技术就是一种推式解析,在这种解析方式中,解析器控制着读循环,在文档结束之前控制权不会返回给应用程序 [3] 。解析器通过回调的方式进行数据处理。

SAX 提供了一个用于处理 XML 的,基于事件驱动的简单 API 。它的设计开始于 XML-DEV 邮件列表成员间的讨论,他们开发出的第一个接口草案 SAX1.0 1998 1 月发布,其后在 2000 5 月发布了 SAX2.0 ,目前最新版本是 2004 4 月发布的 SAX2.0.2 SAX 没有经过官方的标准机构认可,它不由 W3C 联盟或其它任何官方机构维护 ( 现在, SAX David Megginson 维护 ) [4] ,但它被广泛使用并视为 XML 社区事实上的标准。 SAX 最初是为 Java 而定义的,但也可以用于 Python Perl C++ 等其它语言。

SAX 是基于事件驱动的,即 SAX 解析器在读取 XML 文档的过程中生成一个事件流,并且对于每个事件通过回调事件处理程序中相应的方法来进行处理。比如元素开始和结束标记,元素内容,实体,语法分析错误等事件。针对下面的简单 XML 文档,所产生的事件如图 1 所示,注意针对元素内的空格或回车也会生成一个文本事件。

1 SAX 解析器生成的事件

SAX 中的核心事件处理程序是一个实现了 ContentHandler 接口的类。此接口中定义了处理与 XML 文档本身关联的事件的方法,如 startDocument endDocument startElement endElement Characters

SAX 解析技术具有所有流式解析技术的优点和缺点,但是由于在整个解析过程中,解析器掌握着控制权直到文档结束,应用程序很难在获得所需的部分数据后停止解析过程 ( 可以通过抛出异常的方式终止解析过程,但较为复杂,而且终止后也无法继续解析过程 ) ,因此产生了由应用程序掌握控制权的拉式解析方式。

2.2.2 拉式解析 (StAX 解析技术 )

StAX(Streaming API for XML) 解析技术是一种拉式解析,在这种解析方式中,应用程序控制着读循环。循环中,应用程序负责反复调用解析器获得下一个事件,直到文档结束。通过保留解析过程的控制权,可以简化调用代码来准确地处理它预期的内容,并且可随时停止解析。此外,由于该方式没有基于处理程序回调,应用程序也不需要像 SAX 中那样模拟解析器的状态。

StAX 针对同样的 XML 文档所获得事件类型和 SAX 基本相同,但是 StAX 包含了两套处理 XML API :基于指针的 API 和基于迭代器的 API ,分别提供了不同程度的抽象 [5]

基于指针的 API 简单的返回事件,此时事件用数值形式来表示。这是一种低层 API ,没有提供底层 XML 结构的抽象,所有的状态信息直接从流读取器获得,不需要创建额外的对象。从而节约内存,拥有较高的效率。

而较为高级的基于迭代器的 API 则以对象方式返回事件,每个事件对象都封装了它所表示的特定 XML 结构固有的信息,因此可直接利用其方法获得属于该结构的信息,但也需要额外的对象创建开销。相对于基于指针的 API ,基于迭代器的 API 具有更多的面向对象特征,因此更便于应用于模块化的体系结构。

StAX 也是用 Java 定义的,其 StAX1.0 2004 3 月发布,并且成为了 JSR-173 规范,最新版本为 2006 6 月发布的 StAX1.2 StAX 作为用 Java 语言处理 XML 的最新标准,比早期出现的 XPP (Xml Pull Parser) 拉式解析器功能更为强大,也得到了更为广泛的应用。

2.3 面向文档的对象式解析技术

由于流式解析方式固有的无法更改数据和不支持随机访问特性,尤其是没有对 XML 文档的结构建模,使得应用程序很难对 XML 文档进行搜索、修改、添加和删除等操作。为了解决这些问题,产生了面向文档的对象式解析技术 --DOM

DOM(Document Object Model) 是用与平台和语言无关的方式对 XML 文档进行建模的官方 W3C 标准 [6] ,其目标是提供一个可以通用于各种程序语言、操作系统和应用程序的接口。 DOM 最初被当作 Web 浏览器识别和处理页面元素的方式 , 即在 W3C 介入之前的功能,称为“ DOM Level 0 W3C 1998 10 月提出了“ DOM Level 1 建议,支持 XML1.0 HTML 处理。随后于 2000 11 月提出了“ DOM Level 2 建议,对 Level 1 进行了扩展,支持 XML1.0 、命名空间和 CSS ,也支持用户接口和树形操作事件,并且添加了 DOM 树形操作功能。最新的“ DOM Level 3 建议于 2003 6 月提出,在 level 2 的基础上添加了对 DTD XML 模式和 XPath 的支持 [1]

DOM 作为一种对象式解析技术,定义了层次化对象模型来表示 XML 文档。即为 XML 语法中的每个概念 ( 如元素,属性,实体,文档等 ) 定义对应的类,而解析器在读入 XML 文档的时候,会建立 XML 语法和类之间的一一映射。实际上, DOM 的层次化对象模型是一个树形结构,它将一个 XML 文档看作一棵节点树,每个节点代表一个 XML 文档中的元素。 DOM 的基本节点对象有 5 [1] (1)Document 对象:是树的最高节点,也是对整个文档操作的入口; (2)Element Attr 对象:对文档中元素和元素属性的映射; (3)Text 对象:作为 Element Attr 对象的子节点,代表了元素或属性的文本内容; (4)NodeList 对象:对节点按指定的方式进行遍历。

例如对于 2.2.1 中的 XML 文档,其对应的 DOM 节点树如下图所示 ( 注意元素内的空格或回车也会被当作文本对象 )

2 DOM 节点树 ( 矩形框表示元素节点,椭圆表示文本节点 )

利用 DOM 在内存中建立的完整的 XML 文档的树形结构,开发人员就可以方便的对 XML 文档进行一系列操作,如遍历、增加、删除、修改文档内容等,且具有良好的导航能力。同时 DOM 所具有的对象特性也非常便于面向对象编程。然而,由于 DOM 在使用数据前需要完整的遍历 XML 文档,在内存中构建树形结构表示,因此需要消耗大量的内存,尤其是对于大型文档,性能下降的很快。而且必须一次解析整个 XML 文档,不可能只做部分解析,当只关注 XML 文档的小部分数据时,效率很低。 (Axis2 项目中的 Axiom 对象模型实现了对 XML 文档的部分解析,可构建不完整的节点树,但实现较为复杂 )

由于 DOM 是与语言无关的,当 DOM 接口进入指定语言的数据结构时,会产生不必要的复杂性,无法利用语言本身的优势。因此出现了许多与 DOM 类似的针对特定语言的对象模型。如 JDOM 就是针对 Java 的特定文档对象模型, JDOM 使用具体类而不使用接口,简化了 API ,并在 API 中大量使用了 Java 集合类。 DOM4J 则是 JDOM 的一种智能分支,它提供了对 XPath XML Schema 的支持,并且通过 DOM4J API 和标准 DOM 接口使其具有并行访问功能 [5] 。它们都属于面向文档的对象式解析技术。

2.4 面向文档的指针式解析技术

前面提到的面向文档的流式解析效率较高,但易用性差,而对象式解析易用性强,却效率较低,这两种方式似乎处于两个极端。其效率问题主要在于两种方式都是提取解析模式,即解析时,提取一部分源文件,一般来说是一个字符串,然后在内存中进行解析构建。这种解析模式注定了需要大量的创建和销毁对象,而且还存在更新效率问题,在 DOM (SAX 并不支持更新 ) ,每一次改动都需要将 DOM 模型重新完整的解析成 XML 字符串,原文件并没有被利用,即 DOM 并不支持增量更新。为了解决这些问题,提出了一种较新颖的指针式解析技术,即 VTD-XML

VTD-XML 是一种无提取的 XML 解析方法,它较好的解决了 DOM 占用内存过大的缺点,并且还提供了快速的解析与遍历、对 XPath 的支持和增量更新等特性。 VTD-XML 是一个开源项目,目前有 Java C 两种平台支持,第一个版本是 2004 6 月发布的 VTD-XML0.5 ,其 VTD- XML1.0 版本于 2005 10 月发布,最新的版本为 2007 10 月发布的 VTD-XML2.2

VTD(Virtual Token Descriptor ,虚拟令牌描述符 ) 是一个 64bits 长度的数值类型,记录了每个元素的起始位置,长度,深度以及令牌的类型等信息,如图 3 所示。 64bits 固定长度使得可以用数组这种高效的结构来组织 VTD ,大幅提高性能。 VTD 是实现无提取解析的关键,它类似于 XML 文档中元素的指针,通过它可以快速定位到某个元素。

3 VTD 记录的比特层格式

令牌开始偏移量 ( 即相对于 XML 文档头部的距离 ) 30 bits ,也就是说它能解析的最大文件是 1G 。令牌长度为 20 bits ,即一个令牌的最大长度是 1M 。令牌类型 4bits ,说明支持 16 种词汇类型。

为了实现无提取这个目的, VTD-XML 将原 XML 文件原封不动的以二进制的方式读进内存,不做解码,然后在这个比特数组上解析每个元素的位置并把一些信息,如 XML 令牌的开始偏移量、长度、深度和令牌类型,记录下来,保存为 VTD 数组,之后的遍历操作便可在 VTD 数组上进行。如果需要提取 XML 内容,就查找 VTD 数组,利用 VTD 记录中的位置等信息在原始比特数组上进行解码并返回字符串。

而且 VTD-XML 还可以高效的实现增量更新,例如,如果想在一个大型 XML 文档中找出一个节点元素并删除它,那么只需要找到这个元素的 VTD ,将这个 VTD VTD 数组中删除,然后再利用所有的 VTD 写出到另一个二进制数组中就可以了,因为删除的 VTD 标明了要删除的元素的位置,所以在新写入的二进制数组中就不会出现这段元素了。用 VTD 写入新的二进制数组的过程实际上就是一个二进制数组的拷贝过程,其效率是非常高的 [2]

由此可见, VTD 很好的解决了前两种解析方式的缺点,通过其巧妙的设计使得在解析 XML 文档时内存占用少,效率高,并且还能够实现 XML 文档的快速解析与遍历、提供对 XPath 的支持。 VTD 的出现是 XML 解析技术的一大进步,会对 XML 解析技术的发展产生巨大影响。

2.5 面向应用的对象式解析技术

前面所谈到的三种解析技术都是从 XML 的角度来处理文档和建立模型,这对于主要关心文档的 XML 结构的应用程序来说是适用的,但是有很多应用程序仅仅将 XML 作为数据交换的媒介,它们更关心的是文档数据本身。此时,面向应用的对象式解析 ( 或称为 XML 数据绑定 ) 可以使应用程序在很大程度上忽略 XML 文档的实际结构,而直接使用文档的数据内容。

数据绑定是指将数据从一些存储媒介 ( XML 文档、文本文件和数据库 ) 中取出,并通过应用程序表示这些数据的过程,即把数据绑定到虚拟机能够理解并且可以操作的某种内存中的结构 [9] 。数据绑定并不是一个新鲜的概念,其在关系数据库上早已得到了广泛的应用,如 Hibernate 就是针对数据库的轻量级数据绑定框架。而针对 XML 数据绑定的 Castor 框架在 2000 年就已经出现,目前已经涌现出了许多类似的框架,如 JBind JAXB JiBX Quick Zeus 等。

其中 JAXB(Java Architecture for XML Binding) 是一个处于不断发展中的应用于 Java 平台的数据绑定框架,提供了一套在 XML 文档和 Java 对象之间自动映射的 API ,符合 JSR31--XML 数据绑定规范( XML Data Binding Specification )。该项目始于 1999 8 月,由 Java Community Process 开发,其 1.0 版本于 2002 10 月发布,目前最新版本为 2007 9 17 发布的 JAXB2.1.5

如图 4 ,显示了数据绑定在数据库和 XML 文档中的应用。

4 数据绑定

在数据绑定中有三个重要概念 [9]

l        编组 (Marshalling) :把内存中的数据转换到存储介质中的过程。在 Java XML 环境中,编组就是把一些 Java 对象转化为一个 ( 或多个 )XML 文档。其核心就在于把 Java 中的面向对象结构转化成适用于 XML 的扁平结构。

l        解组 (Unmarshalling) :把数据从存储媒介转换到内存中的过程。 Java XML 环境中 ,即将 XML 文档解组到 Java 虚拟机中,其复杂性在于从数据到 Java 代码变量的映射。

l        映射 (Mapping) :用于编组和解组的一套规则。

初看起来 XML 数据绑定和面向文档的对象式解析较为相似,都在内存中构建文档表示,同时内部表示和标准的 XML 文档之间可以互相转换。但两者之间的不同在于文档模型尽可能接近的保存 XML 的文档结构,而数据绑定只关心应用程序使用的文档数据 [7] 。如图 5 所示,同一个 XML 文档的文档模型和数据绑定模型是完全不同的。

5 文档模型和数据绑定模型比较

如果应用程序使用文档模型方法,那么获得所需要的数据就必须在节点树中根据父子节点关系进行遍历。而使用数据绑定方法,只需进行正常的 Java 编程,访问数据更加容易,速度也比文档模型快得多。而且, XML 数据绑定并不只是简化编程,由于它把许多文档细节抽象出来,所以数据绑定所需的内存通常少于文档模型所需的内存,如上图中,文档模型方法使用了 10 个单独的对象,而数据绑定才使用 2 个。此外,由于要构建的对象少得多,所以为 XML 文档构建数据绑定表示还可能更快 [7]

XML 数据绑定中最为核心的是怎样由 XML 文档生成 Java 对象。目前有两种方式:映射绑定方式和代码生成方式 [8] 。在映射绑定方式中,构建自己的 Java 类,并向绑定框架指定这些类如何与 XML 文档相关联。如框架 Castor Quick 就支持这种方式。而代码生成方式则根据 XML 文档结构 ( DTD Schema 形式的文法 ) 自动构建相应的 Java 类,如 JAXB Castor JBind 提供了根据 XML 文档的 Schema 描述生成 Java 代码, Quick Zeus 可根据 DTD 描述生成 Java 代码。

代码生成方式所构造的类可以包括完整的数据类型信息,还能够对所构造的类进行验证。但该方式使得程序代码和文档结构之间紧密耦合,如果文档结构发生变化,就需要重新生成代码。而映射绑定方式则具有更大的灵活性,其使用自己构建的对象类将数据和行为组合在一起,通过修改映射定义 ( 而不是改变应用程序代码 ) 来处理 XML 文档结构中的微小变化,可以在一定程度上解除对象类与实际 XML 文档之间的耦合 [8] 。其缺点在于需要编写较为复杂的映射文件。

 

2.6 四种 XML 解析技术的特性比较

根据以上对四种 XML 解析技术的介绍和分析,对其特性进行总结和比较,如下表所示:

1 XML 解析技术特性比较


3  XML
解析技术的选取

通过上述对四种 XML 解析技术的分析,可以大致看出 XML 解析技术的发展历程,在不同的时期,针对不同的应用需求,产生了不同的解析技术。这些解析技术具有各自的优缺点,在应用中,如何选择正确的解析技术,往往成为提高应用系统整体性能和效率的关键。

3.1 面向文档与面向应用的解析方式的选取

上述的四种解析技术又可分为两类:面向文档的和面向应用的。如果应用程序只是将 XML 文档作为数据交换的媒介,关心文档中包含的数据胜于关心文档的 XML 结构,那么选择面向应用的解析方式将能够在数据获取上得到很大的简化,虽然在效率上有点损失,但相对于整个应用系统的模块化设计是值得的。

相反,如果应用程序真正关心文档结构的细节,如编写一个 XML 文档编辑器,又或应用程序正在处理的 XML 文档不遵守固定的结构,那么选择面向文档的解析方式不仅能够提高效率, 还可以降低编程的复杂性。

 

3.2 面向文档的解析方式的选取

在面向文档的三种解析方式中,流式解析和对象式解析是出现较早的两种解析方式,提供了不同层面上的解析抽象。

流式解析是一种低级的解析方式,它能够提供比对象式解析更多的控制,并且效率更高。然而,由于流式解析没有对文档结构进行建模,使得很难对文档进行搜索、修改、添加和删除等操作,而且也无法进行随机访问。因此如果应用程序仅仅想高效率的获得 XML 文档中的某部分数据,并且希望对解析过程进行更多的控制,而不需要对文档进行添加和修改,那么选取流式解析更能满足需求。在流式解析中, StAX 技术使得应用程序能够更方便的控制解析过程,并且其作为 Java 的官方规范,得到了更广泛的应用。

对象式解析作为一种高级的解析方式,它的重点在于对文档结构进行建模,而完全不关心文档的解析过程 ( 对象式解析往往建立在流式解析的基础上,在流式解析的过程中逐步建立模型 ) 。而一旦在内存中建立了文档的树形结构模型,那么就可以方便的通过模型对文档进行搜索,修改、添加和删除等操作,并且更适合于面向对象的编程。然而,这种便利性是以内存和效率为代价的,因此,如果应用程序需要频繁的对 XML 文档中的数据进行检索和修改,而对内存和效率没有过多要求,那么对象式解析将是一种很好的选择。

而指针式解析的提出是以提高效率,减少内存消耗为主要目的,可看作是介于流式解析和对象式解析之间的一种解析方式。它巧妙的设计方式使得不需要对文档建立树形模型,就可以实现搜索,修改、添加和删除等操作,同时向应用程序屏蔽了底层的解析过程,编程更加简便。因此,当应用程序不关心解析过程,而对性能有较高要求时,可以选择使用指针式解析。

3.2.1 面向文档解析方式的性能比较

根据 VTD-XML 的官方网站的数据 [11] VTD-XML 的解析速度是 DOM 5x-10x ,是 SAX(with NULL content handler) 1.5x - 2.0x With NULL content handler 意味着 SAX 解析中没有插入任何额外的处理逻辑,也就是 SAX 的最高速度)。 VTD-XML 的内存占用仅为原 XML 1.3x-1.5x (其中 1.0x 部分是原 XML ),而 DOM 的内存占用则是原 XML 4x-8x ,对于一些大型的 XML 文档,使用 DOM 方式处理往往会出现内存溢出的错误。

以下是 SAX DOM VTD-XML 三种 XML 解析方式的性能测试结果 [10] ,如下表 所示:


2 SAX DOM VTD-XML 性能比较

 

 

分享到:
评论

相关推荐

    XML解析技术研究XML解析技术研究

    XML解析技术是XML应用的核心,它涉及将XML文档转换为可处理的结构化数据。XML,全称为eXtensible Markup Language,是一种元语言,用于描述结构化数据,独立于编程语言、操作系统和传输协议。W3C联盟自1996年开始...

    java心电图xml解析.zip

    通过研究这个“java心电图xml解析.zip”中的源码,可以深入理解如何在实际项目中应用XML解析技术,以及如何处理特定领域(如医疗)的数据。同时,这也提供了一个学习和实践Java XML解析能力的好机会。

    iphone开发之xml解析

    在提供的文档中,如"XML解析技术研究.doc"、"DOM和SAX概念的总结.doc"等,可以深入探讨XML解析的细节,包括解析过程、性能比较、错误处理等。"stu_XML_34_1"和"tea_XML2"可能包含XML解析的实例代码,帮助理解实际...

    MusicXML 解析与布局

    MusicXML是一种开放标准的音乐符号交换格式,它允许数字音乐...总之,"MusicXML解析与布局"项目涵盖了XML解析、数据结构设计、图形渲染、音乐理论等多个方面的知识,对于深入理解音乐和计算机科学的结合具有重要意义。

    ios 简单xml解析DEMO绝对可用

    在iOS开发中,XML(eXtensible Markup Language)是一种常用的...记住,实践是最好的老师,动手尝试并理解DEMO中的代码,你将更深入地掌握XML解析技术。遇到问题不要轻易放弃,多研究、多思考,你的技能将会得到提升。

    XML解析器————

    7. **性能优化**:Xerces-J通过一系列的优化技术提高了XML解析速度,包括高效的内存管理、缓存策略和代码优化。 8. **API兼容性**:Xerces-J保持与其他版本的API兼容,使得升级和迁移更为简便。 9. **源码可用**:...

    XML解析技术研究.caj

    本文档在某知名网站下载,要么引用次数最多,要么最新,保证精品,至少为你节约3RMB。格式为CAJ或者KDH需要专业阅读器打开

    XML解析代码实现.rar

    本资源"XML解析代码实现.rar"提供了一些关于XML解析的实践代码,有助于开发者深入理解这一技术。 XML文档结构由元素(Element)、属性(Attribute)、文本内容(Text Content)等组成。元素是XML文档的核心,它们...

    易语言XML解析|扩展界面一|操作系统界面功能|扩展功能一|XP风格

    综上所述,这个主题涵盖了易语言中的XML解析技术、界面定制、操作系统交互以及扩展功能开发等多个方面,这些都是易语言编程中不可或缺的知识点。通过学习和掌握这些,开发者可以构建功能强大、用户体验优秀的易语言...

    PB做标准XML解析器

    在标签中,“pb XML 数组”进一步强调了PowerBuilder与XML解析以及数组操作相关的技术点。在PowerBuilder中,处理XML通常涉及以下步骤: 1. **加载XML文档**:首先,需要使用PowerBuilder内置的XML类或者第三方库...

    XML和Java解析技术

    ### XML与Java解析技术知识点概览 #### 一、课程目标 ...以上内容为XML与Java解析技术课程的主要知识点概览,旨在为学习者提供一个全面且系统的框架,帮助他们在实践中更好地理解和运用这些技术。

    iPhone IOS XML解析源代码

    本资源"iPhone iOS XML解析源代码"提供了一个深入学习和比较XML解析技术的实例,包含两种不同的解析方法,旨在帮助开发者了解它们的性能差异。 首先,我们来探讨第一种解析方式:NSXMLParser。这是Apple提供的内置...

    xml解析源码.zip

    通过研究这个“xml解析源码”,开发者可以深入理解XML解析的底层实现,学习如何处理XML文档的各种复杂情况,以及如何构建高效、健壮的解析库。这将有助于提升软件开发能力,特别是在处理XML数据时。

    python脚本用于xml解析的源代码

    Python是一种强大的编程语言,尤其在处理数据和文本解析方面表现出色。XML(eXtensible Markup Language)是一种广泛应用的数据...通过研究这个项目,你可以提升你的XML解析技能,并了解如何在实际工作中应用这些技术。

    IOS应用源码——XML解析.rar

    在本文中,我们将深入探讨iOS中的XML解析技术,并通过相关知识点的详细讲解,帮助你理解和掌握这一技能。 首先,XML是一种标记语言,它定义了数据结构和内容,广泛用于存储和传输数据。在iOS应用中,XML数据通常...

    基于XML配置解析的车辆电子FlexRay总线通信技术的研究.pdf

    基于XML配置解析的车辆电子FlexRay总线通信技术的研究.pdf

    xml解析 文件同步 完整代码

    本文将详细讲解XML解析、Socket通信以及文件同步的相关知识点,结合一个Java实现的FileServer和FileClient项目,特别是涉及到的`xmlresolver`和`filebroadcast`类。 **XML解析** XML解析是将XML文档转换为可读取和...

    java 实现的对大型xml解析器

    Java实现的大型XML解析器是针对处理体积庞大的XML文件而设计的一种高效解析技术。XML(eXtensible Markup Language)是一种用于标记数据的通用标准,广泛应用于数据交换、配置文件和文档存储等领域。由于XML文件可能...

Global site tag (gtag.js) - Google Analytics