`

读取XML的三种方式,及其性能分析和比较(转)

    博客分类:
  • xml
 
阅读更多

我选择了我认为最方便而高效的方式,用DOM的方式解析,就像这样:

XmlDocument xmldoc = new XmlDocument();
xmldoc.Load(...);
string ns = "http://schemas.xmlsoap.org/soap/envelope/";
XmlNode envelope = xmldoc["Envelope",ns];
XmlNode body = envelope["Body",ns];
XmlNode req = body["SyncOrderRelationReq"];
XmlNode linkId = req["LinkID"];
Console.WriteLine(linkId.InnerXml);

有朋友认为用XPath更好。这个我也知道,在XML的整个体系中,XPath是目前查询XML的专用语言,在这种情况下,自然最“标准”。

不过我认为由于XPath多了一个解析XPath表达式的过程,会比较慢,所以用DOM的方式更好。于是写了个性能测试代码,包含DOM, XPath, XmlReader三者的对比,以作证明:

class MainClass
{
 static XmlDocument XmlDoc;
 static XmlNamespaceManager NM;
 static string NS = "http://schemas.xmlsoap.org/soap/envelope/";
 static MemoryStream XmlStream;
 [STAThread]
 static void Main(string[] args)
 {
  XmlStream = new MemoryStream();
  FileStream fs = new FileStream("C:/test.xml",FileMode.Open);
  byte[] bytes = new byte[fs.Length];
  fs.Read(bytes,0,bytes.Length);
  XmlStream.Write(bytes,0,bytes.Length);
  fs.Close();
  XmlDoc = new XmlDocument();
  XmlDoc.Load("C:/test.xml");
  NM = new XmlNamespaceManager(XmlDoc.NameTable);
  NM.AddNamespace("SOAP-ENV", "http://schemas.xmlsoap.org/soap/envelope/");
  NM.AddNamespace("Req", "http://www.monternet.com/dsmp/schemas/");
  DateTime dt1,dt2;
  string linkId;
  dt1 = DateTime.Now;
  for(int i = 0;i < 100000;i++)
  {
   linkId = XPathTest();
  }
  dt2 = DateTime.Now;
  Console.WriteLine("XPathTest: {0}",dt2 - dt1);
  dt1 = DateTime.Now;
  for(int i = 0;i < 100000;i++)
  {
   linkId = DOMTest();
  }
  dt2 = DateTime.Now;
  Console.WriteLine("DOMTest: {0}",dt2 - dt1);
  dt1 = DateTime.Now;
  for(int i = 0;i < 100000;i++)
  {
   linkId = XmlReaderTest();
  }
  dt2 = DateTime.Now;
  Console.WriteLine("XmlReaderTest: {0}",dt2 - dt1);
  XmlStream.Close();
  Console.ReadLine();
 }
 static string XPathTest()
 {
  XmlNode linkId = XmlDoc.SelectSingleNode("/SOAP-ENV:Envelope/SOAP-ENV:Body/Req:SyncOrderRelationReq/Req:LinkID", NM);
  return linkId.InnerXml;
 }
 static string DOMTest()
 {
  XmlNode linkId = XmlDoc["Envelope",NS]["Body",NS]["SyncOrderRelationReq"]["LinkID"];
  return linkId.InnerXml;
 }
 static string XmlReaderTest()
 {
  XmlStream.Position = 0;
  XmlTextReader reader = new XmlTextReader(new StreamReader(XmlStream));
  while(reader.Read() && reader.Name != "SOAP-ENV:Envelope");
  while(reader.Read() && reader.Name != "SOAP-ENV:Body");
  while(reader.Read() && reader.Name != "SyncOrderRelationReq");
  while(reader.Read() && reader.Name != "LinkID");
  return reader.ReadString();
 }
}
 

这个XML文件还包含了名称空间,在比较“正规”的情况下,确实是这种情况。
测试结果是(K8 2800+ 64bit, 512M DDR400):

XPathTest: 00:00:02.8281250
DOMTest: 00:00:00.3750000
XmlReaderTest: 00:00:13.5156250

和我的预期相符,XPath远远慢于DOM的方式,几乎差了一个数量级。

有意思的是,用XmlReader的方式按理说最快,结果这里变成了最慢。实际上,对于最后一个测试,这里有点不公平,因为XmlDocument.Load的时候已经对XML进行了遍历,然后就建立了缓存。而XmlReader每次都需要这种Load的过程,并且没有缓存。如果把加载XML的时间考虑在内,XmlReader才是最快的。另外一个方面,由于它是一种只进只读的方式,使用XmlReader可以节省内存;而对于特别大的XML文件,比如达到数百M,XmlReader就成了唯一可行的方案。

-----

update on 4/14/2005:
今天我感觉到把DOM方式和XPath方式区分开,这个名字不太好,因为用XPath查询时,本质上也是用DOM的。所以上面第二个测试,DOMTest,应该称之为手动在DOM导航的测试,而XPathTest,相当于提供一个命令,像SQL语句那样动态编译后,自动在DOM导航。

update on 4/19/2005:
处理XML里面的名称空间确实是个很麻烦的问题,在上面的例子里面,使用了XmlNamespaceManager类来处理。而在XSL/T里面,又有个小技巧(还是基于那个XML):

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xmlns:xsd="http://www.w3.org/2001/XMLSchema"
 xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/"
 xmlns:SOAP-ENC="http://schemas.xmlsoap.org/soap/encoding/"
 xmlns:REQ="http://www.monternet.com/dsmp/schemas/">
 <xsl:output method="xml" />
 <xsl:template match="/">
  <xsl:value-of select="SOAP-ENV:Envelope/SOAP-ENV:Body/REQ:SyncOrderRelationReq/REQ:LinkID" />
 </xsl:template>
</xsl:stylesheet>

注意REQ这个名称空间的简写是我自己定义的,原来的XML文件没有

 

原文地址:http://blog.csdn.net/maomaochong713/article/details/419146

 

分享到:
评论

相关推荐

    javaSE 关于IO几种读取方式的性能比较

    本文将深入探讨三种不同的读取方式,并进行性能比较:二进制数据读取、字符数据读取以及压缩文件的读取。这三种方式在处理不同类型的数据时各有优劣,了解它们的特性可以帮助我们更有效地优化代码。 1. 二进制数据...

    常用读取xml文件的jar 包集合

    - 解析XML文档:使用`SAXBuilder`或`DOMBuilder`读取XML文件并构建文档对象模型。 - 遍历和修改XML:可以通过`Element`、`Attribute`等类的方法获取和修改节点及其属性。 - 序列化XML:使用`XMLOutputter`将DOM...

    DOM4J读取XML

    SAXReader采用事件驱动的方式读取XML文件,这意味着它并不会一次性将整个XML文档加载到内存中,而是逐个节点地读取,这样对于大型XML文件而言,可以有效节省内存资源。 #### 解析XML文件 `Document doc = reader....

    Xml的读取与保存

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,它以其结构化、自解释性和可扩展性而被广泛应用于软件开发、Web服务、数据交换等多个领域。TimyXML是针对XML处理的一个小型、轻量级的库,...

    js读取xml文件,生成树型结构

    在JavaScript中,读取XML文件并将其转换为树形结构是一项常见的任务,特别是在处理服务器返回的数据或者构建动态网页时。本教程将详细讲解如何通过JavaScript实现这一功能。 首先,我们需要理解XML(Extensible ...

    Java用DOM4J读取XML

    ### Java使用DOM4J读取XML知识点解析 #### 一、概述 在Java开发中,处理XML文件是一项常见的任务。DOM4J是一个简单且功能强大的Java库,用于处理XML文档。它提供了类似于DOM的API,但更为轻量级且易于使用。本篇将...

    读取XML文件的数据

    本文将深入探讨如何在编程中读取XML文件,并将其数据转化为可操作的类对象。 首先,理解XML的基本结构至关重要。XML文档由元素(Elements)、属性(Attributes)、文本内容(Text Content)等组成。元素是XML文档的...

    webservice之使用jaxb把xml转换Object或把对象转换成xml文件

    在这个例子中,`User`类是根据XSD文件生成的,`unmarshal`方法读取XML文件并将其转换为`User`对象。 三、Java对象到XML转换 1. 对象实例化:创建Java对象并设置其属性。 2. 序列化XML:使用`Marshaller`接口将Java...

    C# xml与dataset转换的例子

    XML(可扩展标记语言)和DataSet是处理数据的两种重要工具。本教程将详细阐述如何在C#中进行XML与DataSet之间的转换,这对于数据的存储、传输和操作至关重要。 XML是一种结构化的数据格式,它独立于任何特定的编程...

    Dom4j写XML和读取XML的工具类,非常好用

    标题"Dom4j写XML和读取XML的工具类,非常好用",表明我们要讨论的是一个基于Java的库——Dom4j,它是一个强大的、灵活的处理XML文档的开源库。Dom4j提供了一种简单的方式来创建、修改和解析XML文档,使得XML操作变得...

    C#读取xml的各种经典案例

    本文将深入探讨两种主要的XML访问模型,以及如何在C#中利用它们来读取XML文件。 首先,让我们讨论两种基本的XML访问模型: 1. DOM(Document Object Model)模型: DOM模型提供了一个完整的树形结构,将整个XML...

    解析xml和本地解析xml

    XML(eXtensible Markup Language)...总之,XML作为数据交换的重要工具,在线解析和本地解析各有优势,选择哪种方式取决于具体需求。从CLOB字段中提取XML数据并插入数据库涉及多个步骤,需要注意数据安全和性能优化。

    dom4j读取xml

    **DOM4J解析XML的基本概念** DOM4J是Java中一个功能强大且...以上就是关于DOM4J读取XML的基本知识点和相关操作。在实际开发中,DOM4J不仅能够读取XML,还能帮助我们构建、修改XML文档,是Java处理XML的重要工具之一。

    Jdom.jar在JAVA中可以对XML文件进行操作,读取或者写入XML

    1. **读取XML文件** 使用`org.jdom2.DocumentBuilderFactory`创建一个`DocumentBuilderFactory`实例,然后调用`newDocumentBuilder()`方法生成`DocumentBuilder`。接着,通过`parse()`方法解析XML文件并得到`...

    从XmlDocument到XDocument的转换 .

    - **XmlDocument**:属于较早出现的XML处理方式之一,提供了强大的功能来解析和操作XML文档,但其API较为复杂,且性能和内存使用效率相对较低。 - **XDocument**:作为LINQ to XML的一部分被引入,旨在提供更简洁...

    Qt 实现对XML的读写操作实现信息管理

    在IT行业中,XML(eXtensible Markup Language)是一种用于存储和传输数据的标准化格式,广泛应用于配置文件、数据交换和文档存储等领域。Qt库,一个跨平台的应用程序开发框架,提供了丰富的API来支持XML的读写操作...

    解析XML的程序,可以读取节点属性。

    XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,它以其结构化、自解释性和可扩展性而被广泛应用于软件开发、Web服务以及数据交换等领域。本程序是一个基本的XML解析器,专门设计用于读取XML...

    android的三种xml解析方式

    在Android开发中,XML(eXtensible Markup Language)是一种常用的数据存储和交换格式,用于定义应用程序的布局、配置和数据。...理解这三种解析方式及其优缺点,有助于提高Android应用的性能和效率。

    access ,sqlserver,oracle,mysql与xml之间的相互转换

    XML(eXtensible Markup Language)是一种结构化数据表示语言,广泛用于数据交换、存储和配置文件。以下将详细解释这些技术及其相互转换的原理。 首先,让我们逐一了解这四种数据库管理系统: 1. **Access**:由...

Global site tag (gtag.js) - Google Analytics