看到网上一片文章,自己式了一下,果然 XMLTextReader速度要快!
在.NET框架的System.XML名称空间中包含的XMLTextReader类不需要对系统资源要求很高,就能从XML文件中快速读取数据。使用XMLTextReader类能够从XML文件中读取数据,并且将其转换为HTML格式在浏览器中输出。
读本文之前,读者需要了解一些基本知识:XML、HTML、C#编程语言,以及.NET尤其是ASP.NET框架的一些知识。
微软公司的.NET框架为开发者提供了许多开发的便利,随着XML的重要性不断增长,开发者们都期待着有一整套功能强大的XML工具被开发出来。.NET框架没有辜负我们的这番期望,在System.XML 名称空间中组织进了以下几个用于XML的类:
XMLTextReader------提供以快速、单向、无缓冲的方式存取XML数据。(单向意味着你只能从前往后读取XML文件,而不能逆向读取)
XMLValidatingReader------与XMLTextReader类一起使用,提供验证DTD、XDR和XSD架构的能力。
XMLDocument------遵循W3C文档对象模型规范的一级和二级标准,实现XML数据随机的、有缓存的存取。一级水平包含了DOM的最基本的部分,而二级水平增加多种改进,包括增加了对名称空间和级连状图表(CSS)的支持。
XMLTextWriter------生成遵循 W3C XML 1.0 规范的XML文件。
本文主要讲述的是第一个类XMLTextReader,这个类设计的目的就是从XML文件中快速的读取数据,而对系统资源(主要包括内存和处理器时间)不做很高的要求。在父级程序的控制下,它通过每次只处理一个节点的方式对XML文件进行逐步操作,实现这种工作过程。在XML文件的每个节点中,父级程序能决定该节点的类型,它的属性和数据(如果有的话),以及其他有关该节点的信息。基于这些信息,父级程序可以选择是处理这个节点还是忽略该节点的信息,以满足各种应用程序请求的需要。这被称为抽取式(pull)处理模型,因为父级程序发出请求并且从XML文件中抽取各个节点,然后根据需要处理它或者是不处理它。
我们可以把XMLTextReader类和XML简单应用程序接口,即SAX相比,后者是在编程人员中非常流行的另一种读取XML数据的技术。XMLTextReader 和SAX有一点很相似,它们都不需要占用很多的系统资源,就能迅速的从XML文件读取数据。但是,与XMLTextReader的抽取式模型迥然不同,SAX使用的是推入式模型:XML处理器通过 “事件”告知主机应用程序哪些节点数据是可以获得,那些不能获得;根据需要,主机程序则作出相应的反应或置之不理。换句话说,数据的传送方向是从SAX处理程序中推入到主机。程序员们势必会在抽取式和推入式处理模型谁更有优势的问题上争论一番,但是大家都不可否认的是,两种模型都能很好的进行工作。.NET 框架不支持SAX,但是你能使用现存的SAX工具, 例如 MSXML分析器,用于你的.NET 程序。
XMLTextReader 类有一些构造程序来适应各种各样的情况,比如从一个已经存在的数据流或统一资源定位网址读取数据。最常见的是,你或许想从一个文件读取XML数据,那么也就有一个相应的构造程序来为此服务。这里有一个例子(我的所有代码例子都使用的是C#语言,如果你喜欢使用VISUAL BASIC语言,它们转换起来很容易)。
XMLTextReader myReader;
myReader = New XMLTextReader("c:\data\sales.XML")
创建一个称为Read()方法的循环,这个方法的返回值总是为真,直到到达文件的底部时,返回值才变为假。换句话说, 循环在文件的开始时启动并且读入所有的节点, 一次读入一个节点, 直到到达文件的结尾:
While (myReader.Read()) {
...
// 在这里处理每个节点.
...
}
每次成功调用Read()之后,XMLTextReader实例化程序包含了目前节点(即刚刚从文件中读取的那个节点)的信息。我们可以从XMLTextReader的成员中获得上述信息,就像表格1中描述的一样;并通过NodeType属性判断出当前节点的类型。在节点类型的基础上,程序的代码可以读取节点数据,检查它是否有属性,到底是忽略它还是根据程序需要进行相应的操作和处理。
当使用NodeType属性时,理解节点怎么联系到XML单元是非常重要的。例如, 看下列 XML元素:
<city>Chongqing</city>
XMLtextReader 把这个元素看作 3 个节点,顺序如下:
1.<city>标签被读为类型 XMLNodeType.Element 节点,元素的名字“city”可从 XMLTextReader 的Name属性中获得。
2.文本数据“Chongqing”被读为类型为XMLNodeType.Text的节点。数据“Chongqing ” 可从XMLTextReader 的Value属性中取得。
3.</city>标签被读为类型为XMLNodeType.EndElement 节点。同样,元素的名称“city”可从XMLTextReader的Name属性中获得。
这是 3 种重要的节点类型,其它的类型在.NET的说明文档中有详细说明,请大家参阅相关资料。
如果XMLTextReader遇到一个错误, 例如出现违反XML句法的情况,它抛出一个System.XML.XMLException类型的异常。使用这个类的代码应该总是被保护 ( 在Try……Catch块中),就像你以后在演示程序中看到的一样。
本文只是一篇相当简单的介绍XMLTextReader 类的文章,XMLTextReader类有相当多的成员,在这里不可能一一述及。当读入XML数据时,XMLTextReader能提供相当强的灵活性。即便如此,我仍然进行了大量的论述,以保证读者能编制程序来实现现实世界中经常要求完成的任务,也就是从一个XML文件读取数据然后以HTML的格式输出,从而实现在浏览器中的显示。
这个ASP.NET程序(脚本)在服务器上运行并产生一个HTML页面返回浏览器。这段脚本程序在代码段 1 给出,它用来工作使用的 XML 数据文件在代码段 2给出。你能看到这个 XML 文件包含一份表示联系关系的列表;程序的目标即是将这个列表显示出来,为了更容易我们观察,这些列表已经被格式化了。
运行程序:
1. 将代码段1存为XMLTextReader.ASPx文件,将代码段2存为XMLData.XML文件。
2. 把这两个文件都放在一个已经安装好.NET 框架的网络服务器的虚拟文件夹中。
程序工作的大部分都由XMLDisplay 类来做,尤其是被ProcessXML()方法完成的。它每次读取一个节点XML数据,对于感兴趣的元素,节点数据和后跟冒号的节点名将和相应的HTML格式化标签一起写入输出结果中。在这阶段,“输出结果”由一个HTML文本暂时储存在其中的StringBuilder对象构成。
ProcessXML()方法是从LoadDocument()方法调用的。这个方法执行的任务是产生一个XMLTextReader实例化程序并在调用ProcessXML之前装载XML文件。它同时也处理异常,随后产生错误的信息并在浏览器中显示出来。最终该方法返回一个字符串,这个字符串或者包含产生的HTML内容,或者如果异常发生的话就包含出错信息,。
程序执行以Page_Load()程序开始,当浏览器请求浏览这个页面时,这一步会自动执行。这里的代码实例化了XMLDisplay 类并调用它的LoadDocument()方法。如果一切运行正常的话,格式化的HTML形式的返回值将被拷贝到页面的一个<div>标签中,生成的HTML文档被送回到浏览器中并显示出来。
其他的.NET 框架的类,比如XMLDocument类在读取XML数据方面表现如何呢?XMLDocument 类与XMLTextReader 类不同,它在存储器中创建整个XML文档的节点树。这样就可以随机的获得XML数据(与XMLTextReader 类获得数据的线性方式正好相反),并且在修改XML文件的数据和结构时,具有非常完美的灵活性。另外,XMLDocument允许执行XSLT 转变,不过,这些额外的功能是以运行速度的降低和系统资源的更多占用为代价的。
代码段1:XmlTextReader.aspx
<%@ Import Namespace="System.Xml" %>
<script language="C#" runat=server>
public class XmlDisplay
file://这个类读入并处理XML文件。
{
public string LoadDocument(String XmlFileName) {
XmlTextReader xmlReader = null;
StringBuilder html = new StringBuilder();
try {
file://创建XMLTextReader的实例。
xmlReader = new XmlTextReader(XmlFileName);
// 处理XML文件
html.Append(ProcessXml(xmlReader));
}
catch (XmlException ex){
html.Append("发生一个XML异常:" +
ex.ToString());
}
catch (Exception ex){
html.Append("发生一个普通异常:" +
ex.ToString());
}
finally
{
if (xmlReader != null)
xmlReader.Close();
}
return html.ToString();
}
private string ProcessXml(XmlTextReader xmlReader)
{
StringBuilder temp = new StringBuilder();
file://这个方法读入XML文件并生成输出的HTML文档。
while ( xmlReader.Read() )
{
// 处理一个元素节点的起始。
if (xmlReader.NodeType == XmlNodeType.Element)
{
file://忽略<people>和<person>元素
if ((xmlReader.Name != "person") && (xmlReader.Name != "people"))
{
file://如果是一个<category>元素,开始一个新的段落
if ( xmlReader.Name == "category" )
temp.Append("<p>");
file://添加元素名到输出中
temp.Append( xmlReader.Name + ": " );
}
}
// 处理文本节点
else if (xmlReader.NodeType == XmlNodeType.Text)
temp.Append(xmlReader.Value + "<br>");
file://处理元素节点的结尾
else if (xmlReader.NodeType == XmlNodeType.EndElement)
{
file://如果是<email>节点,添加结束段落的标记
if ( xmlReader.Name == "email" )
temp.Append("</p>");
}
}//结束while循环
return temp.ToString();
} file://结束ProcessXML方法
} file://结束XmlDisplay类
private void Page_Load(Object sender, EventArgs e){
file://创建XmlDisplay类的实例
XmlDisplay XmlDisplayDemo = new XmlDisplay();
output.InnerHtml = XmlDisplayDemo.LoadDocument(Server.MapPath("XMLData.xml"));
}
</script>
<html>
<head>
</head>
<body>
<h2>演示XmlTextReader类</h2>
<div id="output" runat="server"/>
</body>
</html>
1 static void Main(string[] args)
2 {
3 DateTime d1 =DateTime.Now;
4 XmlDocumentTest();
5 DateTime d2 =DateTime.Now;
6 TimeSpan ts =d2-d1 ;
7
8 Console.WriteLine(ts.TotalMilliseconds) ;
9 Console.Read() ;
10
11 }
12
13
14 public static string XmlFileName = "../../XML/1.xml";
15
16 private static void XmlTextReaderTest()
17 {
18 XmlTextReader reader = new XmlTextReader(XmlFileName);
19 while (reader.Read() )
20 {
21 bool exit =false;
22 switch(reader.NodeType)
23 {
24 case XmlNodeType.Element :
25 break;
26 case XmlNodeType.Text :
27 if (reader.Value=="last")
28 {
29 exit=true;
30 }
31 break;
32 case XmlNodeType.EndElement :
33 break;
34 default:
35 break;
36 }
37 if(exit)
38 {
39 return;
40
41 }
42
43 }
44 }
45
46 private static void XmlDocumentTest()
47 {
48 XmlDocument xd =new XmlDocument() ;
49 xd.Load(XmlFileName) ;
50 XmlNode node = xd.SelectSingleNode("/people/person[category='last']");
51 Console.Write(node.Name) ;
52 }
本文出自 51CTO.COM技术博客
相关推荐
使用`XmlNodeReader`,你可以从已加载到`XmlDocument`的对象中读取XML: ```vbnet Dim doc As New XmlDocument() doc.Load("path_to_your_xml_file.xml") Dim reader As XmlNodeReader = New XmlNodeReader(doc....
- 使用**XmlNodeReader**或**XmlTextReader**:这两种更轻量级的读取器能逐行读取XML,减少了内存占用,适合处理大型XML文件。 - **异步处理**:如果XML文件非常大,可以使用异步IO操作来避免阻塞UI线程。 - **Linq ...
在C++中处理XML文件,主要依赖于.NET框架提供的这些命名空间中的类和方法,如XmlDocument类用于DOM树形式的操作,XmlTextReader类用于流方式的快速读取,以及其他的诸如XmlWriter、XmlValidatingReader等类。...
本篇文章将详细阐述如何使用C#来读取XML文件,并提供相关的编程示例。 首先,要读取XML文件,你需要引入`System.Xml`命名空间,它包含了处理XML的基本类库。在你的C#源代码文件顶部添加以下引用: ```csharp using...
本文主要介绍如何利用`XmlTextReader`类来读取XML文件,并通过控制台输出读取的数据。 #### 二、准备工作 在开始之前,请确保你的开发环境已经安装了.NET Framework和Visual Studio或任何支持C#的IDE。此外,你还...
【C#读取XML文件】 XML(eXtensible Markup Language)是一种用于标记数据的语言,广泛应用于数据交换、配置文件存储等领域。在.NET框架中,C#提供了丰富的类库来处理XML文件,使得读取、解析和操作XML文档变得简单...
在C#中,读取XML文件通常有两种方式:使用XmlTextReader或使用 XmlDocument。 1. 使用XmlTextReader: ```csharp using System; using System.Xml; public class Program { public static void Main() { ...
虽然`XmlTextReader`提供了高效的XML处理,但它的API相对较低级,对于更复杂的XML解析任务,可以考虑使用`XDocument`或`XmlDocument`类,它们提供了更方便的API和更多的功能,如LINQ查询支持。然而,如果你关心性能...
标题 "PB 读取XML文件 实例" 涉及的是使用PowerBuilder(PB)这一编程工具处理XML文件的方法。PowerBuilder(PB)是Sybase公司开发的一种强大的客户端/服务器应用程序开发工具,它支持多种数据源,包括XML。在PB ...
### ASP.NET读取XML文件4种方法 在ASP.NET中,读取XML文件是一种常见的需求,主要用于解析数据、配置信息等。本文将详细介绍四种不同的方法来实现这一功能:使用XML控件、DOM(文档对象模型)、DataSet以及XML Text...
从数据库中读取数据自动生成XML ...从数据库中读取数据自动生成 XML 文件可以使用 ADO.NET 框架和 XmlDocument 对象来实现。使用 ASP.NET,我们可以轻松地读取和更新 XML 文件,并实现 XML 文件的增删改查操作。
以下是一个简单的使用XMLDocument读取XML文件并打印所有元素名称的示例: ```csharp using System; using System.Xml; class Program { static void Main() { XmlDocument xmlDoc = new XmlDocument(); xmlDoc....
本篇文章将详细探讨如何在C#中读取XML文件,并生成Web标签。 首先,我们需要了解XML的基本结构。XML文档由元素、属性、文本内容以及命名空间等组成。每个XML文件都有一个根元素,其他的元素嵌套在其下。C#提供了...
在ASP.NET中,读取XML文件是常见的数据处理任务,特别是在构建动态网页和Web应用程序时。以下是四种常用的方法,每种方法都有其特定的优势和适用场景。 **方法一:使用XML控件** ASP.NET提供了XML控件(如`<asp:Xml...
2. 创建一个`XmlTextReader`或`XmlDocument`对象来加载XML文件: ```csharp string xmlFilePath = "path_to_your_cml_file.xml"; XmlTextReader reader = new XmlTextReader(xmlFilePath); // 或者 XmlDocument ...
C#中使用XML指南之读取XML.doc XmlDocument类:.doc XmlElement 类:.doc ...XMLTextReader和XmlDocument读取XML文件的比较.doc 用XMLTextReader类加速.doc 在.NET Framework中轻松处理XML数据.doc等等
- 加载XML文件:使用`XmlDocument`类的`Load`方法加载XML文件到内存中,例如: ```csharp XmlDocument doc = new XmlDocument(); doc.Load("path_to_xml_file.xml"); ``` - 遍历XML:通过`doc.DocumentElement...
然而,代码并未使用`XmlDocument`的`Load`方法来直接读取XML文件,而是创建了一个`XmlTextReader`对象。`XmlTextReader`是一个只进的、基于事件的XML解析器,它逐行读取XML文档,提供了一种高效且内存友好的方式来...
1. **读取XML文件**:可以使用`XmlDocument`类加载XML文件。例如: ```csharp XmlDocument doc = new XmlDocument(); doc.Load("path_to_xml_file.xml"); ``` 2. **XML DOM(Document Object Model)**:`Xml...
- 加载XML:使用`XmlDocument.Load()`或`XmlTextReader()`加载XML文件。 - 遍历XML:通过`XmlNode`对象的`ChildNodes`属性获取子节点,`Attributes`属性获取属性。 - 选择节点:`SelectNodes()`和`...