`
谷超
  • 浏览: 165938 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

XPath介绍

    博客分类:
  • Xml
阅读更多

XML实例文档

我们将在下面的例子中使用这个 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book category="COOKING">
  <title lang="en">Everyday Italian</title>
  <author>Giada De Laurentiis</author>
  <year>2005</year>
  <price>30.00</price>
</book>

<book category="CHILDREN">
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

<book category="WEB">
  <title lang="en">XQuery Kick Start</title>
  <author>James McGovern</author>
  <author>Per Bothner</author>
  <author>Kurt Cagle</author>
  <author>James Linn</author>
  <author>Vaidyanathan Nagarajan</author>
  <year>2003</year>
  <price>49.99</price>
</book>

<book category="WEB">
  <title lang="en">Learning XML</title>
  <author>Erik T. Ray</author>
  <year>2003</year>
  <price>39.95</price>
</book>

</bookstore>

 

节点选取

 

我们将使用微软的 XML DOM 对象来载入 XML 文档,并使用 selectNodes() 函数从 XML 文档选取节点:

set xmlDoc=CreateObject("Microsoft.XMLDOM")
xmlDoc.async="false"
xmlDoc.load("books.xml")
xmlDoc.selectNodes(路径表达式)

 

选取所有的 book 节点

 

下面的这个例子选取了 bookstore 元素下所有的 book 节点:

xmlDoc.selectNodes("/bookstore/book")

假如您正在使用 IE 5 或更高的版本,可以亲自试一试

 

选取第一个 book 节点

 

下面的例子仅选取 bookstore 元素下第一个 book 节点:

xmlDoc.selectNodes("/bookstore/book[0]")

假如您正在使用 IE 5或更高的版本,可以亲自试一试

注释: IE 5 和 6 会把 [0] 作为第一个节点来执行,但是根据 W3C 的标准,应该使用 [1] !!

注释: 这个问题在 IE 6 SP2 中被纠正了!

 

选取 price

 

下面的例子从所有的 price 节点选取文本:

xmlDoc.selectNodes("/bookstore/book/price/text()")

假如您正在使用 IE 5 或更高的版本,可以亲自试一试

 

选取价格高于 35 的 price 价格

 

下面的例子会选取所有价格高于 35 的 price 节点:

xmlDoc.selectNodes("/bookstore/book[price>35]/price")

假如您正在使用 IE 5 或更高的版本,可以亲自试一试

 

选取价格高于 35 的 title 节点

 

下面的例子会选取所有价格高于 35 的 title 节点:

xmlDoc.selectNodes("/bookstore/book[price>35]/title")

假如您正在使用 IE 5 或更高的版本,可以亲自试一试

 

 

 

分享到:
评论

相关推荐

    java xml xpath介绍

    Java XML XPath 是一种在XML文档中查找信息的语言,它被广泛用于Java开发中,以便高效地提取和操作XML数据。XPath使用路径表达式来选取XML文档中的节点或节点集,这些表达式类似于文件系统的路径,但针对的是XML文档...

    XML、XHTML、XPath介绍

    这是本人在公司培训时做的一个PPT文档,分别介绍了xml、xhtml、xpath的语法规则,以及相互之前的区别、使用场景、扩展

    网络爬虫JSON和XPath介绍

    本篇将详细介绍JSON和XPath这两种在网络爬虫中广泛应用的技术。 首先,JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写,同时也方便机器解析和生成。它的语法结构与JavaScript...

    一个简单的爬虫demo使用了一些Xpath技术

    3. **Xpath介绍**: Xpath(XML Path Language)是一种在XML文档中查找信息的语言,可以用来选取节点、选取节点集,甚至进行节点测试。对于HTML页面,Xpath同样适用,尽管HTML并非严格的XML结构,但大多数解析库能...

    C#中使用XPath的方法(最精减)

    #### XPath 介绍与应用场景 XPath 是一门功能非常强大的查询语言,用于在 XML 文档中查找信息。由于 XML 数据结构的复杂性,XPath 提供了一种灵活的方式来定位文档中的元素和属性。对于使用 C# 进行 XML 开发的技术...

    XPath语法详细介绍..XPath语法详细介绍

    ### XPath语法详细介绍 #### XPath简介 XPath是一种用于在XML文档中进行导航的查询语言。它提供了简洁、高效的方式来定位和提取文档中的特定部分。XPath不仅仅适用于XML文档的搜索,还是XSLT(一种用于转换XML文档...

    XSLT与XPath入门转换XML文档与数据

    - **第2章:XPath介绍** - 这一章节主要介绍了XPath的基本概念和语法,包括路径表达式、节点测试、轴和谓词等。 - 学习如何使用XPath来定位XML文档中的特定节点,以及如何使用XPath表达式来选择节点集合。 - **第...

    docs:《数据采集从入门到放弃》源码。内容简介:爬虫介绍,就业情况,爬虫工程师面试题; HTTP协议介绍;请求使用;解析器Xpath介绍; MongoDB与MySQL;多线程爬虫; Scrapy介绍; Scrapy -redis介绍;使用docker部署;使用nomad管理docker充分;使用EFK查询docker日志

    docs:《数据采集从入门到放弃》源码。内容简介:爬虫介绍,...解析器Xpath介绍; MongoDB与MySQL;多线程爬虫; Scrapy介绍; Scrapy -redis介绍;使用docker部署;使用nomad管理docker充分;使用EFK查询docker日志

    java编程之xpath介绍

    XPath,全称XML Path Language,是一种在XML文档中查找信息的语言。它被设计用来选取XML文档中的节点,如元素、属性、文本等。在Java编程中,XPath常用于处理XML数据,通过DOM4J库来实现。DOM4J是一个非常优秀的Java...

    查看网页元素的xpath

    本篇文章将详细探讨如何查看网页元素的 XPath,并介绍其相关知识点。 首先,XPath 的基本概念: 1. **节点**:在 XML 或 HTML 文档中,节点可以是元素(如 `&lt;div&gt;`)、属性(如 `class="example"`)、文本(如 ...

    XPath 2.0 程序员参考

    本书全面介绍了 XPath 2.0 的语法、功能及应用实例,非常适合希望深入掌握 XPath 2.0 的程序员阅读。 - **作者简介**:Michael Kay 是一位著名的计算机科学家,专注于 XML 技术的研究与发展。他是 XPath 规范的主要...

    python神奇xpath

    ### Python中的XPath神器 ...通过以上介绍可以看出,XPath在Python爬虫开发中扮演着极其重要的角色,它不仅可以帮助我们快速准确地定位和提取数据,还可以结合多线程等技术进一步提升数据抓取的速度和效率。

    xPath-API文档

    1. XPath简介:介绍XPath的基本概念和作用。 2. 路径表达式:讲解如何编写路径表达式来选取节点。 3. 节点测试和轴:详细解释各种节点测试和轴的用法。 4. 函数和运算符:阐述XPath提供的内置函数和逻辑、比较及算术...

    xpath_helper-master.rar

    7. 读取ME:一般包含项目的简短介绍、作者信息以及安装和使用说明。 XPath在爬虫中的应用包括: 1. **元素选择**:通过XPath可以精确地选取HTML或XML文档中的元素,例如`//div[@class='content']`选取所有类名为...

    学爬虫利器XPath.zip

    "学爬虫利器XPath.docx"文档很可能详细介绍了XPath的基础概念、语法和实例,包括如何在Python的`lxml`库中使用XPath进行网页数据的提取。如果你正在学习网络爬虫,理解并熟练运用XPath将是提高效率的关键。通过阅读...

    JsoupXPath的所有依赖的jar文件

    以下将详细介绍这些依赖的jar文件及其在JsoupXPath中的作用。 1. **jsoup-1.10.3.jar**: Jsoup是Java的一个开源库,主要用于解析HTML文档,提取结构化数据。它提供了类似于DOM、CSS以及jQuery的API,方便进行HTML...

    XPath官方手册中文版

    XPath官方手册中文版,内容介绍的很全面,将xpath相关的基础如xml等介绍得很好,比较适合初学者

    xpath手册

    介绍xpath的教程,通俗易懂

Global site tag (gtag.js) - Google Analytics