/text() 结尾是取文本
/@href 结尾是取链接地址
[@href != "#"] 是对属性的限制
例如 xpath
//*[@id="title"]/@href 的节点是以下两个
<a id="title" href="#" target="_blank" class="">北斗助力城市民生事业,“百城百联百用”行动卓有成效</a>
<a id="title" href="/article/detail?id=2520" target="_blank" class="">变更管理在燃气行业的应用——以燃气厂站为例</a>
xpath解析结果是 以下两个
#
/article/detail?id=2520
明显 # 不是有效链接 那么 取属性不是# 的xpath就是
//*[@id="title"][@href!="#"]/@href
解析结果 过滤掉了 #的
/article/detail?id=2520
xpath 常用函数
注意:函数可以多个,多次的嵌套使用
1.
去除头尾空格
normalize-space()
例子
normalize-space(//*[@id="6658"]/text())
2.
截取字符串
substring()
例子
substring(string,number,length)
参数string用于指定要截取的字符串;参数number用于指定开始位置;参数length用于指定截取字符串的长度
substring(abcdef,1,3) 截取结果 abc
3.
截取字符串
substring-before()
substring-before(str1,str2)函数用于返回字符串str1中位于字符串str2之前的部分。
例子
substring-before("2018abcd","a") 截取结果 2018
4.
截取字符串
substring-after()
substring-after(str1,str2)函数跟substring-before类似,substring-after0返回字符串str1中位于字符串str2之后的部分。
例子
substring-after("abdc.123",".") 截取结果 123
5.
替换
translate()
translate(str,str1,str2) 将str中的str1替换为str2
例子
//*[@id="6658"]/div[2]/div[2]/div[1]/ul/li[2] 取到的记过是 2018年8月8日
translate(//*[@id="6658"]/div[2]/div[2]/div[1]/ul/li[2],"年","-") 解析结果为 2018-8月8日
下面这个是多次嵌套使用 最后日替换为"" 时会有个空格 所以用了一次去空格函数 normalize-space()
normalize-space(translate(translate(
translate(//*[@id="6658"]/div[2]/div[2]/div[1]/ul/li[2],"年","-"),"月","-"),"日","")) 解析结果为 2018-8-8
6.
拼接两个xpath内容 中间逗号隔开
concat()
例子
concat(//*[@id="6658"]/text(),//*[@id="6659"]/text())
分享到:
相关推荐
部分常用函数包括: - **字符串函数**: - `string-length()`:返回字符串长度。 - `normalize-space()`:移除字符串首尾空白并合并内部空白。 - `concat()`:字符串连接。 - **数值函数**: - `sum()`:计算...
### Xpath常用语法详解 #### 一、遍历节点 Xpath中的遍历操作非常常见,主要用于处理XML文档中的多个相同节点。例如,在一个XML文档中有多个`<div>`标签带有`class="content"`属性,我们可以使用`<xsl:for-each>`...
### JQuery 常用函数及功能详解 #### 一、文档加载完成执行函数 在Web开发中,确保脚本在页面完全加载后再执行是至关重要的。`$(document).ready()` 函数提供了一种简单有效的方法来实现这一点。 **示例代码**: ``...
这个XPath选取所有包含两个`dir`子元素的顶级元素,`count()`函数计算子元素的数量。 在实际应用中,这些XPath表达式可以帮助开发者高效地定位和操作DOM中的特定节点,从而实现各种动态效果和数据提取。需要注意的...
在本讲义中,我们将学习XPATH语言的基本概念、安装方法、路径表达式的使用、函数的使用等方面的知识。 XPATH简介 ---------- XPATH,全称XML Path Language,即XML路径语言,是一种在XML文档中查找信息的语言。...
5. **常见XPath函数支持**:工具可能内置了对一些常用的XPath函数的支持,如`count()`、`concat()`、`substring()`等,用户可以直接在表达式中调用。 6. **版本兼容性**:XPath有1.0和2.0等多个版本,工具可能需要...
XSLT函数如`document()`加载外部XML文档,`key()`基于键值查找节点,`current()`引用当前处理的节点等,都是在实际转换中常用的功能。 总之,XPath Viewer是XML和XSLT开发者的得力助手,它提供了直观的学习和调试...
3. 函数和运算符:XPath提供了一系列内置函数,如字符串处理函数、数值比较函数等,以及常用的逻辑运算符(and、or)、比较运算符(=、!=、<、>等)和算术运算符(+、-、*、/等)。 4. 变量和命名空间:XPath允许...
- 存储和重用:用户可能能保存常用的XPath表达式,便于在不同场合复用。 4. 文件分析: - "说明.txt":通常会包含插件的安装说明、使用教程、常见问题解答等内容。 - "xpath.crx":这是一个Chrome浏览器扩展文件...
在使用XPath Helper进行网页数据提取时,你需要了解一些基本的XPath概念,例如节点类型(元素、属性、文本等)、轴(如祖先、后代、兄弟等)、路径表达式以及函数。通过熟练运用这些概念,你可以编写出高效的XPath...
XPath还提供了一系列的函数,如`text()`用于获取节点的文本内容,`count()`用于计算节点的数量,以及`contains()`用于判断字符串是否包含特定子串。 安装XPath Helper的步骤非常简单。你只需要将下载的压缩包解压,...
此外,XPath提供了许多函数和操作符,如选取所有满足特定条件的节点、计算节点的数值等。 在IE浏览器中,使用XPath工具可以简化自动化测试的工作流程。通常,这个工具可能包含一个插件或者脚本,允许用户在网页上...
这个“xml操作的类及常用函数的使用例子”可能涵盖以下内容: 1. **XML文档的加载和解析**:如何使用`IXMLDOMDocument`的`load`方法加载本地XML文件,或者用`loadXML`方法加载内存中的XML字符串。 2. **元素的访问...
3. **学习XPath语法**:XPath Helper还可以作为一个学习工具,通过实际操作来理解和掌握XPath的各种选择器和函数,如`//`, `.//`, `@attribute`, `text()`, `last()`, `position()`等。 4. **提升爬虫效率**:在...
根据提供的文件信息,我们可以总结出Selenium中Python常用的函数及其用法。Selenium是一个强大的工具,主要用于Web应用程序的自动化测试。下面将详细介绍这些函数的功能及使用场景。 ### 1. 初始化WebDriver实例 - ...
在爬虫编程中,XPath是常用的网页解析工具。例如,Python的BeautifulSoup库和lxml库都支持XPath查询。通过XPath,您可以编写表达式来提取特定的HTML标签、属性或文本内容。XPath Helper可以帮助您在编写爬虫脚本时,...
支持标准xpath语法(支持谓语嵌套),支持全部常用函数,支持全部常用轴,去掉了一些标准里面华而不实的函数和轴,下面会具体介绍。语法可以参考http://www.w3school.com.cn/xpath/index.asp 关于使用Xpath的一些...
为了充分利用这些资源,建议先从基础概念入手,逐步了解XPath的语法结构和常用函数。然后,通过实际操作XML文档,运用XPath进行查询,以此加深理解和记忆。最后,尝试解决一些实际问题,如数据提取、内容筛选等,将...
4. **函数应用**:利用XPath提供的内置函数进行数据处理,如数值比较、字符串操作等。 5. **上下文敏感**:注意XPath的查询结果可能因执行上下文的不同而变化,例如在XSLT或XPath 2.0中的不同用法。 6. **性能优化**...