`
sitoto
  • 浏览: 124736 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

ruby-nokogiri -xpath 用法说明

    博客分类:
  • ruby
阅读更多
//div[@xxx = "sss"]/table[2]/tr[1]/td[1]/a/@href

上面那段代码的意思说清楚,基本上可以用xpath  解析html了。

xpath()
at_xpath()

做个记录先



参考资料:http://stackoverflow.com/questions/2683298/xpath-matching-attribute-and-content-of-an-element



193737895群,可交流。
分享到:
评论

相关推荐

    Ruby-Crystal的一个Html解析器类似于Ruby的Nokogiri

    标题中的“Ruby-Crystal的一个Html解析器类似于Ruby的Nokogiri”指的是在Crystal编程语言中,存在一个HTML解析库,它的功能和用法与Ruby的著名库Nokogiri相似。Nokogiri是Ruby社区广泛使用的库,用于解析HTML、XML...

    Ruby-InstagramCrawler下载Instagram照片帖子和视频的最简单方法

    在这个项目中,`instagram-crawler-master`可能包含了整个爬虫项目的源代码,包括Gemfile(列出项目依赖的Ruby库)、配置文件、主程序代码(如`instagram_crawler.rb`)、测试脚本以及可能的示例用法。为了深入了解...

    Ruby-RubyRetriever异步Web爬虫

    4. **HTML解析**:为了提取网页数据,RubyRetriever可能会使用Nokogiri库,它提供了一种高效的方式来解析HTML和XML文档,通过XPath或CSS选择器选取需要的数据。 5. **数据存储**:抓取到的数据通常需要存储到文件...

    ruby操作xml

    - 解析XML:使用`Nokogiri::XML`方法打开一个XML文件,然后可以通过`search`或`at`方法使用XPath或CSS查询文档。 - 修改XML:可以创建新的元素,使用`add_child`方法添加到树中,或者用`content=`设置元素内容。 ...

    ruby-scraping:一堆为@LeWagon 学生抓取的 ruby​​ 脚本

    2. **HTML解析**:Nokogiri库是Ruby中非常流行的HTML和XML解析器,它允许通过XPath或CSS选择器提取数据。例如,你可以使用它来查找特定的HTML元素,如`<div>`, `<a>`标签等。 3. **数据提取与处理**:在获取HTML...

    Ruby中使用Nokogiri包来操作XML格式数据的教程

    解析XML文档可以使用`Nokogiri::XML`方法,从文件、字符串或URL加载数据。例如,从文件中解析XML: ```ruby f = File.open("blossom.xml") doc = Nokogiri::XML(f) f.close ``` 如果XML数据存储在字符串中,可以...

    ruby xml封装好的操作XML对象

    解析XML时,我们还可以利用Nokogiri提供的方法提取特定节点的值,如`text`,`attributes`等。 3. **XPath和CSS选择器** XPath是XML路径语言,用于在XML文档中定位节点。例如,下面的代码选择了所有`<item>`元素:...

    web_scraping_project:使用Ruby和Nokogiri,CSV,Pry和HTTParty gem进行网络抓取

    在这个名为“web_scraping_project”的项目中,我们聚焦于使用Ruby编程语言,结合Nokogiri库,HTTParty gem,以及CSV和Pry工具来实现网页数据抓取。网络爬虫是自动化提取大量信息自互联网的重要技术,而Ruby以其简洁...

    Instant Nokogiri

    学习Nokogiri的书籍如《Instant Nokogiri》能够帮助读者快速掌握这个工具的使用方法和技巧。从书籍内容上来看,《Instant Nokogiri》主要涵盖了学习使用Nokogiri进行数据抓取和解析的方方面面,适合各个层次的Ruby...

    Ruby的XML格式数据解析库Nokogiri的使用进阶

    ### Ruby的XML格式数据解析库Nokogiri的使用进阶 #### 一、Nokogiri概述 Nokogiri是Ruby中的一个强大的XML/HTML解析器,它提供了多种方式来解析、搜索和修改XML/HTML文档。Nokogiri能够与标准库一样方便地操作文档...

    ruby,xml

    通常,这些操作可以通过Ruby的XML库来实现,比如Nokogiri提供了一种直观的CSS和XPath选择器来查询XML文档,而REXML则更接近于标准的XML解析库,提供基本的解析和生成功能。 关于“源码”,这可能意味着讨论中包含了...

    Ruby色

    - **CSS和XPath支持**:Nokogiri支持使用CSS选择器和XPath表达式来查找和操作文档中的元素,方便网页抓取和数据提取。 - **文档遍历和修改**:可以轻松遍历文档树,添加、删除或修改元素,进行文本内容的替换等。 ...

    刮板:使用Nokogiri和Mechanize编译基于Ruby的手工刮板

    Mechanize与Nokogiri结合使用,可以方便地实现网页抓取任务,从登录到数据提取,形成一个完整的自动化流程。 **Web刮板基础** Web刮板是一种程序,用于自动从网站上收集和提取数据。在Ruby中,Nokogiri和Mechanize...

Global site tag (gtag.js) - Google Analytics