介绍:
一个新的Ruby解析HTML/XML的ruby库
安装:
sudo apt-get install libxml2-dev libxslt1-dev
sudo gem install nokogiri
视频:
http://railscasts.com/episodes/190-screen-scraping-with-nokogiri
源码地址:
http://github.com/tenderlove/nokogiri/
demo(nokogiri_google.rb):
require 'rubygems'
require 'nokogiri'
require 'open-uri'
url = 'http://www.google.cn/search?q=tenderlove'
doc = Nokogiri::HTML(open(url))
doc.css('h3.r a.l').each do |link|
puts link.content
end
puts '--------------------------------------------------'
doc.xpath('//h3/a[@class="l"]').each do |link|
puts link.content
end
puts '--------------------------------------------------'
doc.search('h3.r a.l', '//h3/a[@class="l"]').each do |link|
puts link.content
end
分享到:
相关推荐
标题中的“Ruby-Crystal的一个Html解析器类似于Ruby的Nokogiri”指的是在Crystal编程语言中,存在一个HTML解析库,它的功能和用法与Ruby的著名库Nokogiri相似。Nokogiri是Ruby社区广泛使用的库,用于解析HTML、XML...
nokogiri-1.6.6.2-x64-mingw32.gem 使用linux-vm / win8.1上的rako-compile,rake-compile-dock(感谢@luislavena !!)交叉编译的宝石(感谢nokogiri团队!) 出于礼貌而发布,以备不时之需。 只需将其安装为系统中...
当然,该库的API目前与Nokogiri不兼容。 $ ruby benchmarks/nokogiri_benchmark.rb Warming up -------------------------------------- Nokogiri::HTML 2.000 i/100ms NokogiriRust::...
RubyInstaller还支持DevKit,这是一个用于编译和构建C语言扩展的工具包,对于那些需要使用C扩展的Ruby库来说尤其重要。 DevKit是一个小型的开发工具集,它包含了一系列用于在Windows上编译原生Ruby扩展所需的工具,...
在实际应用中,Mechanize通常与其他Ruby库结合使用,如Nokogiri进行更精细的HTML解析,或者CSV、YAML等库来存储和处理抓取的数据。此外,还可以使用如Selenium这样的库进行更高级的浏览器控制,以处理JavaScript渲染...
总结来说,实现"从FM网站获取音频并转换到MP3格式"的Ruby程序需要掌握网络请求、数据解析、文件操作以及音频处理等技能,涉及的库包括`HTTParty`、`Nokogiri`、`open-uri`和`streamio-ffmpeg`等。通过这些工具和技巧...
Ruby的内置Nokogiri库通常用于解析和构建XML文档,Caldav库很可能利用了这一功能。 10. **测试和调试**:为了确保代码的正确性和稳定性,开发过程中通常会包含测试用例和调试工具。Ruby社区非常重视测试驱动开发...
《Ruby Doc Bundle:深入理解Ruby文档与库管理》 Ruby Doc Bundle是一个专门为Ruby开发者准备的文档集合,它包含了Ruby语言及各种Gem库的详细文档,是开发者日常学习、查询和解决问题的重要工具。在这个压缩包中,...
RubyGems是Ruby编程语言的一个核心组成部分,它提供了一个方便的包管理和分发系统,使得开发者可以轻松地安装、发布和管理Ruby库和程序。在Ruby社区,RubyGems是共享代码和模块化开发的标准方式。本文将深入探讨...
Ruby-httparty是一个强大的Ruby库,它使得执行HTTP请求变得简单且有趣。这个库的主要目标是减少处理RESTful API和其他Web服务时的繁琐代码,让开发者能够更专注于业务逻辑,而不是网络交互的细节。在Ruby社区中,...
Ruby-Ox的出现,为开发者提供了另一种处理XML文档的工具,与标准库如Nokogiri相比,它在性能上可能有显著优势,尤其是在处理大型或复杂XML文件时。 Ox的主要特点包括: 1. **速度**:由于Ox是用C语言编写的,并且...
2. **HTTP请求与解析**:为了与torrent搜索引擎交互,需要使用如`Net::HTTP`库发送HTTP请求,并使用如`Nokogiri`库解析返回的HTML内容。 3. **数据结构与算法**:搜索结果通常需要进行排序、过滤,这涉及到数据结构...
通过解压并查看源代码,你可以学习到更多关于如何在Ruby中高效地处理和提取正则表达式的内容,以及如何利用Nokogiri库解析和操作HTML文档。 总之,正则表达式是Ruby中处理文本的强大工具,特别是在处理像HTML这样的...
首先,安装Nokogiri涉及到依赖库的安装。在Ubuntu系统中,你需要确保已经安装了libxml2和libxslt这两个组件,可以通过以下命令进行安装: ```bash $ apt-get install libxml2 libxslt ``` 完成依赖安装后,你可以...
在这个项目中,`instagram-crawler-master`可能包含了整个爬虫项目的源代码,包括Gemfile(列出项目依赖的Ruby库)、配置文件、主程序代码(如`instagram_crawler.rb`)、测试脚本以及可能的示例用法。为了深入了解...
Ruby提供了多种库来生成XML文档,如Builder或Nokogiri。 - **XML文档解析**:对于接收和处理来自外部系统的XML数据,Ruby提供了多种解析方法,包括SAX、DOM和Pull解析,其中Nokogiri库是处理XML和HTML文档的强大工具...
`rubyinstaller-devkit-2.5.1-1-x64` 是一个专为Windows用户设计的Ruby安装包,它包含了Ruby解释器以及开发工具集(DevKit),使得在Windows环境下编译和管理C扩展的Ruby库变得可能。 首先,我们要理解...
在Ruby中,最常用的XML处理库是Nokogiri和REXML。Nokogiri是一个强大的解析器,支持XPath和CSS选择器,使得从XML文档中提取数据变得简单。REXML则是Ruby标准库的一部分,提供了一套基础的XML处理功能。 1. **...
此外,Ruby 社区有强大的 Gems(Ruby 的扩展库)生态系统,例如 `sinatra`(轻量级Web框架)、` nokogiri`(HTML解析器)和 `rspec`(测试框架)等。 总之,Ruby 2.2.7 是一个成熟的 Ruby 版本,适用于多种用途,...
5. **Gem生态系统**:Ruby的Gem是其强大的库管理工具,提供了丰富的第三方库,如Rails(Web开发框架)、Rspec(测试框架)、Nokogiri(HTML解析库)等,极大地扩展了Ruby的功能。 6. **ActiveRecord**:在Ruby on ...