发现InfoQ的RSS很不厚道,只现实一个该要。想要知道详细内容的话不得不点进去看。如果用手机的话流量剧增。那么我就写了一个很简单的ruby代码,比如把InfoQ的和ruby相关的新闻提出来。每天晚上发到我的邮箱,那么我就不用理会网页上的那么多广告了。
发邮件部分就不贴了,就给一个大概的思路吧。主要是学习hpricot。在RSS方面javaeye做的很好。
require "rubygems"
require 'hpricot'
require 'open-uri'
HOST_NAME="http://www.infoq.com"
doc = Hpricot(open("http://www.infoq.com/cn/ruby"))
p = doc.search("//h1/a")
result = []
p.each do |pitem|
href = pitem.get_attribute("href")
title = pitem.search("//text()")
result << [title, href] if href =~ /\/cn\//
end
result.each do |items|
doc = Hpricot(open(HOST_NAME + items[1]))
# puts items[0]
doc.search("//div[@class='box-content-5']//p[@class='h1-r']").remove
doc.search("//div[@class='box-content-5']//p[@class='info']").remove
doc.search("//div[@class='box-content-5']//dl").remove
doc.search("//div[@class='box-content-5']//div[@class='vendor-content-box-float']").remove
doc.search("//div[@class='box-content-5']//div[@class='vendor-content-box']").remove
doc.search("//div[@class='box-content-5']//div[@class='comments-header']").remove
doc.search("//div[@class='box-content-5']//div[@class='forum-list-tree']").remove
doc.search("//div[@class='box-content-5']//div[@class='comments-sort']").remove
doc.search("//div[@class='box-content-5']//ol").remove
doc.search("//div[@class='box-content-5']//script").remove
doc.search("//div[@class='box-content-5']//br").remove
doc.search("//div[@class='box-content-5']//text()") do |item|
puts item
end
puts "_______________________________________________________________________\n\n"
end
分享到:
- 2008-06-21 18:40
- 浏览 2169
- 评论(3)
- 论坛回复 / 浏览 (3 / 3443)
- 查看更多
相关推荐
《InfoQ架构师2016合集》是面向IT专业人士,尤其是架构师群体的一份珍贵资源,集合了2016年InfoQ平台上的众多精彩文章和讨论,旨在分享和探讨当时的最新技术和最佳实践。InfoQ作为一个全球知名的IT资讯网站,其内容...
infoq 架构师8月刊 infoq 架构师8月刊 infoq 架构师8月刊
5. 开发工具使用:介绍和对比不同的开发工具,如IDE、版本控制、自动化工具等。 6. 构建与部署:讲解如何设置高效的构建流程,以及CI/CD的实现和优化。 7. 工具集成:展示如何将多种工具整合到开发流程中,提高团队...
文章中提到了AIOps的终极价值,AIOps将人工智能应用于IT操作,以提升自动化和智能化水平,从而减少人为错误,提高效率。 此外,月刊还提到了软件测试技术的未来,这意味着本期月刊可能探讨了软件测试领域在AI和机器...
infoq 架构师 2019年月刊收集 infoq 架构师 2019年月刊收集
合集可能涵盖Jenkins、GitLab CI/CD等工具的使用,以及如何通过自动化流程提升软件交付效率。 6. **安全性与隐私保护**:在网络安全日益重要的背景下,架构师需要了解如何设计安全的系统。合集可能涉及身份验证、...
ArchSummit北京2019大会演讲 PPT 分共三个压缩包 2019年InfoQ架构师峰会ppt.z01 2019年InfoQ架构师峰会ppt.z02 2019年InfoQ架构师峰会ppt.zip
《infoQ架构师月刊上部》集合了2008年至2012年间infoQ平台上关于架构领域的精华文章和讨论,旨在为IT行业的专业人士,尤其是架构师们提供宝贵的参考资料。InfoQ是一个全球知名的软件开发资讯平台,以其深度、专业和...
InfoQ云生态期刊是一系列深度探讨云计算领域动态、技术趋势和实践案例的专业出版物。这套期刊涵盖了从第一期到第八期的完整内容,为读者提供了丰富的云计算知识库。InfoQ作为一个知名的IT信息与社区平台,其发布的云...
9. 持续集成/持续部署(CI/CD):这一自动化流程在提高软件开发效率上发挥了重要作用,杂志可能介绍了CI/CD的最佳实践和工具链,如Jenkins、GitLab CI等。 10. 大数据处理:Hadoop和MapReduce等技术在2009年正处于...
infoq-downloader, 下载InfoQ的演示文稿,包括视频&幻灯片,以离线播放它们 下载是许多有用会话的优秀资源。 他们查看演示文稿与幻灯片同步的方式很酷。 我的网络连接很慢,这让我的浏览体验变得。 为了解决这个问题...
【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf...
【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像...
ArchSummit北京2019大会演讲 PPT 分共三个压缩包------整理上传 2019年InfoQ架构师峰会ppt.z01 2019年InfoQ架构师峰会ppt.z02 2019年InfoQ架构师峰会ppt.zip
《InfoQ_ArchSummit全球架构师峰会_Day1_rebuilt》是InfoQ组织的一场专注于架构设计和技术领导力的盛会。这场会议汇集了全球顶尖的架构师、技术领导者和行业专家,共同探讨和分享了关于软件架构设计的最新趋势、最佳...
爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的...
InfoQ下载器 从Infoq下载演讲,以离线查看。 先决条件 您将需要有上述或 。 此外, 将用于下载幻灯片和视频文件。 如果幻灯片是.swf文件,则需要swfrender的 。 .flv格式的视频将使用转换为.webm 。 用法 克隆...
InfoQ研究中心:2023中国人工智能成熟度模型报告(1).pdf