`
arkxu
  • 浏览: 43202 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

InfoQ的自动新闻订阅

阅读更多
发现InfoQ的RSS很不厚道,只现实一个该要。想要知道详细内容的话不得不点进去看。如果用手机的话流量剧增。那么我就写了一个很简单的ruby代码,比如把InfoQ的和ruby相关的新闻提出来。每天晚上发到我的邮箱,那么我就不用理会网页上的那么多广告了。

发邮件部分就不贴了,就给一个大概的思路吧。主要是学习hpricot。在RSS方面javaeye做的很好。

require "rubygems"

require 'hpricot'
require 'open-uri'

HOST_NAME="http://www.infoq.com"

doc = Hpricot(open("http://www.infoq.com/cn/ruby"))
p = doc.search("//h1/a")

result = []
p.each do |pitem|
  href = pitem.get_attribute("href")
  title = pitem.search("//text()")
  result << [title, href] if href =~ /\/cn\//
end

result.each do |items|
  doc = Hpricot(open(HOST_NAME + items[1]))
#  puts items[0]
  doc.search("//div[@class='box-content-5']//p[@class='h1-r']").remove
  doc.search("//div[@class='box-content-5']//p[@class='info']").remove
  doc.search("//div[@class='box-content-5']//dl").remove
  doc.search("//div[@class='box-content-5']//div[@class='vendor-content-box-float']").remove
  doc.search("//div[@class='box-content-5']//div[@class='vendor-content-box']").remove  
  doc.search("//div[@class='box-content-5']//div[@class='comments-header']").remove
  doc.search("//div[@class='box-content-5']//div[@class='forum-list-tree']").remove
  doc.search("//div[@class='box-content-5']//div[@class='comments-sort']").remove
  doc.search("//div[@class='box-content-5']//ol").remove
  doc.search("//div[@class='box-content-5']//script").remove
  doc.search("//div[@class='box-content-5']//br").remove
  doc.search("//div[@class='box-content-5']//text()") do |item|
    puts item
  end
  puts "_______________________________________________________________________\n\n"
end


分享到:
评论
3 楼 rainchen 2008-06-30  
还是喜欢全文输出,我从RSS reader点进来主要是为了看回复, 不是有句“回复更精彩”吗?
2 楼 chris_in 2008-06-24  
我就喜欢javaeye这一点!虽然全文输出了,但是遇到我比较关注的论坛贴,一定会点进来的!
1 楼 都别装了 2008-06-21  
RSS输出全文的在国内还是少数,InfoQ这样做也无可厚非,特别是作为一个新闻站点,如果输出全文的话,流量就会少很多。
不过JavaEye一直坚持输出全文RSS,要赞一个。

相关推荐

    Infoq架构师2016合集

    《InfoQ架构师2016合集》是面向IT专业人士,尤其是架构师群体的一份珍贵资源,集合了2016年InfoQ平台上的众多精彩文章和讨论,旨在分享和探讨当时的最新技术和最佳实践。InfoQ作为一个全球知名的IT资讯网站,其内容...

    infoq 架构师8月刊

    infoq 架构师8月刊 infoq 架构师8月刊 infoq 架构师8月刊

    infoq_topic

    5. 开发工具使用:介绍和对比不同的开发工具,如IDE、版本控制、自动化工具等。 6. 构建与部署:讲解如何设置高效的构建流程,以及CI/CD的实现和优化。 7. 工具集成:展示如何将多种工具整合到开发流程中,提高团队...

    InfoQ架构师月刊 0710

    文章中提到了AIOps的终极价值,AIOps将人工智能应用于IT操作,以提升自动化和智能化水平,从而减少人为错误,提高效率。 此外,月刊还提到了软件测试技术的未来,这意味着本期月刊可能探讨了软件测试领域在AI和机器...

    infoq 架构师 2019年月刊收集

    infoq 架构师 2019年月刊收集 infoq 架构师 2019年月刊收集

    infoq架构师月刊下部

    合集可能涵盖Jenkins、GitLab CI/CD等工具的使用,以及如何通过自动化流程提升软件交付效率。 6. **安全性与隐私保护**:在网络安全日益重要的背景下,架构师需要了解如何设计安全的系统。合集可能涉及身份验证、...

    infoq架构师月刊上部

    《infoQ架构师月刊上部》集合了2008年至2012年间infoQ平台上关于架构领域的精华文章和讨论,旨在为IT行业的专业人士,尤其是架构师们提供宝贵的参考资料。InfoQ是一个全球知名的软件开发资讯平台,以其深度、专业和...

    InfoQ云生态期刊(全套)

    InfoQ云生态期刊是一系列深度探讨云计算领域动态、技术趋势和实践案例的专业出版物。这套期刊涵盖了从第一期到第八期的完整内容,为读者提供了丰富的云计算知识库。InfoQ作为一个知名的IT信息与社区平台,其发布的云...

    2019年InfoQ架构师峰会ppt.z01

    ArchSummit北京2019大会演讲 PPT 分共三个压缩包 2019年InfoQ架构师峰会ppt.z01 2019年InfoQ架构师峰会ppt.z02 2019年InfoQ架构师峰会ppt.zip

    infoq系统架构与前沿技术

    9. 持续集成/持续部署(CI/CD):这一自动化流程在提高软件开发效率上发挥了重要作用,杂志可能介绍了CI/CD的最佳实践和工具链,如Jenkins、GitLab CI等。 10. 大数据处理:Hadoop和MapReduce等技术在2009年正处于...

    infoq-downloader, 下载InfoQ的演示文稿,包括视频&幻灯片,以离线播放它们.zip

    infoq-downloader, 下载InfoQ的演示文稿,包括视频&幻灯片,以离线播放它们 下载是许多有用会话的优秀资源。 他们查看演示文稿与幻灯片同步的方式很酷。 我的网络连接很慢,这让我的浏览体验变得。 为了解决这个问题...

    InfoQ2024中国AGI市场发展研究报告.pdf

    【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf【InfoQ】2024中国AGI市场发展研究报告.pdf...

    InfoQ2024中国开发者画像洞察研究报告.pdf

    【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像洞察研究报告.pdf【InfoQ】2024中国开发者画像...

    2019年InfoQ架构师峰会ppt.z02

    ArchSummit北京2019大会演讲 PPT 分共三个压缩包------整理上传 2019年InfoQ架构师峰会ppt.z01 2019年InfoQ架构师峰会ppt.z02 2019年InfoQ架构师峰会ppt.zip

    InfoQ_ArchSummit全球架构师峰会

    《InfoQ_ArchSummit全球架构师峰会_Day1_rebuilt》是InfoQ组织的一场专注于架构设计和技术领导力的盛会。这场会议汇集了全球顶尖的架构师、技术领导者和行业专家,共同探讨和分享了关于软件架构设计的最新趋势、最佳...

    基于aiohttp的infoq技术资讯网站爬虫.zip

    爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的...

    infoq-downloader:从Infoq下载演讲以离线查看

    InfoQ下载器 从Infoq下载演讲,以离线查看。 先决条件 您将需要有上述或 。 此外, 将用于下载幻灯片和视频文件。 如果幻灯片是.swf文件,则需要swfrender的 。 .flv格式的视频将使用转换为.webm 。 用法 克隆...

    InfoQ研究中心:2023中国人工智能成熟度模型报告(1).pdf

    InfoQ研究中心:2023中国人工智能成熟度模型报告(1).pdf

Global site tag (gtag.js) - Google Analytics