浏览 3443 次
锁定老帖子 主题:InfoQ的自动新闻订阅
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2008-06-21
发邮件部分就不贴了,就给一个大概的思路吧。主要是学习hpricot。在RSS方面javaeye做的很好。 require "rubygems" require 'hpricot' require 'open-uri' HOST_NAME="http://www.infoq.com" doc = Hpricot(open("http://www.infoq.com/cn/ruby")) p = doc.search("//h1/a") result = [] p.each do |pitem| href = pitem.get_attribute("href") title = pitem.search("//text()") result << [title, href] if href =~ /\/cn\// end result.each do |items| doc = Hpricot(open(HOST_NAME + items[1])) # puts items[0] doc.search("//div[@class='box-content-5']//p[@class='h1-r']").remove doc.search("//div[@class='box-content-5']//p[@class='info']").remove doc.search("//div[@class='box-content-5']//dl").remove doc.search("//div[@class='box-content-5']//div[@class='vendor-content-box-float']").remove doc.search("//div[@class='box-content-5']//div[@class='vendor-content-box']").remove doc.search("//div[@class='box-content-5']//div[@class='comments-header']").remove doc.search("//div[@class='box-content-5']//div[@class='forum-list-tree']").remove doc.search("//div[@class='box-content-5']//div[@class='comments-sort']").remove doc.search("//div[@class='box-content-5']//ol").remove doc.search("//div[@class='box-content-5']//script").remove doc.search("//div[@class='box-content-5']//br").remove doc.search("//div[@class='box-content-5']//text()") do |item| puts item end puts "_______________________________________________________________________\n\n" end 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2008-06-21
RSS输出全文的在国内还是少数,InfoQ这样做也无可厚非,特别是作为一个新闻站点,如果输出全文的话,流量就会少很多。
不过JavaEye一直坚持输出全文RSS,要赞一个。 |
|
返回顶楼 | |
发表时间:2008-06-24
我就喜欢javaeye这一点!虽然全文输出了,但是遇到我比较关注的论坛贴,一定会点进来的!
|
|
返回顶楼 | |
发表时间:2008-06-30
还是喜欢全文输出,我从RSS reader点进来主要是为了看回复, 不是有句“回复更精彩”吗?
|
|
返回顶楼 | |