import java.io.bufferedinputstream;import java.net.malformedurlexception;import java.net.url;import java.net.urlconnection;import java.util.list;import org.junit.ignore;import org.junit.test;import org.xml.sax.inputsource;import com.sun.syndication.feed.wirefeed;import com.sun.syndication.feed.module.module;import com.sun.syndication.feed.rss.channel;import com.sun.syndication.feed.rss.item;import com.sun.syndication.feed.synd.syndentry;import com.sun.syndication.feed.synd.syndfeed;import com.sun.syndication.feed.synd.syndfeedimpl;import com.sun.syndication.io.syndfeedinput;import com.sun.syndication.io.wirefeedinput;import com.sun.syndication.io.xmlreader;//rss(简易资讯聚合)//rss也叫聚合rss是在线共享内容的一种简易方式(也叫聚合内容,really simple syndication)。public class simplerometest { @ignore @test public void testfetchjavaeyeopml() throws exception { url javaeyeurl = new url("http://www.iteye.com/rss"); wirefeedinput feedinput = new wirefeedinput(); wirefeed feed = feedinput.build(new xmlreader(javaeyeurl)); } @test public void testfetchjavaeyenewsrss() throws exception { url javaeyeurl = new url("http://www.iteye.com/rss/news/"); stringbuffer sb = new stringbuffer(1024*1024); bufferedinputstream is = new java.io.bufferedinputstream(javaeyeurl.openconnection().getinputstream()); int ch = is.read(); while(ch != -1) { sb.append((char)ch); ch = is.read(); } system.out.println(new string(sb.tostring().getbytes("iso-8859-1"), "utf-8")); /** * <!doctype html public "-//w3c//dtd html 4.01 transitional//en"<!doctype html public "-//w3c//dtd xhtml 1.0 transitional//en" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-cn" dir="ltr"> <head> <meta http-equiv="content-type" content="text/html; charset=utf-8" /> <meta name="keyword" content="javaeye,it,开发,交流,社区,java, ruby, ajax, agile" /> <title>您的访问请求被拒绝 - javaeye技术社区</title> <style type="text/css"> .clearfix:after { content: "."; display: block; height: 0; clear: both; visibility: hidden; } .clearfix { display:block; } .left { float: left; } h1 {font-size: 20px;color: #6293bb;} p {font-size: 14px;color: #6293bb;} </style> </head> <body> <div style="padding:50px 0 0 300px"> <h1>您的访问请求被拒绝</h1> </div> <div class="clearfix"> <div class="left" style="padding-left:120px"> <img src="/images/filenotfound.jpg" width="128" height="128" /> </div> <div class="left" style="width:700px;padding:30px 0 0 30px"> <p>您可能使用了网络爬虫抓取javaeye网站页面!</p> <p>javaeye网站不允许您使用网络爬虫对javaeye进行恶意的网页抓取,请您立刻停止该抓取行为!</p> <p>如果您的网络爬虫不属于恶意抓取行为,希望javaeye网站允许你进行网页抓取,请和javaeye管理员联系,取得授权: webmaster<img src='/images/email.gif' alt="email" />support.iteye.com</p> <p>如果您确实使用浏览器访问,但是被错误的识别为网络爬虫,请将您浏览器发送的“user agent”信息告知我们,帮助我们解决错误: webmaster<img src='/images/email.gif' alt="email" />support.iteye.com</p> </div> </div> <div style="padding:20px 0 0 500px"> <a href="http://www.iteye.com"><img src='/images/logo_small.gif' border='0'></a> </div> </body></html> */ // syndfeedinput feedinput = new syndfeedinput(true);// syndfeed feed = feedinput.build(new inputsource(javaeyeurl.openstream()));// // rome中rss的可选标准 // // rss_0.90, rss_0.91, rss_0.92, rss_0.93, rss_0.94, rss_1.0, rss_2.0, atom_0.3 // list<syndentry> entries = feed.getentries();// // for(syndentry entry : entries) {// system.out.println("title:" + entry.gettitle());// system.out.println("desc:" + entry.getdescription());// system.out.println("link:" + entry.getlink());// system.out.println("date:" + entry.getpublisheddate());// system.out.println("==================================");// system.out.println("==================================");// system.out.println("==================================");// } } @test public void testfetchjavaeyenewsrsswithhttpclient() throws exception { url javaeyeurl = new url("http://www.iteye.com/rss/news/"); urlconnection conn = javaeyeurl.openconnection(); conn.setrequestproperty("user-agent", "mozilla/5.0 (windows; u; windows nt 5.1; zh-cn; rv:1.9.2.3) gecko/20100401 firefox/3.6.3"); syndfeedinput feedinput = new syndfeedinput(true); syndfeed feed = feedinput.build(new inputsource(conn.getinputstream())); // rome中rss的可选标准 // rss_0.90, rss_0.91, rss_0.92, rss_0.93, rss_0.94, rss_1.0, rss_2.0, atom_0.3 list<syndentry> entries = feed.getentries(); for(syndentry entry : entries) { system.out.println("title:" + entry.gettitle()); system.out.println("desc:" + entry.getdescription().getvalue()); system.out.println("link:" + entry.getlink()); system.out.println("date:" + entry.getpublisheddate()); system.out.println("=================================="); system.out.println("=================================="); system.out.println("=================================="); } }}
分享到:
相关推荐
javaeye被黑 大家看看
"JavaEye博文" 本资源摘要信息来自JavaEye博文,作者cutesunshineriver,发布于2010年。该博文涵盖了软件开发、编程、项目管理等多方面的知识点。 在本博文中,我们可以看到多个与软件开发相关的知识点,包括: 1...
JavaEye热点阅读是JavaEye论坛推出的2009年2月特辑,旨在为Java学习者和开发者提供最新的知识及行业动态。这份资料包含了多个Java相关的主题,包括但不限于并发编程、开源项目、设计模式、框架应用以及软件开发实践...
以抓取javaeye博客内容为例,展示了系统如何根据预先设定的规则,抓取特定博客的文章标题、作者、发布时间等信息。虽然系统存在上述问题,但在一定范围内仍能有效执行内容抓取任务。 综上所述,基于JAVA技术的网页...
JavaEye+技术架构,讲述java框架的应用
javaeye的信息提示框代码之css,application.js
JavaEye网站架构解密:硬件与软件架构的深度解析 一、JavaEye网站架构的进化历程 JavaEye作为中国早期的IT技术社区之一,其网站架构经历了从简单到复杂、从单机到集群的演变过程。最初,JavaEye仅依靠两台1U服务器...
### JavaEye3.0开发手记之开发环境搭建详解 #### 一、开发环境搭建概述 随着JavaEye3.0开发计划的启动,本篇文章将详细介绍如何为该项目搭建高效的开发环境。开发过程中不仅需要考虑软件的选择,还需要针对操作...
JavaEye新闻月刊2009年3月第13期内容涉及了当时软件开发领域内的一系列重要话题,包括IBM拟收购Sun Microsystems公司的新闻报道、Java社区对此的看法以及各种编程语言、开发工具和技术的新动态。 首先,新闻月刊...
javaeye 论坛小测试 javaeye论坛小测试答案 javaeye论坛测试答案 这下你们就省事了。
JavaEye Client SourceCode是一个开源项目,专为Android平台设计,提供了JavaEYE的客户端实现。这个项目的源代码为我们提供了一个深入了解Android应用开发以及Java编程在移动设备上的实践的宝贵资源。接下来,我们将...
JavaEye是一款知名的面向开发者的技术社区,它提供了丰富的代码展示功能,其中包括代码高亮显示。在WordPress等博客平台中,为了使代码段在文章中清晰易读,通常会使用代码高亮插件。JavaEye的代码高亮插件以其简洁...
JavaEye是一个基于Android平台的应用程序,它展示了在移动设备上构建功能丰富的软件的可能性。这个小应用旨在为开发者提供灵感和指导,帮助他们更好地理解和实践Android应用开发。让我们深入探讨一下这个应用背后的...
标题“测试JavaEye的PDF生成效果”提示我们关注的是一个使用JavaEye库生成PDF文档的实践过程。JavaEye可能是一个用于Java平台的开源库,它提供了将数据转换为PDF格式的功能,这对于创建报告、手册或其他需要打印或...
javaeye 新闻月刊 2010 4月
JavaEye的API使用帮助是一个针对JavaEye开发框架的详细指南,旨在帮助开发者更好地理解和应用这个框架。这个压缩包包含了三个文件:一个PDF文档,一个TXT文本文件,以及一个URL链接。接下来,我们将深入探讨JavaEye ...
JavaEye客户端是一款基于Java开发的开源软件,专为学习和理解客户端编程技术而设计,尤其适合初学者。这个客户端代码库包含了许多与网络通信相关的功能,主要集中在HTTP协议的使用和数据解析上。通过深入研究JavaEye...