使用一些浏览器的浏览某个页面时会提示你这个页面有那些Rss源。她时怎样做的呢??
不过是在HTML里的<head>部分里加一行代码,类似:
<link rel="alternate" type="application/rss+xml" title="Default RSS1.0 feed" <br="">href="
http://www.zhangyining.net/weblog/rss/rss.pl"/>
这行代码的作用就是告诉访问该页面的客户端程序(浏览器,RSS Reader,或者是RSS聚合
器)该页面提供RSS Feed以及该Feed的地址,这样,客户端程序可以直接反馈给用户提示用
户可以订阅的内容(例子:桌面或者基于浏览器的RSS Reader),或者自动聚合内容(例子
:RSS
搜索引擎)。
Ok。 我用java实现这一功能。代码如下。。需要nekohtml-0.9.5.jar 和 xercesImple-2.6.2.jar
/**
* This function is Feed Autodiscovery, You just need passing the url, It would
* return the feeds.
*
* Rule, gets the elements "<linke>", check the type attribute whether is rss-xml type,
* if true, get the href attribute.
*
* @param url the page url that need to discovery
* @return Feed list
*/
public static List<string> discoveryFeedList(String url){
List<string> rt = new ArrayList<string>();
if (StringUtils.isBlank(url)){
return rt;
}
DOMParser parser = new DOMParser();
try {
parser.parse(url);
}catch(Exception e){
// ignore the exception; just return empty value;
return rt;
}
NodeList list = parser.getDocument().getElementsByTagName("link");
for(int i=0; i<list.getlength(); i++){<br=""> Node node = list.item(i);
String rssurl = getRssUrl(node, url);
if (StringUtils.isNotBlank(rssurl)){
rt.add(rssurl);
}
}
return rt;
}
/**
* dig rss url.
* @param node
* @return URL, if not found, return null.
*/
private static String getRssUrl(Node node, String url){
if (node == null || node.getAttributes().getLength() == 0){
return null;
}
// Map<attriname, attrivalue="">
Map<string, string=""> attriMap = new HashMap<string, string="">();
for(int i=0; i<node.getattributes().getlength(); i++){<br=""> attriMap.put(node.getAttributes().item(i).getNodeName(), node
.getAttributes().item(i).getNodeValue());
}
String type = attriMap.get("type");
if (!StringUtils.isBlank(type)
&& (type.equalsIgnoreCase("application/rss+xml") ||
type.equalsIgnoreCase("application/atom+xml"))) {
String href = attriMap.get("href");
if (!StringUtils.isBlank(href) && href.toLowerCase().startsWith("http")){
return href;
}else{
return url.trim().endsWith("/") ? url + href : url + "/" + href;
}
}
return null;
}
分享到:
相关推荐
7. **兼容性和标准遵循**: 一个好的RSSFeed 类应该支持RSS的不同版本(如RSS 2.0),并且遵循W3C的XML和RSS规范,确保生成的Feed能在各种RSS阅读器和聚合器中正常工作。 8. **错误处理与验证**: 类可能还包含一些...
网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip...
标题中的“RSS.zip_Rome.jar_java r_java rss_rss feed jar_rss java”表明这是一个与Java RSS处理相关的资源包,其中包含了Rome库的jar文件和其他可能的Java代码示例。Rome是Java社区中一个流行的RSS和Atom聚合库,...
2. Rss.xml:这个文件可能是预定义的RSS Feed模板,或者是一个示例RSS Feed文件,用于参考或测试。 四、项目配置 1. web.config:此文件是ASP.NET应用程序的配置文件,包含数据库连接字符串、应用程序设置等关键...
这通常涉及到解析RSS feed的各个元素,如`<title>`、`<description>`、`<content:encoded>`等。以下是一个简单的RSS Feed解析示例: ```java import com.rometools.rome.feed.synd.SyndFeed; import ...
标题中的"rss.jar.zip_RSS_RSS j_rss.jar"提到了RSS和一个名为"j_rss.jar"的Java档案,这通常是一个包含RSS处理功能的Java库。RSS(Really Simple Syndication)是一种用于发布和订阅网站内容的XML格式。RSS源允许...
标题中的“rss.rar_ RSS asp.net_RSS asp.net_asp.net_asp.net rss_rss asp.n”暗示这是一个关于使用ASP.NET实现RSS(Really Simple Syndication)功能的压缩包资源。RSS是一种用于发布和订阅网站内容的XML格式,常...
2. **RSS Feed解析**: `rss-parser`库可以帮助我们解析XML格式的RSS数据,提取出文章标题、链接、发布日期等信息。 3. **稀土掘金API**: 虽然稀土掘金的官方API可能有限,但开发者可能通过分析其网站结构来模拟请求...
它支持多种数据源,包括RSS订阅、XML、JSON等,这意味着你可以从任何提供这些格式的网站中抓取内容。此外,插件还支持自定义规则设置,如过滤关键词、修改标题、调整内容格式等,确保采集内容的质量和适应性。 在...
2. **rss-feed-parser** 和 **feed-parser**:表示该项目具有RSS Feed解析的功能,能够将XML格式的RSS Feed数据转换为可操作的对象。 3. **feed-aggregator**:暗示项目可能包含聚合RSS Feed的能力,即从多个源收集...
**RSSFeed类库详解** RSS(Really Simple Syndication)是一种基于XML的格式,用于发布新闻、博客和其他在线内容,使得用户可以通过RSS阅读器订阅并获取更新。RSSFeed类库是专为简化RSS文件生成而设计的,它允许...
outage-events-feed-waba.rss
【ASP SQL Server环境下RSS Feed的程序实现】 ASP(Active Server Pages)是一种服务器端脚本环境,常用于构建动态网页应用。结合SQL Server数据库,可以创建高效的数据驱动网站。RSS(Really Simple Syndication)...
标题中的"rss(JAVA).zip_ rss_RSS_RSS Reader_RSS java downlo_java rss"揭示了这个压缩包是一个使用Java语言开发的RSS阅读器项目。RSS(Really Simple Syndication)是一种数据格式,用于发布新闻、博客和其他定期...
通过解析RSS feed,用户可以获取到最新的更新,而无需逐个访问各个网站。 【描述】"rssfeeds-main.rar" 的描述简洁,没有提供具体细节,但我们可以推测这可能是一个项目或应用的源代码库,专注于处理RSS feeds的...
- RSS feed通常包含文章的标题、摘要、链接以及发布日期等信息。 2. **Android RSS阅读器应用结构**: - 用户界面:通常包含一个列表视图展示RSS项,以及一个详情视图展示选定项目的完整内容。 - 数据获取:通过...
**rss-feed-emitter.cr:为Crystal打造的RSS订阅源生成器** `rss-feed-emitter.cr` 是一个专门针对Crystal编程语言开发的库,用于创建和管理RSS(Really Simple Syndication)订阅源。RSS是一种XML格式,常用于发布...
FeedReader可能是用一种面向对象的编程语言实现的,因为这种类型的软件通常需要处理数据结构(如RSS feed的XML格式)、网络通信(获取和解析远程feed)以及用户界面(显示和交互)等功能,这些都可以在面向对象的...
RSS Feed Auto Discovery (用内建浏览器时自动识别网页上的RSS feed) 频道浏览统计 查找功能 100% Unicode内核,支持多国语言同屏显示 内建浏览器,自动拦截弹出窗口 绿色软件800KB,免安装,展开直接使用
Plenary Pro v3.0是一款专为Android平台设计的现代RSS阅读器,它提供了一种高效、便捷的方式来订阅和管理RSS feed,使用户能够轻松跟踪自己感兴趣的新闻、博客和其他在线内容。这款应用的出现,旨在解决传统网页浏览...