`
ruruhuang
  • 浏览: 193220 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

RSS Feed autodiscovery.

阅读更多
使用一些浏览器的浏览某个页面时会提示你这个页面有那些Rss源。她时怎样做的呢??

不过是在HTML里的<head>部分里加一行代码,类似:

<link rel="alternate" type="application/rss+xml" title="Default RSS1.0 feed" <br="">href="http://www.zhangyining.net/weblog/rss/rss.pl"/>

这行代码的作用就是告诉访问该页面的客户端程序(浏览器,RSS Reader,或者是RSS聚合
器)该页面提供RSS Feed以及该Feed的地址,这样,客户端程序可以直接反馈给用户提示用
户可以订阅的内容(例子:桌面或者基于浏览器的RSS Reader),或者自动聚合内容(例子
:RSS搜索引擎)。

Ok。 我用java实现这一功能。代码如下。。需要nekohtml-0.9.5.jar 和 xercesImple-2.6.2.jar

    /**
     * This function is Feed Autodiscovery, You just need passing the url, It would
     * return the feeds.
     *
     * Rule,  gets the elements "<linke>", check the type attribute whether is rss-xml type,
     * if true, get the href attribute.
     *
     * @param url   the page url that need to discovery
     * @return      Feed list
     */
    public static List<string> discoveryFeedList(String url){
        List<string> rt = new ArrayList<string>();
        if (StringUtils.isBlank(url)){
            return rt;
        }
       
        DOMParser parser = new DOMParser();
        try {
            parser.parse(url);
        }catch(Exception e){
            // ignore the exception; just return empty value;
            return rt;
        }
        NodeList list = parser.getDocument().getElementsByTagName("link");
        for(int i=0; i<list.getlength(); i++){<br="">            Node node = list.item(i);
            String rssurl = getRssUrl(node, url);
            if (StringUtils.isNotBlank(rssurl)){
                rt.add(rssurl);
            }
        }
        return rt;
    }
   
    /**
     * dig rss url.
     * @param node
     * @return    URL,  if not found, return null.
     */
    private static String getRssUrl(Node node, String url){
        if (node == null || node.getAttributes().getLength() == 0){
            return null;
        }
        // Map<attriname, attrivalue="">
        Map<string, string=""> attriMap = new HashMap<string, string="">();
        for(int i=0; i<node.getattributes().getlength(); i++){<br="">            attriMap.put(node.getAttributes().item(i).getNodeName(), node
                    .getAttributes().item(i).getNodeValue());
           
        }
        String type = attriMap.get("type");
        if (!StringUtils.isBlank(type)
                && (type.equalsIgnoreCase("application/rss+xml") ||
                        type.equalsIgnoreCase("application/atom+xml"))) {
            String href = attriMap.get("href");
            if (!StringUtils.isBlank(href) && href.toLowerCase().startsWith("http")){
                return href;
            }else{
                return url.trim().endsWith("/") ? url + href : url + "/" + href;
            }
        }
        return null;
    }
分享到:
评论

相关推荐

    RSSFeed 类

    7. **兼容性和标准遵循**: 一个好的RSSFeed 类应该支持RSS的不同版本(如RSS 2.0),并且遵循W3C的XML和RSS规范,确保生成的Feed能在各种RSS阅读器和聚合器中正常工作。 8. **错误处理与验证**: 类可能还包含一些...

    网络安全相关的RSS订阅列表资料.zip

    网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip网络安全相关的RSS订阅列表资料.zip...

    RSS.zip_Rome.jar_java r_java rss_rss feed jar_rss java

    标题中的“RSS.zip_Rome.jar_java r_java rss_rss feed jar_rss java”表明这是一个与Java RSS处理相关的资源包,其中包含了Rome库的jar文件和其他可能的Java代码示例。Rome是Java社区中一个流行的RSS和Atom聚合库,...

    .net RssFeed制作实例下载

    2. Rss.xml:这个文件可能是预定义的RSS Feed模板,或者是一个示例RSS Feed文件,用于参考或测试。 四、项目配置 1. web.config:此文件是ASP.NET应用程序的配置文件,包含数据库连接字符串、应用程序设置等关键...

    RSS 全文输出转换..源码.

    这通常涉及到解析RSS feed的各个元素,如`&lt;title&gt;`、`&lt;description&gt;`、`&lt;content:encoded&gt;`等。以下是一个简单的RSS Feed解析示例: ```java import com.rometools.rome.feed.synd.SyndFeed; import ...

    rss.jar.zip_RSS_RSS j_rss.jar

    标题中的"rss.jar.zip_RSS_RSS j_rss.jar"提到了RSS和一个名为"j_rss.jar"的Java档案,这通常是一个包含RSS处理功能的Java库。RSS(Really Simple Syndication)是一种用于发布和订阅网站内容的XML格式。RSS源允许...

    rss.rar_ RSS asp.net_RSS asp.net_asp.net_asp.net rss_rss asp.n

    标题中的“rss.rar_ RSS asp.net_RSS asp.net_asp.net_asp.net rss_rss asp.n”暗示这是一个关于使用ASP.NET实现RSS(Really Simple Syndication)功能的压缩包资源。RSS是一种用于发布和订阅网站内容的XML格式,常...

    Node.js-使用RSS分类订阅稀土掘金

    2. **RSS Feed解析**: `rss-parser`库可以帮助我们解析XML格式的RSS数据,提取出文章标题、链接、发布日期等信息。 3. **稀土掘金API**: 虽然稀土掘金的官方API可能有限,但开发者可能通过分析其网站结构来模拟请求...

    wp-autopost.2.9.2_wp-autopost.2.9.2_wp采集_源码

    它支持多种数据源,包括RSS订阅、XML、JSON等,这意味着你可以从任何提供这些格式的网站中抓取内容。此外,插件还支持自定义规则设置,如过滤关键词、修改标题、调整内容格式等,确保采集内容的质量和适应性。 在...

    rss-feed.cr:重写https:github.comga2merrss-feed-emitter.cr

    2. **rss-feed-parser** 和 **feed-parser**:表示该项目具有RSS Feed解析的功能,能够将XML格式的RSS Feed数据转换为可操作的对象。 3. **feed-aggregator**:暗示项目可能包含聚合RSS Feed的能力,即从多个源收集...

    RSSFeed

    **RSSFeed类库详解** RSS(Really Simple Syndication)是一种基于XML的格式,用于发布新闻、博客和其他在线内容,使得用户可以通过RSS阅读器订阅并获取更新。RSSFeed类库是专为简化RSS文件生成而设计的,它允许...

    outage-events-feed-waba.rss

    outage-events-feed-waba.rss

    ASP SQL Server环境下RSS Feed的程序实现.pdf

    【ASP SQL Server环境下RSS Feed的程序实现】 ASP(Active Server Pages)是一种服务器端脚本环境,常用于构建动态网页应用。结合SQL Server数据库,可以创建高效的数据驱动网站。RSS(Really Simple Syndication)...

    rss(JAVA).zip_ rss_RSS_RSS Reader_RSS java downlo_java rss

    标题中的"rss(JAVA).zip_ rss_RSS_RSS Reader_RSS java downlo_java rss"揭示了这个压缩包是一个使用Java语言开发的RSS阅读器项目。RSS(Really Simple Syndication)是一种数据格式,用于发布新闻、博客和其他定期...

    rssfeeds-main.rar

    通过解析RSS feed,用户可以获取到最新的更新,而无需逐个访问各个网站。 【描述】"rssfeeds-main.rar" 的描述简洁,没有提供具体细节,但我们可以推测这可能是一个项目或应用的源代码库,专注于处理RSS feeds的...

    Android代码-Rss订阅源码Demo.zip

    - RSS feed通常包含文章的标题、摘要、链接以及发布日期等信息。 2. **Android RSS阅读器应用结构**: - 用户界面:通常包含一个列表视图展示RSS项,以及一个详情视图展示选定项目的完整内容。 - 数据获取:通过...

    rss-feed-emitter.cr:用于Crystal的RSS feed聚合器

    **rss-feed-emitter.cr:为Crystal打造的RSS订阅源生成器** `rss-feed-emitter.cr` 是一个专门针对Crystal编程语言开发的库,用于创建和管理RSS(Really Simple Syndication)订阅源。RSS是一种XML格式,常用于发布...

    计算机软件-编程源码-FeedReader290.Source.zip

    FeedReader可能是用一种面向对象的编程语言实现的,因为这种类型的软件通常需要处理数据结构(如RSS feed的XML格式)、网络通信(获取和解析远程feed)以及用户界面(显示和交互)等功能,这些都可以在面向对象的...

    RSS reader

    RSS Feed Auto Discovery (用内建浏览器时自动识别网页上的RSS feed) 频道浏览统计 查找功能 100% Unicode内核,支持多国语言同屏显示 内建浏览器,自动拦截弹出窗口 绿色软件800KB,免安装,展开直接使用

    Plenary Pro v3.0 for Android 一个现代的RSS阅读器「RSS feed阅读器」.rar

    Plenary Pro v3.0是一款专为Android平台设计的现代RSS阅读器,它提供了一种高效、便捷的方式来订阅和管理RSS feed,使用户能够轻松跟踪自己感兴趣的新闻、博客和其他在线内容。这款应用的出现,旨在解决传统网页浏览...

Global site tag (gtag.js) - Google Analytics