`
阅读更多

Rss2.0规范

关键字: rss2.0规范
英文原版地址: 
http://www.rssboard.org/rss-specification 
什么是 RSS? 

RSS 是一种站点内容聚合的格式。 

它的名字是Really Simple Syndication 的的简写。 

RSS是XML的一种。所有的RSS文档都遵循 XML 1.0规范, 该规范发布在W3C网站上。 

这里是RSS版本历史的一个概要。 

在一个RSS文档中,最外层是一个<rss>元素,这个元素必须规定version属性,该属性明确了本文档遵从何种RSS版本规范。如果一个RSS文档以这个规范来表示,那么它的version属性就必须是2.0。 

<rss>元素只有一个子元素<channel>,包含了关于这个频道(元数据)和它的内容的一些信息。 

样本文件 

这里有一些RSS样本文件: RSS 0.91, 0.92 和 2.0。 

注意这些样本文件所指向的链接地址和服务器可能已经不再存在。在撰写0.91文档的时候,这个0.91的样本文件就已经创建了。维护一个样本文件的历史也许是一个不错的主意。 

关于本文档 

本文档完成于2002年秋天,版本为 2.0.1。 

它包含从 RSS 0.91 规范(2000年)开始的所有的修改和添加,以及包含在RSS 0.92 (2000年12月)和RSS 0.94(2002年8月)中的新的特性。 

详细的文档历史纪录请参阅这里。 

本文档中首先介绍必须的和可选的频道元素;接着介绍了<item>的子元素。最后回答了一些经常碰到的问题,并提供了未来的发展路线和RSS扩展的指导方针。 


必需的频道元素 

下面是一个必须包含的频道(channel)元素的列表,每一个都有一个简单的描述、一个例子、应该出现的位置和更详细描述的链接地址。 

01.● title  
名称:title 
描述:频道的名称。它表明别人如何访问你的服务。如果你有一个与你的RSS文件内容一致的HTML网站,你的title元素值应该与你的网站的标题相同。 
例子:GoUpstate.com 的新闻大字标题。 

02.● link  
名称:link 
描述:对应频道的网站的URL链接地址。 
例子:http://www.goupstate.com/ 。 

03.● description  
名称:description 
描述:关于频道的描述。 
例子:The latest news from GoUpstate.com, a Spartanburg Herald-Journal Web site。 

可选的频道元素 

下面是一个可选的频道(channel)元素的列表。 

01.● language 
名称:language 
描述:频道使用的语言。比如,在一个网站上,允许聚合所有的意大利语站点到相应的分组。对于这个元素,可使用的值,参阅 Netscape提供的清单。或者可以参阅W3C定义的 清单。 
例子:en-us。 

02.● copyright 
名称:copyright 
描述:频道内容的版权声明。 
例子:Copyright 2002, Spartanburg Herald-Journal 

03.● managingEditor 
名称:managingEditor 
描述:频道内容责任编辑的电子邮件地址。 
例子:geo@herald.com (George Matesky) 

04.● webMaster 
名称:webMaster 
描述:频道技术支持人员的电子邮件地址。 
例子:betty@herald.com (Betty Guernsey) 

05.● pubDate 
名称:pubDate 
描述:频道内容发布的日期。所有的日期和时间都必须遵循 RFC 822规范, 但年份可以用2个或4个字母表示(首选4个字母)。 
例子:Sat, 07 Sep 2002 00:00:01 GMT 

06.● lastBuildDate 
名称:lastBuildDate 
描述:频道内容的最后修改时间。 
例子:Sat, 07 Sep 2002 09:42:31 GMT 

07.● category 
名称:category 
描述:指定频道所属的一个或多个分类。遵循与item级category元素相同的规则。详见这里。 
例子:<category>Newspapers</category> 

08.● generator 
名称:generator 
描述:表明生成频道的程序名称的字符串。 
例子:MightyInHouse Content System v2.3 

09.● docs 
名称:docs 
描述:指向该RSS文件所用格式说明文档的URL链接地址。 
例子:http://blogs.law.harvard.edu/tech/rss。 

10.● cloud 
名称:cloud 
描述:允许通过注册一个cloud来处理获得频道的更新通知,并为rss种子实现一个轻量级的发布订阅协议,详见这里。 
例子:<cloud domain="rpc.sys.com" port="80" path="/RPC2" registerProcedure="pingMe" protocol="soap"/> 

11.● ttl 
名称:ttl 
描述:ttl是Time to live的缩写,表示生存时间。它表示频道从源更新之前可以缓存的时间。详见 这里。 
例子:<ttl>60</ttl>。 

12.● image 
名称:image 
描述:指定一个可以在频道中显示的GIF、JPEG或者 PNG 图像。详见这里。 
例子:。 

13.● rating 
名称:rating 
描述:频道的 PICS 内容分级信息。 
例子: 。 

14.● textInput 
名称:textInput 
描述:指定一个可以在频道中显示的文本输入框。详见这里。 
例子:。 

15.● skipHours 
名称:skipHours 
描述:提示聚合器,可以跳过那些小时的时间段。详见这里。 
例子:。 

16.● skipDays 
名称:skipDays 
描述:提示聚合器,可以跳过那些天的时间段。详见这里。 
例子:。 

<channel>的子元素<image> 

<image> 是 <channel>的一个可选子元素, 它本身包含了三个必须的和三个可选的子元素。 

<url>是一个GIF、JPEG或PNG图像文件的URL链接地址,该图像代表整个频道。 

<title>用于描述上面的图像,当频道在HTML中显示时,用于HTML语言中的<img>的alt属性。 

<link>是要连接的站点的url,当显示频道时,图像的连接指向该站点。(在实际中,<title>和<link>应该与频道的<title>和<link>有相同的值)。 

可选的元素包括<width>和<height>,它们是数字类型,指定图像的宽度和高度,单位为像素。 
<description>就是link的TITLE属性中文本,它将在调用网页时显示出来。 

图像宽度的最大值为144,默认值为88 。 

图像高度的最大值为400,默认值为31 。 

<channel>的子元素<cloud> 

<cloud> 是 <channel>的一个可选子元素。 

它指定一个可以支持rssCloud接口的web服务,rssCloud接口可以在HTTP-POST、XML-RPC或SOAP1.1中实现。 

它的目的是允许通过注册一个cloud来处理获得频道的更新通知,从而为RSS feeds实现一个轻量级的发布订阅协议. 

<cloud domain="rpc.sys.com" port="80" path="/RPC2" registerProcedure="myCloud.rssPleaseNotify" protocol="xml-rpc" /> 

在这个例子中,为了请求频道通知,你需要发送一个XML-RPC消息到rpc.sys.com的80端口,路径为/RPC2。调用的程序为为myCloud.rssPleaseNotify。 

这个元素的详细说明和 rssCloud 接口说明请参阅 这里。 

<channel>子元素<ttl> 

<ttl><channel>的一个可选子元素。 

ttl是Time to live的缩写,表示生存时间。它表示频道从源重新更新之前可以缓存的时间。这使得rss源可以被一个支持文件共享的网络所管理,例如Gnutella。 

例子: <ttl>60</ttl> 

<channel>的子元素<textInput> 

频道可以选择包含一个<textInput>子元素,它本身包含了四个必须的子元素。 

<title>--文本输入区域提交按钮的标签。 

<description>--文本输入区域的描述。 

<name>--文本输入区域中文本对象的名称。 

<link>--处理文本输入请求的CGI脚本的URL链接地址。 

使用<textInput>元素的目的看起来有些神秘。你可以用它提供一个搜索引擎输入框,或让读者提供反馈信息。许多聚合器忽略该元素。 

<item>的元素 

一个频道可以包含许多<item>元素。一个项目可以代表一个"故事" ——比如说一份报纸或杂志上的故事;如果是这样的话,那么项目的描述则是故事的摘要,项目的链接则指向整个故事的链接位置。一个项目也可以本身是完整的,如果是这样的话,项目的描述就包含了文本(整体以HTML格式编码是可以的;参见 例子),而链接和标题可以省略。项目的所有元素都是可选的,但是至少要包含一个标题(title)或描述(description)。 

01.● title 
名称:title 
描述:item的标题。 
例子:Venice Film Festival Tries to Quit Sinking 

02.● link 
名称:link 
描述:item的URL链接地址。 
例子:http://nytimes.com/2004/12/07FEST.html 

03.● description     
名称:description     
描述:item的摘要。 
例子: Some of the most heated chatter at the Venice Film Festival this week was about the way that the arrival of the stars at the Palazzo del Cinema was being staged. 

04.● author 
名称:author 
描述:item作者的电子邮件地址。详见这里。 
例子:。 

05.● category 
名称:category 
描述:包含item在一个或多个分类中。详见这里。 
例子:。 

06.● comments 
名称:comments 
描述:与item相关的评论的URL链接地址。详见 这里。 
例子:。 

07.● enclosure 
名称:enclosure 
描述:item附加的媒体对象。详见这里。 
例子:。 

08.● guid 
名称:guid 
描述:可以唯一确定item身份的字符串。详见 这里。 
例子:。 

09.● pubDate 
名称:pubDate 
描述:item发布的时间。详见 这里。 
例子:。 

10.● source 
名称:source 
描述:rss频道来源。详见 这里。 
例子:。 

<item>的子元素<source> 

<source>是<item>的一个可选子元素。 

它的值是item所属rss频道的名称,从title衍生而来。它有一个必须包含的属性url, 该属性链接到XML序列化源。 

<source url="http://www.tomalak.org/links2.xml">Tomalak's Realm</source> 

该元素的作用是提高链接的声望,从而进一步推广新闻项目的源头。它可以用在聚合器的Post命令中。当从聚合器中通过一个webblog编辑工具提交一个item时,<source>应该能够被自动生成。 

<item>的子元素<enclosure> 

<enclosure>是<item>的一个可选子元素。 

它有三个必须的属性。url属性表明enclosure的位置,length属性表明它的字节大小,而type属性则指出它的标准MIME类型。 

这里的url必须为一个http url。 

<enclosure url="http://www.scripting.com/mp3s/weatherReportSuite.mp3" length="12216320" type="audio/mpeg" /> 

它的 use-case 说明请参见这里。 

<item>的子元素<category> 

<category>是<item>的一个可选子元素。 

它有一个可选属性domain,该属性是一个用来定义分类法的字符串。 

该节点的值是一个斜杠分割的字符串,它用来表明在指定的分类法中的层次位置。处理器可以为分类的识别建立协定。以下是两个例子: 

<category>Grateful Dead</category> 

<category domain="http://www.fool.com/cusips">MSFT</category> 

你可以根据需要为不同的域包含很多<category>元素,并且可以在相同域的不同部分拥有一个交叉引用的item。 

<item>的子元素<pubDate> 

<pubDate> 是<item>的一个可选子元素。 

它的值是一个 日期, 表明项目发布的时间。如果它是一个将来的日期,则聚合器在日期到达之前可以选择不显示该项目。 

<pubDate>Sun, 19 May 2002 15:21:36 GMT</pubDate> 

<item>的子元素<guid> 

<guid>是<item>的一个可选子元素。 

guid 是 globally unique identifier的缩写。它是一个可以唯一识别这个<item>的字符串。在发布之后,聚合器可以选择使用该字符串判断这个<item>是否是新的。 

<guid>http://some.server.com/weblogItem3207</guid> 

guid没有特定的语法规则。聚合器必须将它们当作一个字符串来处理。生成具有唯一性的字符串guid取决于种子的源头。 

如果guid元素有isPermaLink属性,并且值为真,解释器就会认为它是item的permalink。permalink是一个可在web浏览器中打开的url链接,它指向<item>节点所描述的完整item。 例如: 

<guid isPermaLink="true">http://inessential.com/2002/09/01.php#a2</guid> 

isPermaLink是可选属性,默认值为真。如果值为假,guid将不会被认为是一个url或指向任何对象的url。 

<item>的子元素<comments> 

<comments>是<item>的一个可选子元素。 

如果出现,它指向与item相关的评论的url。 

<comments>http://ekzemplo.com/entry/4403/comments</comments> 

更多信息,请参阅 这里。 

<item>的子元素<author> 

<author>是<item>的一个可选子元素。 

它是item作者的电子邮件地址l。对于通过rss传播的报纸和杂志,作者可能是写该item所描述的文章的人。对于聚集型webblogs,作者可能不是责任编辑或站长。对于个人维护的webblog,忽略<author>节点是有意义的。 

<author>lawyer@boyer.net (Lawyer Boyer)</author> 

注释 

RSS限制<link> 和 <url>元素的数据首字母为非空格字符。这些元素的数据必须以IANA-registered URI 方案规定的格式开始,如http://, https://, news://, mailto:和 ftp://等。在RSS2.0规范之前,RSS规范只允许http:// 和 ftp://,然而在实践中,其他的URI方案被内容开发者广泛使用,并被聚合器所支持。聚合器也许对它们支持的URI方案有一些限制,而内容开发者不应该假定所有的聚合器都支持所有的URI方案。 

在 RSS 0.91规范中,各种元素都被限制为500或100个字符。在一个符合0.91规范的频道中,不能超过15个 <item> 元素。在RSS 0.92和以后的规范中,不再有这些字符长度或者XML级别的限制。处理器也许强加一些它们自己的限制,产生者也许有自己的一些参数选择,它们可以规定在一个频道中,不超过一定数目的<item>元素,或者字符串都限制在一定的长度。 

如上所述,在 RSS 2.0规范中,对于一个目录系统,当链接一个频道到它的标识中时,使用基于频道级别的分类特征。例如,如果链接一个频道到它的Syndic8 标识,则将包括一个分类元素作为频道的子元素,它有域“Syndic8”属性,同时在Syndic8 数据库中为你的频道确定这个标识。正确的分类元素脚本应该是 <category domain="Syndic8">1765</category>。 

一个经常被问到的问题是关于< guid> 如何和 <link>进行区别。它们指的是相同的事情吗?在一些内容系统中是,但在别的内容系统中可能不是。在一些系统中,<link> 是一个网络日志项的永久链接。然后在别的系统中,每一个<item>都是一个较长文章的摘要,<link>指向这篇文章,而 <guid>则是这个网络日志入口的永久链接。在所有的情况下,建议提供<guid>,如果可能的话,并使它成为一个永久链接。这使聚合着在内容发生变化时,也不会出现重复项目成为可能。 

如果你对RSS 2.0规范的格式有任何问题,请向由Sjoerd Visscher维护的电子邮件列表RSS2-Support发送邮件。这个邮件列表不是一个技术辩论的列表,而是一个针对作者和开发人员在创建和使用RSS 2.0格式的内容时提供技术支持的列表。 

RSS的扩展 

RSS起源于1999年,目标是成为一个简单、易于理解的数据格式。在它逐渐成为一种流行格式之后,开发者想在一个名字空间中使用模块对它进行扩展,正像W3C定义的那样。 

RSS遵循简单的规则,增加了它的能力。一个RSS feed 可以包含不是在本页中描述的内容,而只是在一个名字空间中定义的那些元素。


本文档中定义的元素不是一个名字空间本省的元素,因此, RSS2.0从某种意义上来讲,和原来的版本是兼容的,即一个 0.91 或者 0.92 版本的文件也是一个有效的 2.0 版本文件。如果RSS2.0的元素是在一个名字空间中,那么这种约束将被打破,即 一个0.9x 版本的文件不可能是一个有效的2.0 版本的文件。 

发展方向 

RSS 决不是一个完美的格式,但是它现在已经非常流行,并得到广泛的支持。要成为一个固定的规范,RSS需要很长的一段时间。这项工作的目的是帮助RSS成为一个固定的事情,同时促进和培育围绕它进行的开发的市场的增长,并为新的聚合格式铺平道路。因此,为了实用的目的,RSS规范将被冻结在2.0.2版本。我们可以预期的可能的2.0.2 或者 2.0.3等版本,都只是出于澄清规范的目的,而不是在格式上增加新的特征。后续的工作应该集中在模块化、名字空间的使用和在完全新的聚合格式中用新的名字等方面。 

许可协议和作者 

RSS 2.0 是在遵循i the Attribution/Share Alike Creative Commons 许可协议  的基础上由 the Berkman Center for Internet & Society at Harvard Law School 提供。本文档的作者是 Dave Winer,UserLand software的创始人,也是 Berkman Center 的员工。(全文完) 
转载出处:http://haka.sharera.com/blog/BlogTopic/12054.htm

分享到:
评论

相关推荐

    RSS2.0规范

    RSS 2.0 规范 RSS(Really Simple Syndication)是一种网页内容联合格式(web content sydication format),它是 XML 的一种。所有的 RSS 文档都遵循 XML 1.0 规范,该规范发布在 W3C 网站上。在一个 RSS 文档的...

    RSS2.0规范及样例

    - **RSS2.0规范.doc**:这应该是RSS2.0规范的详细文档,包含了RSS2.0的所有定义、语法和使用指南。通过阅读这个文档,可以深入理解RSS2.0的结构、语义以及如何创建符合规范的RSS feed。 - **RSS0.92样例.xml**:RSS...

    RSS 2.0规范

    ### RSS 2.0规范详解 #### 一、RSS概览 RSS,全称为Really Simple Syndication,是一种互联网上的内容和元数据格式,主要用于聚合来自不同来源的信息,如新闻、博客和其他更新。RSS的设计旨在简化内容分发和聚合,...

    RSS2.0 规范

    RSS2.0 规范RSS is a Web content syndication format. &lt;br&gt;Its name is an acronym for Really Simple Syndication. &lt;br&gt;RSS is a dialect of XML. All RSS files must conform to the XML 1.0 specification...

    php Rss 2.0 生成类

    4. **生成XML**:一个生成XML的方法,它将所有设置的信息转换为符合RSS 2.0规范的XML字符串。 5. **输出或保存**:最后,类可能提供一个方法来直接输出XML,或者将XML保存到文件。 在使用这个类时,开发者需要注意...

    RSS 2.0 规范.rtf

    什么是 RSS? RSS 是一种站点内容聚合的格式。它的名字是Really Simple Syndication 的的简写。 RSS是XML的一种。所有的RSS文档都遵循 XML 1.0规范, 该规范发布在W3C网站上。

    simple-rss-2.0.zip

    通过"simple-rss-2.0.zip"中的示例,开发者可以学习如何根据RSS 2.0规范创建和解析XML文件,以及如何在Java环境中实现RSS阅读器的核心功能。理解并掌握这些知识,有助于提升开发者在Web开发领域的综合能力,特别是在...

    生成 Rss 2.0 的ASP类

    3. **生成XML**:类的核心功能是将所有数据转换为符合RSS 2.0规范的XML字符串。这通常涉及创建XML元素,如`&lt;rss&gt;`, `&lt;channel&gt;`, `&lt;item&gt;`,并正确地嵌套它们。 4. **头信息处理**:XML文档需要正确的MIME类型...

    RSS 2.0 标准

    RSS 2.0 标准是 RSS 的一个版本,发布于 2002 年秋天,该版本包含从 RSS 0.91 规范(2000 年)开始的任何修改和添加,连同包含在 RSS 0.92(2000 年 12 月)和 RSS 0.94(2002 年 8 月)中的新的特性。 在 RSS 2.0 ...

    RSS 2.0 Spec

    RSS 2.0 规范。

    jQuery插件解析RSS20规范它是基于jFeed

    **jQuery插件解析RSS2.0规范:基于jFeed** RSS(Really Simple Syndication)是一种用于发布和聚合网络内容的XML格式,版本2.0是其最广泛采用的标准。RSS2.0规范允许网站创建可订阅的新闻源,使得用户可以通过RSS...

    RSS 2.0 概述

    RSS 是一种 XML 方言,用于连锁 Web 内容和元数据。RSS 0.91 是几种可用版本中最常用的一种。对于新的 RSS 提要,更好的办法是使用 2.0 版,因为这是现行的规范,而且如前所述,它与 0.91 向后兼容。

    rss.rar_RSS_RSS PHP

    在描述中提到,“RSS2.0生成类”是指这个项目提供了一个PHP类,能够帮助开发者创建符合RSS 2.0规范的XML结构。RSS 2.0是RSS的一个版本,包含了元数据元素,如标题、描述、链接等,用于描述一个内容源的条目。这个...

    Go-GoLang一个RSS2.0和iTunes播客生成器

    二、RSS2.0和iTunes播客规范 1. RSS2.0:RSS2.0是一种XML格式,用于发布新闻、博客和其他经常更新的网站内容。它包含频道信息(如标题、描述和链接)以及一系列条目(每条条目代表一个单独的更新)。RSS2.0还支持...

    DoiceRSS(典石知讯)V3.7.1.2免费安装版

    典石知讯是一款RSS新闻聚合的阅读软件,你可以通过这款软件,自动获取各大... 2、生成RSS2.0规范的RSS; 3、提供后台异步定时刷新RSS频道内容; 4、提供后台异步取或存本地缓存; 5、接收的最新新闻资讯使用新闻资讯提

    rss-2.0-generation-class:RSS 2.0 生成类

    RSS 2.0 生成类是专门为创建和管理符合RSS 2.0规范的XML feed而设计的一个PHP类库。RSS(Really Simple Syndication)是一种常见的数据格式,用于发布经常更新的内容,如博客文章、新闻或播客。通过使用这个类,...

    RSS代码RSS 代码RSS 代码RSS 代码

    除了基本的RSS 2.0规范,还有许多扩展如iTunes RSS扩展用于播客,Atom Feed作为另一种内容聚合格式,以及Media RSS(MRSS)用于多媒体内容。 9. **兼容性和验证** 使用在线工具如FeedValidator对RSS Feed进行验证...

    典石知讯(DoiceRSS) 3.7.2.0.zip

    2、生成RSS2.0规范的RSS; 3、提供后台异步定时刷新RSS频道内容; 4、提供后台异步取或存本地缓存; 5、接收的最新新闻资讯使用新闻资讯提示方式,提醒用户阅读; 6、使用内嵌的IE浏览器浏览和阅读新闻资讯...

    .net RssFeed制作实例下载

    3. 构建XML结构:使用XmlWriter类,按照RSS 2.0规范构造XML结构。例如,创建频道后,添加条目,每个条目对应一个网站文章。 三、实例代码解析 1. 文件RssTool.aspx.cs和Default.aspx.cs:这两个文件可能包含了处理...

Global site tag (gtag.js) - Google Analytics