原著:Aaron Skonnard
翻译:NorthTibet
原文出处:MSDN Magazine Apr. 2004(The XML Files)
什么是 Blog?
"Blog"是 Web Log 的简称(译者注:也就是网志(中国大陆也叫博客))。它是一种作者与读者以日志风格进行交互的中介。在软件社区,人们以网志形式来共享观念与思想变得越来越流行。如:http://blogs.msdn.com 就是 MSDN 上的一个 blogging。
建立网志最轻松的方法是什么?
要想建立自己的网志,最容易的方法是到类似 blogger.com 这样的站点注册一个新用户,它提供一个创建自定义网志的 Web 界面,并且可以立即使用所创建的网志。类似 blogger.com 的站点有很多,它们都提供对网志特性的支持。 如果你想更多地控制网志的基础结构或者想要在自己的服务器上建立网志服务系统。你可在以下最流行的几种网志应用商业产品中选择其一:Radio Userland、Manila 和 Movable Type。还有些易用的免费 .NET 网志应用可以使用,最流行的有:.TEXT 和 dasBlog。只要把它们下载下来,然后按照安装说明进行安装与设置,分分钟便可建立起一个可运行的网志服务系统。 从功能上讲,这两个基于 .NET 的网志应用系统不相上下。其主要区别在于 .TEXT 需要数据库,SQL Server 或者 MSDE,而dasBlog 将所有信息都存储在 XML 文件中(它基于原来一些微软公司开发人员创建的 BlogX 框架),另一个差别是 .TEXT 在单个安装配置中可支持多个网志(比如现在的 http://blogs.msdn.com 就是如此),而 dasBlog 要支持多个网志,必须进行多次安装。但 dasBlog 有一个很突出的特性,那就是“Mail to Weblog”,它允许你通过邮件来发布新信息。 新的 MSDN 网志服务站点和 PDC Bloggers 都是开始查找关于软件开发主题的很好去处。只要浏览这些站点之一便可阅读其经过聚合的预定内容。其预定的摘要会向你公开许多个人网志,渐渐的你会自然而然地发现一些你比较喜欢阅读的内容。这样,你便可以直接预定你最喜欢的个人网志摘要。 对于专门讨论 XML 和 Web 服务的网志,请查看 MSDN Web Services Developer Center 上的清单,我个人要花很多时间上这些网志站点。
什么是 Feed(以下称为提要),如何预定它?
网志以 RSS 文档形式为其内容提供一个提要,该 RSS 文档可以通过众所周知 URL 获得。RSS 文档是一个 XML 文件,它包含大量离散的新闻项,如某个网志中的入口项(RSS 提要的例子参见 Figure 1)。由于 RSS 是 XML 格式文件,所以它很容易被其它程序所使用。 RSS 聚合器是一个读取 RSS 文档并显示新闻项的程序。大多数聚合器只要输入 RSS 的 URL,使得预定提要成为可能。 RSS 使阅读网志便得容易。大多数经常阅读网志的开发人员都使用某种类型的聚合器来帮助他们有效地筛选提要内容。聚合器使得阅读网志的感觉就象是在阅读电子邮件,因为它们突出新闻项并将新闻项进行缓冲处理以便离线阅读(参见 Figure 2)。 还有一些在线 RSS 聚合器将 RSS 提要捆绑到某个单独的网站。其优点是易于设置并且可以从任何计算机存取你的提要内容。当然,其缺点也是显而易见的,那就是在阅读时必须始终保持连接。 RSS 是网志成为一种强大的新型信息交流形式之根本所在。在网志出现之前,大多数开发人员为了要查找到需要的内容,通常要花大量时间来筛选掉那些令人讨厌的无关的信息。 网志通过让读者选择所要阅读的提要,将控制权交给读者,从而有效地构建自己的个性化内容流。 其它类型的站点也能利用 RSS 的优点来聚合内容。例如,多数主流的新闻站点包括 Wired、CNet、Yahoo 和 NPR News 都提供 RSS 提要。访问 Blogdigger 和 Syndic8,你可以找到一些支持 RSS 的站点。 微软的 MSDN 提供 RSS 提要(RSS feeds)来聚合新添加到站点的技术内容。MSDN 的 Just Published提要是一种保持 MSDN 新文章和下载的主要方式。甚至 MSDN Magazine(MSDN 杂志)都有其自己的 RSS 提要!可以预定:http://msdn.microsoft.com/msdnmag/rss/recent.xml 获得每月的更新以便查看本期有何内容?目前有许多种 RSS 聚合器可供选择,在 http://blogs.law.harvard.edu/tech/directory/5/aggregators 上可以找到一个相当完整的列表。其中一些是在线聚合器,而另外一些是桌面应用程序。有些是免费的,另外一些需要付费才能使用。
哪个 RSS 版本是最通用的?
这个问题的答案要看你问的是谁,RSS 的版本有好多个,0.90、0.91、0.92、0.93、0.94、1.0 和 2.0。要弄清楚这些版本之间的差别是巨大的挑战之一。理解它们需要了解一些有关它们的历史背景。Netscape 创建了 RSS 的最初版本 0.90,起初的名字是“RDF Site Summary”或者“Rich Site Summary”(规范中说前者是正式名称)。Netscape 创建 RSS 0.90 用于其 Web 门户,这个时候,其他人看到了 RSS 的使用潜力。Userland Software 是第一个开始将 RSS 用于其网志商业产品者之一。 版本 0.90 在很大程度上基于 W3C 的 Resource Description Framework (RDF)。许多人都认为 RDF 过于复杂,因此都建议出一个免费的简化版本 0.91。这个任务恰好就给了 Userland Software。Userland Software 便继续发展 RSS 的简化版本,随后出台的版本包括:0.92、0.93 和 0.94。为了强调其所做的简化工作,他们将 RSS 的全称定为“Really Simple Syndication”。 正当 Userland Software 继续专注于其简化工作时,另外一组开发人员在复兴最初的 RDF 版本(0.90),因为 RSS 号称自己更灵活。他们最终发布了一个 RSS 1.0 的版本,其正式名称还是“RDF Site Summary”。由于使用 RDF,这个版本完全不同于 Userland Software 所控制的版本。Userland Software 当然不太愿意看到 RSS 1.0 似乎要取代其 0.94 版本的事实,于是出了一个新版本,并将版本号一下子跳到了 2.0。 这就是今天的这种局面,形成了两个主要的竞争版本:一个基于 RDF 1.0,而另一个则不是(2.0),但它们两个都共用相同的名字。这是一种可怕的混乱,因为版本号导致人们误认为 2.0 是 1.0 的改进版本,而实际上它们是两个目标完全不同的规范。另一组开发人员已经下狠心着手解决这种混乱问题,通过定义新的摘要(syndication)规范来与 RSS 名字的随意性决裂。这个解决方案称为 Atom(原子)项目。本文稍后将会详细讨论。 使用哪个版本其实是无关痛痒的,大多数 RSS 聚合机制支持所有的 RSS 版本(有些甚至支持 Atom)。最终的决定取决于你是否想使用 RDF,可谓萝卜白菜,各有所爱,它完全要看某人所信奉的 Semantic Web 概念而定。
RSS 1.0 和 RSS 2.0 各是什么样子?
RSS 1.0 和 2.0 格式所包含的核心信息相同,但其结构不一样。我提供了一个 RSS 1.0 文档(参见 Figure 1)以及一个同等的 RSS 2.0(参见 Figure 2)用于对照。 你会注意到顶行右边开始的根元素的差异,RSS 1.0 的根元素是 rdf:RDF,而 RSS 2.0 的根元素是 rss。rss 还包含一个强制版本属性用以表示所用的RSS的准确格式(可能的值包括:0.91, 0.94 等)。另一个主要差别是 RSS 1.0 文档有名字空间限定,RSS 2.0 的文档就没有。不管怎样,包含在两个文档中的信息本质上是一样的。 两个版本都包含 channel 元素,而 channel 元素又包含三个必须的元素:title、description 和 link,其代码如下:
<channel>
<title><!-- channel 的标题 --></title>
<description><!-- 简要描述 --></description>
<link><!-- channel 的 URL --></link>
<!-- 可选/可扩展元素 -->
</channel>
除了这些必须的元素外,RSS 1.0 还定义了三个附加元素:image、items 和 textinput,其中,image 和 textinput 是可选的。另一方面,RSS 2.0 提供了 16 个附加元素,其中也包括 image、items 和 textinput,此外还有 language、copyright、managingEditor、pubDate 和 category。RSS 1.0 允许通过定义在单独的 XML 名字空间中的可扩展元素来创建这种类型的元数据。 这两种格式在结构上的主要区别必须要看其 item、image 和 textinput 节点的表示形式。RSS 1.0 中,channel 元素包含对 item、image 和 textinput 节点的引用,这些节点存在于 channel 节点本身之外。这样在 channel 和 所引用的节点之间建立了一种 RDF 关联。如 Figure 1 所示,channel 元素与一个 image 元素以及两个 item 元素关联。RSS 2.0 中,item 元素只是在 channel 元素中连续排放(如 Figure 2 所示)。item 元素包含实际的新闻项信息。item 的结构在两个版本中是相同的。item 元素通常包含 title、link 和 description 元素,如下代码所示:
<item>
<title><!-- 项标题 --></title>
<link><!-- 项 URL --></link>
<description><!-- 简要描述 --></description>
<!-- 可选的/可扩展的元素 -->
</item>
在 RSS 1.0 中,title 和 link 是必须的,description 是可选的。而在 RSS 2.0 中,title 或 description 必须提供其中的一个;其它均可选。这些只是定义在 RSS 1.0 中的 item 元素。RSS 2.0 提供几个其它可选元素,其中有 author、category、comments、enclosure、guid、pubDate 和 source。RSS 1.0 获取这样的元数据是通过定义在单独的 XML 名字空间中称为 RSS 模块的可扩展元素来实现的。例如,在 Figure 1 中,item 的日期是用 Dublic Core 模块的 <dc:date> 元素表示的。
有关不同格式的完整信息请参考 RSS 1.0 和 2.0 规范。
那么,何为 Atom?
前面我提到过,Atom 乃一项目的名字,主要是开发一个新的网志摘要格式以解决目前 RSS 存在的问题(混乱的版本号,不是一个真正的开放标准,表示方法的不一致,定义贫乏等等)。Atom 希望提供一个清晰的版本以解决每个人的需要,其设计完全不依赖于供货商,任何人都可以对之进行自由扩展,完整详细说明。 当今许多 Blog 引擎已经支持当前的摘要格式。Figure 3 是一个Atom 0.3 提要例子,它与前述 Figure 1 及 Figure 2 RSS 提要等同。注意 Atom 提要用名字空间限定的,但它不使用 RDF。这使得 Atom 和 RSS 1.0 及 RSS 2.0 在某些地方有相似之处。Atom 在未来是否能被接受,人们拭目以待。 除了定义新的摘要格式之外,Atom 还希望定义一个标准的档案文件格式和一个标准的网志编辑 API(Atom API)。有关 Atom 详细规范以及其它 Atom 资源请访问 The Atom Project。
什么是 blogroll?
blogroll 是网志提要的集合,大多数 blogger(博客)在其个人网志上都提供 blogroll。这就允许读者连接到其他趣味和写作风格相投的人的网志上。Blogroll 方便了网络上的沟通。通过使用Outline Processor Markup Language (OPML),人们可以用 XML 格式文件交换 blogroll。Figure 4 是 blogroll 的一个例子。 大多数网志引擎都自己管理 blogroll,每当读者请求 blogroll 时都自己产生相应的 XML 格式。同样,大多数聚合器都能导入 blogroll 并自动预定所包含的摘要。有关 OPML 更多的信息参见 http://opml.scripting.com。
能解释 referrers、trackbacks 和 pingbacks 是什么吗?
大多数网志软件都能让读者添加网志评论。但更常见的做法是让读者在其自己的网志添加一个入口回链到原来的帖子。博客们(Bloggers)都乐于跟踪连接发生的时间以便新读者能理解整个会话内容。 所谓 referrer 是一个外部站点,用户单击该站点上一个超链接便可以到达你的网站。许多网志引擎当读者导航到你的网志的某个入口时都能自动保持跟踪。大多数引擎都会在网志入口底部显示一个 referrers 清单,以便读者能往回导航到 referrer 的站点,并清楚他们关于该入口要说些什么,这基于一个假设,那就是如果他们链接到它,可能就此会写些什么。referrer 存在的问题是必须要有这个假设才成立——没有足够的信息说明是否引用的页面事实上包含有关信息。实际上,垃圾信息的发布者为了营销企图已经利用了这个漏洞来重定向读者。 Trackback 和 pingback 同一个规范,被用来弥补上述问题的方案。使用 trackback 和 pingback,其他博客们能自动发送一个 ping 到你的网志以明确表示他们已经写了一个引用特定帖子的入口。 这种类型的反链允许你的网志以更明显的方式显示所有评论的清单。当今大多数网志软件支持所有这些技术。参见 TrackBack Technical Specification 和 Pingback 1.0。
如何为我的站点产生 RSS 提要?
Figure 5 举例说明了如何用 asp:Repeater 控件在 .aspx 页面中生成 RSS 2.0 提要。该页面假设你已经在后端代码文件中将控件的 DataSource 属性设置成对应的数据库结果集。
我想聚合几个 RSS 提要并将信息显示在个人网站上,能解释一下如何实现吗?
因为 RSS 提要是 XML 文件,作为练习,你可以用自己最擅长的 XML API,比如,Microsoft .NET Framework 中的 System.Xml,Figure 6 中包含 ASP.NET Web 用户控件代码,它是我编写用来聚合 blogroll 文件中(.opml)所列出的 RSS 提要的一段代码。这段代码假设 opml 元素包含 numberToDisplay 属性,以表示你打算显示的每个提要有多少项。
Figure 7 ASP.NET Web 用户控件
你可以将控件拖到任何 .aspx 页面中,它将显示 blogroll 文件中列出的不同提要的项,Figure 7 显示了 Utah .NET User Group 网站使用这个控件的效果画面。
有没有与网志交互的 Web Services APIs?
许多网志引擎都提供属于自己的 Web service 接口,通过编程与网志交互,但目前还没有出现一种标准化的东西。 .Text 和 dasBlog 两者都提供某些 .asmx 端点,可以通过 SOAP 来实现编辑功能,但其接口是不同的。Blogger.com 提供基于 XML-RPC 的交互式 API (Blogger API)。Userland Software 对Blogger API 的功能进行了增强,并把它叫做 MetaWeblog API。这些可能是当今公认的网志 APIs,但仍然不是所有网志引擎都支持的。还有一个用于添加评论的独力的 API 叫做 Comment API,同样,它也不是被普遍支持。 Atom 组正在努力解决这些问题,Atom API 定义了一个标准的网志 API 用于发布和编辑网志内容。有关信息请参考 The Atom Project 网站。
发送问题和评论给 Aaron:xmlfiles@microsoft.com。 |
相关推荐
RSSJava提供了一组API来创建、读取和写入RSS feeds,而Rome则是一个更全面的库,支持RSS和Atom格式,包含了解析、生成和订阅功能。 7. **RSS更新通知**: 虽然RSS本身不提供更新通知机制,但可以通过结合Webhooks...
RSS(Really Simple Syndication)是一种基于XML的网络内容发布协议,它允许网站提供自己的新闻提要,以便用户可以通过RSS阅读器订阅和获取更新。在这个压缩包中,包含了一系列与Java实现RSS相关的库和源代码,这将...
RSS是一种用于发布和共享Web内容的XML格式,通常用于新闻订阅、博客更新或其他定期发布的内容。通过RSS,用户可以订阅感兴趣的网站,无需直接访问网站就能获取最新内容。RSSlib4Java正是为了解决这一需求,它使得...
在IT行业中,RSS(Really Simple Syndication)是一种广泛使用的数据格式,用于订阅和分享网络内容,如新闻、博客文章或播客。RSS读取和生成是处理这些数据的关键环节。以下将详细介绍标题和描述中提到的RSS通用类,...
RSS(Really Simple Syndication)是一种用于发布和订阅新闻、博客和其他在线内容的标准格式。RSS阅读器是能够帮助用户方便地跟踪和管理这些RSS源的应用程序。 描述中提到“利用SQL Server和.NET开发的RSS阅读器”...
RSS(Really Simple Syndication)是一种内容聚合格式,常用于博客、新闻站点等发布更新信息,用户可以通过RSS订阅源获取感兴趣的内容,而无需直接访问网站。本项目作为毕业设计,充分展示了C#在开发桌面应用中的...
RSS(Really Simple Syndication)是一种基于XML的订阅机制,主要用于新闻、博客和其他定期更新内容的发布。RSS feed允许用户通过RSS阅读器或聚合器来跟踪多个网站的更新,无需逐一访问。 标题提到的"该代码能完成...
总之,SL275 RSS阅读器是一个功能丰富的应用,它将RSS订阅、背景音乐和个性化视觉设计完美结合,为用户提供了一个全面、高效的在线信息获取平台。通过这款软件,用户可以更加便捷地管理自己的信息流,提升信息获取和...
通过以上内容,可以看出《RSS与Atom在行动》这本书不仅全面介绍了RSS和Atom的基本理论和技术细节,还提供了丰富的实际应用案例和开发指南,对于希望深入了解这两种协议并将其应用于实践的读者来说,是一本不可或缺的...
RSS(Really Simple Syndication)是一种数据格式,用于发布新闻、博客和其他定期更新内容的摘要,允许用户通过聚合器订阅并获取这些内容。这个应用利用了MVC(Model-View-Controller)设计模式,为开发者提供了清晰...
RSS和Atom是互联网上广泛使用的两种数据交换格式,它们允许用户订阅并跟踪他们感兴趣的网站或博客的更新,无需直接访问这些站点。 C#,由微软公司开发,是一种面向对象的、类型安全的编程语言,广泛应用于Windows...
通过这些文件,用户可以全面了解RSS 2.0A_20050426工具的各个方面,包括安装、使用和维护,从而高效地管理和发布他们的在线内容,让读者能够轻松地跟踪和接收更新。同时,这也展示了RSS技术在早期互联网时代对于内容...
RSS是一种XML格式的数据,用于发布新闻、博客和其他在线内容,使得用户无需访问每个网站就能获取最新更新。在本项目中,开发者使用JavaScript和Ajax(异步JavaScript和XML)技术,创建了一个无需服务器端处理即可...
ROME1.0是该框架的一个版本,它提供了对RSS和Atom feeds的全面支持。通过使用ROME,开发者可以轻松地解析、创建和更新RSS和Atom feeds,从而快速构建RSS相关的应用程序。 1. **API接口**:ROME1.0提供了一套清晰、...
本资源“RSS从入门到精通(初级版)-PDF、实例代码、jar包.rar”是一个全面学习RSS的初级教程,包含了理论知识、实践代码和相关的工具支持。 PDF文档可能涵盖了以下内容: 1. **RSS简介**:解释RSS的起源,以及...
总的来说,GreatNews作为一个强大的RSS阅读器,通过提供全面的功能和灵活的个性化选项,使得用户可以高效地管理和消费网络内容,无论是新闻、博客还是其他在线资源,都能实现一站式管理。同时,其数据库和更新机制...
RSS(Really Simple Syndication)是一种用于网站内容共享的简洁方式,允许用户订阅并获取网站的更新信息,如新闻、博客文章等。在Java开发中,RSS采集涉及到对RSS feed的解析、读取和处理,以便将这些数据整合到...