`

RSS文件格式分析

阅读更多

RSS1.0和2.0所包含的核心的信息相同,但是其中的结构有所区别:

RSS中的标签详细介绍:

|-rdf:RDF/rss				RSS1.0/2.0的根元素
<!--rss还包含一个强制版本属性用以表示所用的RSS的准确格式,RSS1.0文档有名字空间限定,RSS2.0的文档就没有-->
	|-channel			频道		必备
		|-title		频道名称		必备
		|-link		频道的URL		必备
		|-description	频道的描述		必备
		|-image		指定一个 GIF或JPEG或PNG图片,用以与频道一起显示
			|-url			图片的url				必备 
			|-title			图片的标题,alt属性		必备 
			|-link			网站url(常以频道的url)	必备 
			|-description		用于link的title属性
			|-width			图片的宽度(象素为单位)	可选	最大144,默认88 
			|-height		图片的高度(象素为单位)	可选 	最大400,默认3
		|-textInput		指定一个text输入框供用户输入,具体信息及功能未定。
			|-title		Submit按钮的标签		必备 
			|-description	解释text输入区		必备 
			|-name		Textarea对象的名字 		必备 
			|-link		处理提交的请求的cgi程序	必备
		|-item				
		<!--在RSS1.0中,title和link是必须的,description是可选的。而在RSS2.0中,title或description必须提供其中的一个-->
		<!--1.0和2.0都有的标签-->
		
		|-language	频道文章所用语言
		|-copyright	频道内容的版权说明
		|-managingEditor	责任编辑的email
		|-category	指定频道所属的类别
		|-pubDate	频道内容发布日期,格式遵循RFC822格式
		<!--RSS2.0中扩展的,不过RSS1.0允许通过定义在单独的XML名字空间中的可扩展元素来创建这种类型的元数据,这两种格式在结构上的主要区别是其item、image和textinput节点的表示形式。RSS1.0中,channel元素包含对item、image和textinput节点的引用,这些节点存在于channel节点本身之外。这样在channel和所引用的节点之间建立了一种RDF关联channel元素与一个image元素以及两个item元素关联。RSS2.0中item元素只是在channel元素中连续排放。item元素包含实际的新闻项信息。-->
		
		|-webMaster	网站管理员email
		|-generator	生成该频道的程序名
		|-lastBuildDate	频道内容最后的修改日期
		|-docs		指向该RSS文件所用格式说明的URL
		|-ttl		有效期,用以指明该频道可被缓存的最长时间分钟为单位
		|-rating		这个频道的分级(主要指成人、限制、儿童等
		|-skipHours	提示新闻聚合器,那些小时时段它可以跳过。
		|-skipDays	提示新闻聚合器,那些天它可以跳过。

 RSS1.0例子:

<?xml version="1.0"?>
<rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
	xmlns="http://purl.org/rss/1.0/">
	<channel rdf:about="http://www.xml.com/xml/news.rss">
		<title>XML.com</title>
		<link>http://xml.com/pub</link>
		<description>XML.com features a rich mix of information and services for the XML community. </description>
		<image rdf:resource="http://xml.com/universal/images/xml_tiny.gif" />
		<items>
			<rdf:seq>
				<rdf:li resource="http://xml.com/pub/2000/08/09/xslt/xslt.html" />
				<rdf:li resource="http://xml.com/pub/2000/08/09/rdfdb/index.html" />
			</rdf:seq>
		</items>
		<textinput rdf:resource="http://search.xml.com" />
	</channel>
	<image rdf:about="http://xml.com/universal/images/xml_tiny.gif">
		<title>XML.com</title>
		<link>http://www.xml.com</link>
		<url>http://xml.com/universal/images/xml_tiny.gif</url>
	</image>
	<item rdf:about="http://xml.com/pub/2000/08/09/xslt/xslt.html">
		<title>Processing Inclusions with XSLT</title>
		<link>http://xml.com/pub/2000/08/09/xslt/xslt.html</link>
		<description>Processing document inclusions with general XML tools can be problematic. This article proposes a way of preserving inclusion information through SAX-based processing.</description>
	</item>
	<item rdf:about="http://xml.com/pub/2000/08/09/rdfdb/index.html">
		<title>Putting RDF to Work</title>
		<link>http://xml.com/pub/2000/08/09/rdfdb/index.html</link>
		<description>Tool and API support for the Resource Description Framework is slowly coming of age. Edd Dumbill takes a look at RDFDB,one of the most exciting new RDF toolkits. </description>
	</item>
	<textinput rdf:about="http://search.xml.com">
		<title>Search XML.com</title>
		<description>Search XML.com's XML collection</description>
		<name>s</name>
		<link>http://search.xml.com</link>
	</textinput>
</rdf:rdf>

 

RSS2.0例子:

<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
	<channel>
		<title>新闻中心-国内焦点新闻</title>
		<image>
			<title>新闻中心-国内焦点</title>
			<link>http://news.sina.com.cn/china</link>
			<url>http://image2.sina.com.cn/dy/gn/in10.jpg</url>
		</image>
		<description>国内焦点新闻列表</description>
		<link>http://news.sina.com.cn/china/index.shtml</link>
		<language>zh-cn</language>
		<!-- 当RSS文件为自动创建时多存在此节点(RSS文件由什么创建) -->
		<generator>WWW.SINA.COM.CN</generator>
		<!-- (ttl = time to live) 在刷新前当前RSS在cache中可以保存多长时间(分钟)-->
		<ttl>5</ttl>
		<copyright>Copyright 1996 - 2005 SINA Inc. All Rights Reserved</copyright>
		<pubdate>Wed, 26 Apr 2006 01:45:05 GMT</pubdate>
		<category /><!-- 一条新闻 -->
		<item>
			<title>xxxxxxx</title>
			<link>http://news.sina.com.cn/c/l/2006-04-26/08029720281.shtml</link>
			<author>WWW.SINA.COM.CN</author>
			<!-- guid>GUID=Globally Unique Identifier 为当前新闻指定一个全球唯一标示 -->
			<guid>http://news.sina.com.cn/c/l/2006-04-26/08029720281.shtml</guid>
			<category>xxxxxxx</category>
			<pubdate>Wed, 26 Apr 2006 00:02:53 GMT</pubdate>
			<comments/>
			<description>xxxxxxxx</description>
		</item>
	</channel>
</rss>

 

分享到:
评论

相关推荐

    Rss格式书写规范和java中解析dom的四种方式

    RSS 格式书写规范和 Java 中解析 DOM 的四种方式 RSS(Really Simple Syndication,简易信息聚合)是一种 XML 方言,用于连锁 Web 内容和元数据。RSS 2.0 是当前最常用的版本,且与 0.91 向后兼容。RSS 文件由一个 ...

    MFC编写的RSS简单阅读器

    1. **解析RSS Feed**:由于RSS是XML格式,因此我们需要使用XML解析器来读取和解析RSS文件。MFC提供了CXMLEngine类来处理XML数据。开发者需要了解XML的基本结构,如XML元素、属性、命名空间等,并利用CXMLEngine的...

    该代码能完成解析XML文件的RSS解析器

    标题提到的"该代码能完成解析XML文件的RSS解析器"是指一个专门针对RSS feed设计的XML解析工具。这样的解析器能够读取RSS源文件,解析其XML结构,并将内容转换为可供程序处理的数据结构,如Python中的字典或对象。 ...

    RSS阅读器(XML文件解析)

    RSS是一种XML格式,用于以标准化方式共享和分发Web内容。本项目专注于使用SAX(Simple API for XML)解析器来处理XML文件,这是Android开发中一种高效且内存友好的方法。 SAX是一种事件驱动的解析模型,它不会一次...

    功能强大的php解析rss文件类.zip

    简单但功能强大的PHP解析RSS文件类,启用缓存,缓存文件是最新,则返回缓存数组,缓存文件...Parse() 是由GET()调用的私有方法,用来解析RSS文件,所以不要在你的代码中使用Parse(),而是用 Get($rss_file)方法来替代。

    java解析rss具体信息

    #### 四、解析 RSS 示例代码分析 1. **定义 XML 处理工具类** (`XmlUtils`) ```java public class XmlUtils { // 使用 SAXReader 解析 URL 中的 XML 数据 public Document parse(URL url) throws ...

    使用Boost对Rssxml文件解析

    一个典型的RSS文件包含频道信息(如标题、描述和链接)以及多个项目(每个项目通常代表一篇文章)。理解RSS的结构是解析它的基础。 3. **XML解析过程**:首先,我们需要读取RSS XML文件并将其内容加载到字符串或流...

    常用Rss,生成解析Rss,

    要生成RSS源,你需要了解XML语法并按照RSS规范编写XML文件。这通常涉及以下步骤: - 定义频道(channel)信息:包括频道标题、描述和URL。 - 创建项目(item):每个项目应包含标题、描述、链接和发布日期。 - ...

    RSS代码RSS 代码RSS 代码RSS 代码

    RSS文件通常称为RSS Feed或RSS Channel,其中包含标题、描述、链接等信息,订阅者可以通过RSS阅读器获取这些更新。 2. **RSS结构** - **频道(Channel)**:RSS文件的主要结构,包含了整个订阅源的信息,如频道...

    RSS文件解吸器,c++代码

    为了确保代码的健壮性和可维护性,你可能还需要考虑错误处理,比如验证输入的RSS文件是否有效,处理解析过程中的异常,以及对缺失或格式错误的数据进行适当的处理。此外,良好的代码组织和注释也是必要的,这将帮助...

    读取RSS-SAX解析XML实例(java版)

    RSS文件通常包含标题、摘要、链接等元素,使得用户可以通过RSS阅读器获取并跟踪感兴趣的信息源的最新内容。 在Java中,读取RSS数据首先需要获取RSS源的URL,然后使用XML解析器解析该URL的内容。这里采用的是SAX解析...

    使用RSS订阅喜欢的bilibiliup主和番剧

    "bilibili2RSS-master"这个压缩包文件很可能包含了一个项目或脚本,旨在帮助用户将B站的内容转化为RSS订阅格式。 首先,让我们理解RSS的工作原理。RSS是一种XML格式的文件,包含了网站的更新信息,如新发布的文章、...

    javascript 解析 rss 实例

    JavaScript是一种广泛应用于Web开发的脚本语言,常用于创建交互式的网页内容。在本文中,我们将深入探讨如何使用JavaScript解析RSS(Really Simple ...在js_rss文件中,可能包含了这个实例的完整代码,供你参考和学习。

    动态生成Rss文件 Xml操作 Xml文件的修改 简单实用的demo

    本示例聚焦于动态生成RSS文件,这是一项关键技能,尤其是在构建新闻聚合、博客更新通知或任何需要实时内容更新的网站时。 RSS(Really Simple Syndication)是一种XML格式,常用于发布新闻提要,使得用户可以订阅并...

    Rss,Atom聚合规范的XML文件解析(Rome,rssutils)

    RSS文件通常以.xml为扩展名,包含一系列“条目”(items),每个条目代表一篇单独的文章或更新。主要元素包括频道(channel)和条目(item),频道包含关于整个源的信息,如标题、描述和URL,而条目则包含每篇文章的...

    RSS RSS RSS

    这个feed通常以.xml或.rss文件的形式存在,文件中包含了文章标题、摘要、发布日期、作者信息以及文章链接等元素。用户则可以通过RSS阅读器订阅这些feed,一旦订阅,阅读器就会自动检查并显示新内容,这样用户就能在...

    RSS.rar_RSS_java rss

    RSS文件通常包含标题、摘要、发布日期和链接等信息。 在Java中处理RSS,开发者通常会使用DOM(Document Object Model)或SAX(Simple API for XML)解析器来解析XML文件。DOM解析器将整个XML文件加载到内存中形成一...

    javaRSS.zip

    解析RSS文件时,需要解析XML文档并提取这些关键元素。 2. **DOM解析器**:在Java中,解析XML文件通常使用DOM(Document Object Model)解析器。DOM解析器会将整个XML文件加载到内存中形成一棵树形结构,便于遍历和...

    rss.jar 一个生成rss的jar包

    RSS文件包含元数据,如标题、描述、链接等,使得订阅者可以快速了解新内容概要,而无需打开每个链接。RSS的核心在于其简洁性和标准化,使得内容能够跨平台、跨设备无缝流动。 二、rss.jar功能解析 1. 生成RSS XML...

Global site tag (gtag.js) - Google Analytics