`
willzh
  • 浏览: 301829 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

feedparser学习摘要

阅读更多
号称Universal Feed Parser,通吃所有合法不合法的RSS。先简单写下使用方式:
>>> import feedparser
>>> d = feedparser.parse('http://willzh.iteye.com/rss')
>>> d['feed']['title']
u"Will's Blog"

另外这里有个使MoinMoin支持RSS的方法,有空再看了,先贴个地址备忘。
http://moinmoin.wikiwikiweb.de/macro/FeedParser

feedparser的首页有个基本使用方法:
>>> import feedparser
>>> d = feedparser.parse("http://feedparser.org/docs/examples/atom10.xml")
>>> d['feed']['title']             # feed data is a dictionary
u'Sample Feed'
>>> d.feed.title                   # get values attr-style or dict-style
u'Sample Feed'
>>> d.channel.title                # use RSS or Atom terminology anywhere
u'Sample Feed'
>>> d.feed.link                    # resolves relative links
u'http://example.org/'
>>> d.feed.subtitle                 # parses escaped HTML
u'For documentation <em>only</em>'
>>> d.channel.description          # RSS terminology works here too
u'For documentation <em>only</em>'
>>> len(d['entries'])              # entries are a list
1
>>> d['entries'][0]['title']       # each entry is a dictionary
u'First entry title'
>>> d.entries[0].title             # attr-style works here too
u'First entry title'
>>> d['items'][0].title            # RSS terminology works here too
u'First entry title'
>>> e = d.entries[0]
>>> e.link                         # easy access to alternate link
u'http://example.org/entry/3'
>>> e.links[1].rel                 # full access to all Atom links
u'related'
>>> e.links[0].href                # resolves relative links here too
u'http://example.org/entry/3'
>>> e.author_detail.name           # author data is a dictionary
u'Mark Pilgrim'
>>> e.updated_parsed              # parses all date formats
(2005, 11, 9, 11, 56, 34, 2, 313, 0)
>>> e.content[0].value             # sanitizes dangerous HTML
u'<div>Watch out for <em>nasty tricks</em></div>'
>>> d.version                      # reports feed type and version
u'atom10'
>>> d.encoding                     # auto-detects character encoding
u'utf-8'
>>> d.headers.get('Content-type')  # full access to all HTTP headers
u'application/xml'
分享到:
评论

相关推荐

    一种基于Python的命令行工具,通过利用基于OpenAI API的LLM服务器来总结RSS提要.zip

    【标题】中的“一种基于Python的命令行工具,通过利用基于OpenAI API的LLM服务器来总结RSS提要”指的是一个使用Python编程语言...通过学习和理解这个工具,开发者可以提升在NLP、API交互和命令行应用开发方面的技能。

    北大青鸟RSS阅读器课堂演示

    学员将学习如何创建一个简单的应用程序,这个程序能够连接到指定的RSS源,抓取并显示最新的文章标题、摘要和链接。 在课堂实践中,学员可能会遇到如错误处理、数据缓存、用户界面设计等问题。这些问题的解决将涉及...

    rss阅读器基本

    feed包含文章标题、摘要、发布日期和链接等信息。阅读器会定期检查这些feed,以便当有新内容时通知用户。 核心代码通常包括以下几个部分: 1. **RSS解析**:这是RSS阅读器的第一步,它涉及读取RSS feed并将其转换...

    GAE read rss send to 腾讯微博

    3. 对每个新条目,提取关键信息(如标题、链接和摘要)。 4. 使用腾讯微博API的授权信息,构造POST请求,将信息发送到用户的微博账户。 5. 如果有错误或限制,如API调用次数达到上限,应用应能适当地处理并记录错误...

    新闻阅读器原代码可以直接从网上下新闻

    如果是实时新闻流,可能还会涉及到RSS或Atom订阅,可以使用`feedparser`库解析这些XML格式的数据。 其次,解析HTML或XML内容是另一个关键步骤。为了提取出新闻标题、摘要和链接,开发者可能使用了HTML解析库,如...

    blogroll, rss聚合

    3. **XML解析**:使用XML解析库(如Python的feedparser库)将XML数据转换成可处理的对象结构。 4. **数据处理**:清洗和处理抓取到的数据,例如去除HTML标签,截断过长的摘要,添加源信息等。 5. **内容整合**:将...

    rss 订阅

    开发人员可以使用各种编程语言来处理RSS,例如Python中的`feedparser`库可以方便地解析RSS feed,而`Flask-RSS`这样的扩展则可以帮助构建RSS feed。对于Java开发者,`rome`库是一个常用的RSS处理工具。 在给定的...

    python每日早安程序源码

    这样,你的早安问候就可能伴随着最新的天气信息或新闻摘要。 在压缩包文件`zao`中,可能包含了上述示例代码或其他实现方式。如果你想要进一步理解或修改这些源码,你需要解压缩文件并使用文本编辑器查看Python脚本...

    android 网易RSS阅读器(含PPT及详细功能讲解)

    在Android应用中,开发者需要集成RSS解析库,如FeedParser或TinyRSS,来解析RSS源中的XML数据,并将其转化为用户友好的格式显示。 二、定时更新机制 定时更新功能是RSS阅读器的核心特性之一。Android应用中通常使用...

    rss-reader-alexa-源码.rar

    这可能包括使用RSS解析库(如Python的feedparser)来解析RSS源,并提取出标题、摘要、发布日期等关键信息。 4. **交互模型**:交互模型定义了用户可以向Alexa提出的各种请求和相应的响应。这部分源代码会包含JSON...

    JavaFeedParserCommon:提供公共类,可用于解析新闻提要-开源

    3. **易用性**:通过提供简洁的API,JavaFeedParserCommon使得开发者可以快速上手,只需几行代码就能解析并获取提要中的关键信息,如标题、链接、发布日期和内容摘要。 4. **错误处理**:库包含了良好的错误处理...

    Android Rss订阅源码Demo.zip源码资源下载

    总之,“Android Rss订阅源码Demo”是一个涵盖了网络请求、XML解析、数据模型、UI展示等多个Android开发核心知识点的示例项目,对于学习和理解Android RSS订阅功能的实现非常有帮助。通过研究这个源码,开发者可以...

    Android源码——RSS阅读器的源码.7z

    - `FeedParser`: 解析RSS XML文件的类,可能使用了XmlPullParser或第三方库。 - `FeedAdapter`: RecyclerView的Adapter,负责将RSS数据绑定到列表视图。 - `MainActivity`: 主界面,展示RSS源和条目列表,可能还有...

    一个Python基于PC版的微信机器人源码.zip

    Python的`schedule`库或操作系统级别的定时任务(如Linux的`cron`或Windows的计划任务)可以用来在特定时间执行某些功能,比如每天早上和晚上自动发送定制的新闻摘要。 至于娱乐功能,这可能包括发送笑话、天气预报...

    RSS新闻聚合器 全部源码

    1. **RSS Feed解析**:RSS源码首先需要解析RSS feed,通常采用XML解析库,如Python的`feedparser`库。解析过程涉及识别RSS feed的结构,包括`&lt;channel&gt;`、`&lt;item&gt;`、`&lt;title&gt;`、`&lt;description&gt;`、`&lt;link&gt;`等元素,以...

    Python_开源简洁可自部署的RSS翻译器 Translate RSS feeds into your langu.zip

    2. **RSS解析**:为了处理RSS订阅源,项目可能使用了Python的RSS解析库,如`feedparser`,它可以帮助解析RSS feed的XML结构,提取出文章标题、链接、摘要等信息。 3. **机器翻译API**:翻译功能通常依赖于第三方的...

    RSS获取新闻并发布

    2. 智能推荐:引入机器学习算法,根据用户浏览历史和偏好推荐个性化新闻。 3. 多语言支持:扩展系统支持多语言的RSS源,满足不同地区用户的需求。 4. 社交媒体集成:添加分享到社交媒体的功能,增加新闻的传播范围。...

    Universal Feed Parser-开源

    Universal Feed Parser是一个开源的Python库,专门用于解析RSS(Really Simple...通过阅读和研究其源代码、许可证信息和文档,开发者不仅可以学习如何使用这个库,还能学习到XML解析、数据建模和Python编程的最佳实践。

    latestITNews:获取最新IT新闻动态爬虫

    在IT行业中,获取最新的新闻动态是至关重要的,无论是为了跟踪技术发展趋势、了解行业热点...通过学习和实践这个项目,你可以提升自己的Python技能,更好地理解网络爬虫的工作原理,同时掌握获取和处理网络数据的能力。

Global site tag (gtag.js) - Google Analytics