`
joei4cm
  • 浏览: 12011 次
  • 性别: Icon_minigender_1
  • 来自: 上海
最近访客 更多访客>>
社区版块
存档分类
最新评论

[python]简单获取网页文件指定内容方法

阅读更多
#!/usr/bin/python

import urllib,HTMLParser

page_url = 'http://lists.meego.com/pipermail/meego-commits/2011-June/027331.html'

#get the url raw content
page_src_content = urllib.urlopen(page_url)
page_list = list(page_src_content)

def page_find(LST_NAME, LST_KEYWD, STRT_ELEMT = 0):
    POS_ELEMT = -1
    for i in range(STRT_ELEMT,len(LST_NAME)):
        if LST_NAME[i].find(LST_KEYWD) >= 0:
        POS_ELEMT = i
        break
        return POS_ELEMT

#get the line number matchs keywords
keywd_line = page_find(page_list, 'changes files:\n')
#print keywd_line

#get the end line number of the match keywords
end_line = page_list[keywd_line:].index('\n')
#print end_line

for i in range (keywd_line, keywd_line + end_line - 1):
    print page_list[i]
0
3
分享到:
评论

相关推荐

    python获取SVN日志

    指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间时间 获取SVN日志指定区间...

    python 获取指定文件夹下的所有文件,包括子文件夹下的文件

    python 获取指定文件夹下的所有文件,包括子文件夹下的文件,路径需要自行更改。 python 获取指定文件夹下的所有文件,包括子文件夹下的文件,路径需要自行更改。 python 获取指定文件夹下的所有文件,包括子文件夹...

    python实现实时监控文件的方法

    ### Python 实现实时监控文件的方法 #### 背景与需求 在许多高负载的应用程序中,为了确保系统的稳定性和高效性,运维人员通常需要实时监控应用程序的日志文件。一旦发现异常情况,如请求响应时间过长等,能够立即...

    一文讲清Python PyQt5的控件如何实现拖放获取文件路径(markdown)

    在Python的GUI编程中,PyQt5是一个非常强大的库,它提供了丰富的控件和功能,使得用户界面的设计变得简单易行。本篇文章将详细讲解如何使用PyQt5的控件,特别是QLineEdit,来实现拖放操作以获取文件路径。我们将深入...

    Python获取指定文件夹下的文件名的方法

    在实际操作中,根据需要获取文件的不同,可以选择使用os.walk()或者os.listdir()。同时,对于初学者来说,理解和遵守Python的编码规范(如缩进)是避免很多常见错误的关键。希望以上内容能对大家的学习有所帮助,并...

    python 获取指定目录下文件名称

    运用python简单语句获取指定目录下文件名称,并存放在相关文件中

    Python 语言实现的抓取网页内容与列文件目录

    本篇将重点讲解如何利用Python抓取网页内容以及如何列文件目录。 首先,让我们深入理解Python中的Web Scraping。Web Scraping是指通过编程方式自动提取网页上的信息。Python中有多个强大的库来支持这项工作,如...

    python编制文件夹及文件名称批量获取小工具

    "python编制文件夹及文件名称批量获取小工具"就是这样一个实用程序,它能帮助我们快速地收集和整理指定目录下的文件和子目录信息,极大地提升了工作效率。 这个小工具的核心功能在于遍历文件系统,利用Python的内置...

    python读取文件信息脚本可执行文件.exe

    它可能使用了Python的`os`模块,该模块提供了操作系统相关的功能,如列举目录内容、遍历文件系统等。通过调用`os.listdir()`函数,可以获取到目录中的所有文件和子目录名,然后递归地对每个子目录进行同样的操作,...

    python获取指定路径下所有指定后缀文件的方法

    ### Python 获取指定路径下所有指定后缀文件的方法 在日常的开发工作中,我们经常会遇到需要批量处理特定格式文件的需求,比如备份、分析日志文件、提取数据等场景。Python 提供了强大的文件与目录操作功能,能够...

    python写的简易文件浏览器

    【Python简易文件浏览器】 在IT领域,开发一个文件浏览器是一个常见的练习,可以帮助初学者更好地理解网络编程和异步I/O的概念。在这个项目中,我们关注的是一个使用Python编写的简易文件浏览器,它允许用户通过...

    python用opencv批量截取图像指定区域的方法

    ### Python使用OpenCV批量截取图像指定区域的方法详解 在图像处理领域,批量截取图像中的特定区域是一项常见的任务。这种需求可能出现在多种场景中,比如自动化测试、图像分析等。今天,我们将深入探讨如何利用...

    python bluetooth蓝牙信息获取蓝牙设备类型的方法

    python 获取蓝牙设备类型 扫描蓝牙设备获取到的信息中,无法判断扫描到的蓝牙设备属于什么类型的设备。 扫描蓝牙信息使用的是python 里面的bluetooth模块。 首先扫描出来的是这样的信息 (’74:60:FA:FD:FC:49′,’...

    Python文件操作(课件)

    文件对象还提供了一些其他方法,如`close()`关闭文件,`flush()`刷新缓冲区,`__next__()`获取文件的下一行,`tell()`返回当前文件指针的位置。 当涉及到文件夹操作时,Python的`os`和`os.path`模块提供了遍历目录...

    Python简单删除目录下文件以及文件夹的方法

    ### Python简单删除目录下文件及文件夹的方法 在Python编程中,经常需要处理文件系统相关的任务,例如创建、删除文件或文件夹等。本篇文章将详细介绍如何使用Python内置的`shutil`模块来轻松实现这些功能。特别是...

    python 批量读取word文件中指定表名的表写入exel

    doc文件转docx文件 根目录文件自动读取 批量处理word文件中指定关键词后的表格导入excel

    python 获取文件夹中指定格式文件,并按照创建时间排序

    python 获取指定文件夹中的指定格式文件,例如.txt,然后按照创建时间(也可以是其他排序规则),按顺序输出文件名。

    Python如何获取文件指定行的内容

    在Python编程中,有时我们需要访问一个大文件中的特定行,而不是加载...希望这篇文章能帮助你更好地理解和使用Python获取文件指定行内容的方法。如果你在编程过程中遇到其他问题,可以加入相关学习群进行讨论和互助。

Global site tag (gtag.js) - Google Analytics