`
jinheking
  • 浏览: 77798 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

Python通过HTTP协议定期抓取文件(ZT)

阅读更多
#!usr/bin/python

import urllib2,time;
class ErrorHandler(urllib2.HTTPDefaultErrorHandler):
    def http_error_default(self, req, fp, code, msg, headers):
        result = urllib2.HTTPError(req.get_full_url(), code, msg, headers, fp)
        result.status = code
        return result

URL='http://www.ibm.com/developerworks/js/ajax1.js'
req=urllib2.Request(URL)
mgr=urllib2.build_opener(ErrorHandler())

while True:
    ns=mgr.open(req)
    if(ns.headers.has_key('last-modified')):
        modified=ns.headers.get('last-modified')
    if(ns.code==304):
        print '''
          ==============================
              NOT MODIFIED
          ==============================
        '''
    elif(ns.code==200):
        print ns.read()
    else:
        print 'there is an error';
        
    if(not locals().has_key('modified')):
        modified=time.time();
    req.add_header('If-Modified-Since',modified)
    time.sleep(10)
分享到:
评论

相关推荐

    python 通过onvif协议获取 Rtsp 视频.zip

    本主题主要关注如何使用Python编程语言通过ONVIF协议访问网络摄像机,并获取Rtsp(Real-Time Transport Protocol)视频流。 首先,了解ONVIF协议的基本概念是必要的。ONVIF定义了设备和服务的网络接口,包括媒体...

    Python车牌识别、车牌抓取源代码

    Python车牌识别、车牌抓取源程序,运行程序前需先导入cv2和numpy包。

    python爬虫,如何抓取网页数据

    python爬虫,如何抓取网页数据; python爬虫,如何抓取网页数据; python爬虫,如何抓取网页数据; python爬虫,如何抓取网页数据; python爬虫,如何抓取网页数据; python爬虫,如何抓取网页数据; python爬虫,...

    基于Python的http流抓取系统

    HTTP(超文本传输协议)是互联网上应用最广泛的数据传输协议,而HTTP流抓取则是通过编程方式实时获取HTTP数据的过程。Python作为一门强大的脚本语言,因其简洁的语法和丰富的库支持,成为HTTP抓取的首选工具。常见的...

    Web-Scraping-with-Python_Python网页信息抓取_Python抓取网页_jupyter_Python抓

    **Python网页信息抓取技术详解** 网页信息抓取,也称为网络爬虫或网页抓取,是通过自动化程序从互联网上获取大量数据的过程。在这个领域,Python语言因其强大的库支持和简洁的语法而成为首选工具。本教程将深入探讨...

    使用Python实现windows下的抓包与解析

    通过本文介绍的方法,开发者或网络安全研究人员能够在Windows环境下使用Python便捷地抓取和分析网络数据包,这对于网络故障排查、安全监控和协议分析等工作具有重要的实践价值。同时,对于学习网络协议和提高网络...

    python通过paramiko复制远程文件及文件目录到本地

    利用该模块,可以方便的进行ssh连接和sftp协议进行sftp文件传输以及远程命令执行。 安装paramiko也很简单,我用的是python3,装好了pip,可以直接用pip来安装。 不过由于 paramiko 模块内部依赖pycrypto,所以先...

    python小程序:数据抓取入库

    综上所述,这个"python小程序:数据抓取入库"项目涉及到Python的Web抓取、数据库操作、配置文件解析等多个方面,是学习Python实战技能的好例子。通过这个项目,你可以深入了解如何利用Python进行数据抓取和入库,...

    基于Python的斗鱼直播数据抓取爬虫设计源码

    该项目为基于Python语言的斗鱼直播数据抓取爬虫设计源码,包含282个Python文件、24个Python扩展文件、11个可执行文件、6个动态链接库文件、5个文本文件、4个XML文件、2个Python缓存文件、2个配置文件、2个批处理文件...

    python爬虫项目——自动批量抓取m3u8网页视频

    Python可以通过subprocess模块调用ffmpeg命令行工具,进行文件格式转换和合并操作。例如,可以使用以下命令将所有ts文件合并为一个MP4文件: ```bash ffmpeg -f concat -i <(for f in *.ts; do echo "file '$PWD/$f...

    python实现串口传文件(调用PCOMM.dll Zmodem协议传输)

    python实现调用PCOMM.dll Zmodem协议传文件, 顺带PcommLite 内含C++,DELPHI,VB 例子,以及 PCOMM.dll PCOMM.LIB, 还有linux系统rz/sz命令安装包 ( 我用来从windows传文件到Linux系统的,网上有几个python实现...

    Python网页数据抓取以及表格的制作

    本主题将深入探讨如何使用Python进行网页数据抓取,并介绍如何利用这些数据创建表格,同时涉及CSS文件的生成和字体的修改。 首先,网页数据抓取是通过Python中的库如BeautifulSoup或Scrapy来实现的。BeautifulSoup...

    Python27 豆瓣影评抓取 源码 及插件下载

    在本资源中,我们主要关注的是使用Python27版本进行豆瓣影评的抓取。Python是一种广泛使用的高级编程语言,特别适合于网络爬虫开发,因为它有丰富的库支持,如BeautifulSoup、Scrapy等,可以方便地解析和提取网页...

    Python数据抓取技术与实战.pdf

    由于提供的文件信息中并没有具体的Python数据抓取技术与实战内容,我无法生成具体的技术知识点。但是,我可以根据标题“Python数据抓取技术与实战.pdf”来构建一些关于Python数据抓取的基础知识点和实战技巧。 知识...

    通过python爬虫批量下载PDF文件

    在Python编程领域,爬虫是一种常见的技术,用于自动化地从互联网上抓取数据。本案例中,我们将讨论如何使用Python爬虫批量下载PDF文件,特别是针对教育类资源,如人教版学生教材。这个过程涉及到了几个关键的技术点...

    基于Python的FastestDet低配视觉抓取改版设计源码

    该项目是针对FastestDet视觉抓取技术进行低配版本改版的Python源码,总计包含103个文件,涵盖Python脚本、Shell脚本、C++代码以及配置文件、图片和文档等。其中,包含33个.pth文件用于环境配置,17个.jpg和9个.png...

    python抓取免费代理IP

    本项目提供了一套完整的解决方案,利用Python来抓取免费代理IP,并将其存储到MySQL数据库中,同时实现定期检查和排除失效的IP,构建自定义的代理IP池。 1. **Python抓取免费代理IP** `get_ips.py` 文件很可能是...

    python抓取

    Python抓取,通常指的是使用Python进行网络数据抓取或网络爬虫的过程。Python因其丰富的库支持和简洁的语法,成为了网络爬虫开发的热门选择。本文将深入探讨Python抓取的相关知识点,包括基础概念、常用库、爬虫架构...

    基于Python的资源整合与抓取设计源码

    该项目为Python编写的资源整合与抓取设计源码,包含27个文件,涵盖12个Python脚本、7个文本文件、4个XML文件、1个Git忽略文件、1个Idea项目文件、1个CSV文件和1个URL链接。该系统专注于资源获取、图片抓取、游戏和...

Global site tag (gtag.js) - Google Analytics