`
zuroc
  • 浏览: 1307578 次
  • 性别: Icon_minigender_1
  • 来自: 江苏
社区版块
存档分类
最新评论

python2.6的urlopen支持timeout了

 
阅读更多
python2.6的urlopen支持timeout了
我喜欢
不过什么时候才能发布呢.........
________
后记

urllib2.urlopen(url[, data][, timeout])
Open the URL url, which can be either a string or a Request object.

data may be a string specifying additional data to send to the server, or None if no such data is needed. Currently HTTP requests are the only ones that use data; the HTTP request will be a POST instead of a GET when the data parameter is provided. data should be a buffer in the standard application/x-www-form-urlencoded format. The urllib.urlencode() function takes a mapping or sequence of 2-tuples and returns a string in this format.

The optional timeout parameter specifies a timeout in seconds for blocking operations like the connection attempt (if not specified, the global default timeout setting will be used). This actually only works for HTTP, HTTPS, FTP and FTPS connections.

This function returns a file-like object with two additional methods:

geturl() — return the URL of the resource retrieved, commonly used to determine if a redirect was followed
info() — return the meta-information of the page, such as headers, in the form of an httplib.HTTPMessage instance (see Quick Reference to HTTP Headers)
Raises URLError on errors.

Note that None may be returned if no handler handles the request (though the default installed global OpenerDirector uses UnknownHandler to ensure this never happens).

Changed in version 2.6: timeout was added.

分享到:
评论

相关推荐

    Python urlopen()函数 示例分享

    复制代码 代码如下:from urllib import urlopendoc = urlopen(“http://www.baidu.com”).read()print doc 二、获取Http头 复制代码 代码如下:from urllib import urlopendoc = urlopen(“http://www.baidu.com”)...

    python编写搜索百度百科软件

    这个软件是在Linux环境下利用Python 2.6版本实现的,它展示了如何利用网络爬虫技术来抓取和处理网页数据,特别是从百度百科这类信息丰富的网站获取信息。 首先,我们需要了解Python 2.6的基础知识。虽然Python 3...

    Python urlopen 使用小示例

    Python的`urlopen`函数是`urllib`模块的一部分,用于打开和读取网络资源,如网页、API接口等。这个功能强大的工具是Python进行网络编程的基础,特别在爬虫和自动化任务中不可或缺。让我们详细了解一下`urlopen`的...

    Python爬虫基础教程-Urllib详解.pdf

    urlopen接受的参数包括url、data(POST请求的数据)、timeout(超时设置)等,还有SSL相关的cafile、capath、cadefault等参数,用于HTTPS连接的安全配置。 2. **urllib.error**:处理与网络请求相关的异常,如...

    python_wget

    request = urllib.request.Request(url, timeout=10) ``` 以上就是使用Python实现wget功能的一些基本步骤和技巧。在实际应用中,你可能需要根据具体需求进行扩展,比如处理HTTPS证书验证、处理cookies、或者支持...

    python抓取并保存html页面时乱码问题的解决方法

    在Python3中,此功能已被移除,因此在Python3中无需设置默认编码。 5. **正确写入文件**:在写入文件时,确保使用正确的编码。在示例中,当编码一致时,直接使用`htmlfile.write(content)`写入内容,假设默认编码为...

    Python使用urllib模块的urlopen超时问题解决方法

    于是用了一个python脚本来执行,前面抓了几个都没有什么问题,后来碰到一个论坛,在执行urlopen的地方总是提示超时,百度了一下,因为我使用的是urllib不是urllib2,所以无法直接在urlopen里面加timeout参数,只能是...

    Python urlopen()和urlretrieve()用法解析

    在Python编程中,网络编程是一个常见的需求,涉及到网络资源的读取和下载,urllib模块提供了一系列用于操作URL的功能,urlopen()和urlretrieve()是其中非常实用的两个函数。 urlopen()函数属于urllib.request模块,...

    python写的翻译软件源代码

    Python编写的翻译软件源代码是一种基于编程语言的学习资源,它为开发者提供了实现机器翻译功能的实例。本项目采用Python作为开发工具,结合GUI图形用户界面和API接口调用来实现翻译功能,尤其适合初学者理解Python...

    Python爬虫基础之Urllib库

    其中,URL 是必须要传送的,data 和 timeout 可以不传送,data 默认为空 None,timeout 默认为 socket._GLOBAL_DEFAULT_TIMEOUT。 例如,以下代码可以访问百度的首页并读取返回结果: ``` import urllib2 response...

    解决python3 urllib中urlopen报错的问题

    ### 解决Python3 urllib中urlopen报错的问题 在Python3中使用`urllib`库进行网络请求时,可能会遇到`AttributeError: 'module' object has no attribute 'urlopen'`这样的错误。本文将详细介绍这一问题的原因以及...

    IDLE PYthon2.7

    IDLE是一款很不错的python的代码编辑器,我认为它不仅仅是一个代码编辑器,是一个完整的IDE开发环境了,它可以很大程度上提高你的开发效率。 1. 高亮python的关键字; 2. 通过alt+/ 自动完成代码; 3. 可以运行在...

    Python编程金典_源代码

    1. **变量与数据类型**:Python中的变量可以动态赋值,支持基本数据类型如整型(int)、浮点型(float)、字符串(str)和布尔型(bool),以及复合数据类型如列表(list)、元组(tuple)、字典(dict)和集合(set...

    Python抓取页面、Pthon爬虫参考资料

    通过设置选项如`FOLLOWLOCATION`进行重定向,`MAXREDIRS`限制重定向次数,以及`CONNECTTIMEOUT`和`TIMEOUT`控制超时,可以实现更复杂的网络操作。`pycurl.WRITEFUNCTION`允许自定义数据接收回调,便于动态处理下载的...

    python爬虫使用cookie登录详解

    response = urllib.request.urlopen('http://www.example.com/get', timeout=4) ``` ##### 三、构造Request对象 在进行更复杂的请求时,我们往往需要构造一个`Request`对象,并对其进行进一步的定制化设置。 1. **...

    python爬取百度百科的页面

    Python爬虫技术是数据获取和信息处理的重要工具,尤其在大数据时代,网页抓取成为获取非结构化数据的常见手段。本教程将详细介绍如何使用Python的BeautifulSoup和urllib2库来爬取百度百科的页面内容。 首先,`...

    python3.7.3

    - **安全的默认导入**:Python 3.7 更加关注导入安全,例如,`urllib.request.urlopen()`不再默认信任所有SSL/TLS证书。 5. **安装与部署**: - `python-3.7.3-amd64.exe`是针对64位Windows系统的安装程序,包含...

    future-0.18.2-py3-none-any.zip

    在Python 2.6及更高版本中,"future"模块允许开发者使用Python 3的语法,同时保持对Python 2的兼容性,这在维护大型项目或逐步升级代码库时非常有用。 "future"模块主要包括以下几个核心部分: 1. **`__future__`...

    PYTHON网络编程基础.pdf

    在Python中,由于其简洁的语法和丰富的库支持,网络编程变得相对容易。 首先,Python中的socket模块是网络编程的基础,它提供了低级的网络通信接口,可以创建TCP(传输控制协议)和UDP(用户数据报协议)套接字。...

    python 远程获取文件

    `paramiko`则是一个强大的SSHv2协议库,支持SFTP文件传输。 3. FTP 文件传输: ```python import ftplib def download_ftp_file(ftp_server, remote_path, local_path): ftp = ftplib.FTP(ftp_server) ftp....

Global site tag (gtag.js) - Google Analytics