Python urlopen 使用小示例 - 杨继中的博客 - ITeye博客

`

yangjizhong24

浏览: 401660 次
性别:
来自: 北京

最近访客更多访客>>

yihms

xianghui12333

hbyufan

fkshl

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

tyjdzr：程序已经运行成功，第一次接触webservice，楼主领我入门 ...
java实现webservice实例
guosongchao：楼主介绍的确实简单，但是对于我这种对web service一点 ...
java实现webservice实例
gnail_oug： ...
java实现webservice实例
safedriver：楼主真心不错
java实现webservice实例
Partys： Partys 写道addArticleCategories(C ...
RESTful Web Services in Spring 3（上）

Python urlopen 使用小示例

博客分类：

理论

Python OS F#.net

阅读更多

一、打开一个网页获取所有的内容

from urllib import urlopen
doc = urlopen("http://www.baidu.com").read()
print doc
二、获取Http头

from urllib import urlopen
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('Content-Type')
三、使用代理

1. 查看环境变量

print ""n".join(["%s=%s" % (k, v) for k, v in os.environ.items()])
print os.getenv("http_proxy")
2. 设置环境变量

import os 
os.putenv("http_proxy", "http://proxyaddr:<port>")
3. 使用代理

# Use http://www.someproxy.com:3128 for http proxying
proxies = {'http': 'http://www.someproxy.com:3128'}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# Don't use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# Use proxies from environment - both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=None)
filehandle = urllib.urlopen(some_url)

详细出处参考：http://www.jb51.net/article/15720.htm

#实现图片下载   
import urllib   
url = r"http://www.iteye.com/images/logo.gif"  
path = r"h:\downloads\1.jpg"  
data = urllib.urlopen(url).read()   
f = file(path,"wb")   
f.write(data)   
f.close()

分享到：

为python脚本传递参数并批量改文件名 | linux环境下配置python

2009-12-31 14:49
浏览 4679
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Python urlopen()函数示例分享: 好了，废话少说，我们先看看几个示例吧一、打开一个网页获取所有的内容复制代码代码如下:from urllib import urlopendoc = urlopen(“http://www.baidu.com”).read()print doc 二、获取Http头复制代码代码如下...

Python urlopen()和urlretrieve()用法解析: 在Python编程中，网络编程是一个常见的需求，涉及到网络资源的读取和下载，urllib模块提供了一系列用于操作URL的功能，urlopen()和urlretrieve()是其中非常实用的两个函数。 urlopen()函数属于urllib.request模块，...

python爬虫使用cookie登录详解: ### Python爬虫使用Cookie登录详解 #### 前言在进行网络爬虫开发时，经常会遇到需要登录后才能访问的网页。此时，利用Cookie机制能够有效地帮助爬虫完成登录并抓取数据。本文将详细介绍如何使用Python的`urllib`库...

Python使用正则表达式抓取网页图片的方法示例: 本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考，具体如下： #!/usr/bin/python import re import urllib #获取网页信息 def getHtml(url): page = urllib.urlopen(url) ...

python抓取并保存html页面时乱码问题的解决方法: 在示例中，当编码一致时，直接使用`htmlfile.write(content)`写入内容，假设默认编码为UTF-8。 6. **使用`codecs`模块**：除了直接写入文件外，还可以使用`codecs`模块的`open`函数，指定打开文件的编码，如`codecs...

python网络编程小例子: Python网络编程是一个广泛的领域，它涵盖了使用Python语言进行网络数据传输、服务器开发、客户端应用创建等众多技术。在这个小例子中，我们将深入探讨Python在TCP/IP通信、HTTP协议、套接字编程以及Web服务等方面的...

Python contextlib模块使用示例: Python的`contextlib`模块是一个非常实用的工具，它提供了创建和使用上下文管理器的便利方式。上下文管理器在Python中主要用于控制资源的获取和释放，如文件、网络连接或者数据库会话等。它们通过定义`__enter__`和`...

Python-Web-Scraping:用于Python Web抓取的示例文件和小型项目: 我通常使用urlopen来获取网页内容，然后使用bs4从那里创建一个“汤”对象。安装BeautifulSoup4 使用点 pip install beautifulsoup4 使用easy_install easy_install beautifulsoup4 为Linux用户安装 sudo apt-get...

50个常用的Python库和示例代码: 在Python编程语言中，第三方库的使用极大地扩展了其功能，并且为开发者提供了大量的便利。以下是对文档中提到的一些最常用的Python库及其应用场景的详细解读，这些库是从分析GitHub上的5000个开源Python项目中筛选...

Python的净值数据接口调用示例分享: 本文将详细讲解如何使用Python调用净值数据接口，以获取基金相关的实时或历史数据。这个示例是针对聚合数据（Juhe）提供的基金净值数据接口，涵盖了多种类型的基金，包括全部开放基金、股票型基金、普通债券型基金、...

python从网络读取图片并直接进行处理的方法: 2. **使用`cStringIO`或`io.BytesIO`处理图片数据**：`cStringIO`模块（Python 2中）和`io.BytesIO`类（Python 3中）提供了类似文件接口的对象，允许我们在内存中处理二进制数据，这非常适合用来处理图像数据。...

python深度解析之小试牛刀初识爬虫: - 使用Python的`urllib.request`库中的`urlopen()`方法获取网页内容。 - 获取到的内容默认为二进制格式，需使用`decode()`方法转换为文本格式。 - 如果网页内容包含中文等特殊字符，需要指定正确的编码格式，例如...

python2 poster 模块: 下面是一个使用poster模块上传文件的基本示例： ```python from poster.encode import multipart_encode from poster.streaminghttp import register_openers import urllib2 # 创建一个MultipartParam对象，这里...

Python与简单网络爬虫的编写 - Python开发技术文章_教程 - 红黑联盟.pdf: 本知识点将围绕如何使用Python编写简单的网络爬虫进行详细阐述，从基础知识到实际操作，为没有基础的读者提供入门教程。知识点一：Python基础 Python是一门易于学习且功能强大的编程语言，它的语法清晰，有着大量...

python unittest基本介绍: 需要注意的是，这里的 `urllib.urlopen` 在 Python 3 中已经被移到了 `urllib.request.urlopen`，因此如果使用 Python 3，需要相应地更新代码。当有网址无法打开时，如返回 404 错误，测试会报错，如下所示： ```...

Python3学习urllib的使用方法示例: 本篇文章将重点介绍 `urllib.request` 模块中的 `urlopen` 方法以及如何使用 `Request` 类来进行更复杂的HTTP请求。 1. `urlopen()` 基本用法 `urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None...

Python编程金典_源代码: 《Python编程金典_源代码》是一本深受Python爱好者欢迎的书籍，其源代码提供了丰富的实践案例和示例，帮助读者深入理解Python编程的核心概念和技术。这个压缩包中包含的"Pythonhttp1_examples"文件，很可能是关于...

python爬虫第一课-python基础.docx: - **urllib.request模块**：使用urlopen()方法发送HTTP请求，获取网页内容。 - **处理HTTP响应**：解析HTTP响应头，处理编码问题，提取网页数据。 ### Python基础知识 #### 1. 安装Python3运行环境 - 下载最新版本...

python 3利用BeautifulSoup抓取div标签的方法示例: 接下来，我们来看一个具体的示例代码，了解如何使用Python 3结合BeautifulSoup来抓取`div`标签。 ```python # -*- coding: utf-8 -*- # python3环境 # XiaoDeng # 示例URL: http://tieba.baidu.com/p/2460150866 # ...

Global site tag (gtag.js) - Google Analytics