`
qepwqnp
  • 浏览: 108850 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

python模块学习 ---- Cookie

阅读更多

最近在用GAE开发自己的博客程序。虽然GAE的API没有显式的提供操作Cookie的方法,但他现有的架构,使我们有足够的自由来操作Cookie。

Cookie 模块,顾名思义,就是用来操作Cookie的模块。Cookie这块小蛋糕,玩过Web的人都知道,它是Server与Client保持会话时用到的信息 切片。 Http协议本身是无状态的,也就是说,同一个客户端发送的两次请求,对于Web服务器来说,没有直接的关系。既然这样,有人会问,既然Http是无状态 的, 为什么有些网页,只有输入了用户名与密码通过验证之后才可以访问?那是因为:对于通过身份验证的用户,Server会偷偷的在发往Client的数据中添 加 Cookie,Cookie中一般保存一个标识该Client的唯一的ID,Client在接下来对服务器的请求中,会将该ID以Cookie的形式一并 发往Server,Server从回传回来的Cookie中提取ID并与相应的用户绑定起来,从而实现身份验证。说白了,Cookie就是一个在服务器与客户端之间相互传递的字符串(下图通过FireFox的FireBug插件查看访问google.com时的Cookie)。 越扯越远了,回到我们的主题:Python标准模块 -- Cookie。

Http请求头

(上图是Http请求头中的Cookie信息)

Http响应头

(上图是Http响应中的Cookie信息)

Cooke模块中定义了4个直接操作Cookie的类:BaseCookie、SimpleCookie、SerialCookie、 SmartCookie。其中,BaseCookie是基类,定义了操作Cookie的公共部分,其他3个类都继承自BaseCookie,它们之间的区 别仅仅在于序列化数据的方式不同。下面简单讲解这些类的使用。
BaseCookie基类: BaseCookies的行为非常像dict,可以用键/值对的形式来操作它,但是kye必须是字符串,value是Morsel对象 (下面会讲到Morsel)。BaseCookies定义了编码/解码,输入/输出操作的公共规范:

BaseCookie.value_decode(val)
BaseCookie.value_encode(val):
对数据进行序列化/反序列化。这些方法都返回字符串,以便通过Http传输。
BaseCookie.output():
返回字符串,该字符串可以作为Http响应头发往客户端。
BaseCookie.js_output()
返回嵌入js脚本的字符串,浏览器通过执行该脚本,就可以得到cooke数据。
BaseCookie.load(newdata):解析字符串为Cookie数据。

SimpleCookie、SerialCookie、SmartCookie都继承自BaseCookie,具有一致的行为,它们各自对 BaseCookie的value_decode, value_encode进行了重写并实现自己的序列化/反序列化策略,其中:

  • SimpleCookie内部使用str()来对数据进行序列化;
  • SerialCookie则通过pickle模块来序列化反序列化数据;
  • SmartCookie相对聪明点,对于非字符串数据,使用pickle序列/反序列化,否则将字符串原样返回。

下面的例子简单的说明如何使用Cookie模块:

import Cookie

c = Cookie.SimpleCookie()
c['name'] = 'DarkBull'
c['address'] = 'ChinaHangZhou'
c['address']['path'] = '/' # 路径
c['address']['domain'] = 'appspot.com' # domain
c['address']['expires'] = 'Fir, 01-Oct-2010 20:00:00 GMT' # 过期时间
print c.output()
print c.js_output()

# 输出结果,与上图对照
# Set-Cookie: address=ChinaHangZhou; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT; Path=/
# Set-Cookie: name=DarkBull

# 作为脚本输出
# <script type="text/javascript">
# document.cookie = "address=ChinaHangZhou; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT; Path=/";
# </script>

# <script type="text/javascript">
# document.cookie = "name=DarkBull";
# </script>

Morsel类 : 用于表示Cookie中每一项数据的属性而抽象的类。这些属性包括:expires, path, comment, domain, max-age, secure, version等等(看上图下划线标注部分)。如果你玩过web,对这些应该不会陌生,可以在RCF2109中找到他们的具体定义。
Morsel.key,Morsel.value:Cookie数据项的key/value(value可以是二进制数据);
Morsel.coded_value:数据编码后得到的字符串。Http协议是基于文本的协议,Server无法直接向Client发送二进制数据,只有序列化成字符串后,才能发往Client;
Morsel.set(key, value, coded_value):设置Cookie数据项的key、value、coded_value;
Morsel.isReversvedKey(key):如果key是expires, path, comment, domain, max-age, secure, version, httponly中的一个,返回True,否则返回False;
Morsel.output():返回型如“Set-Cookie: ...”的字符串,表示一个Cookie数据项;
Morsel.js_output():返回Cookie数据项的脚本字符串;
Morsel.OutputString(): 返回Morsel的字符串表示;

Morsel使用示例:

import Cookie

m = Cookie.Morsel()
m.set('name', 'DarkBull', 'DarkBull')
m['expires'] = 'Fir, 01-Oct-2010 20:00:00 GMT'
m['domain'] = 'appspot.com'
print m.output()

# 结果
# Set-Cookie: name=DarkBull; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT

关于Cookie模块更详细的内容,可以Python手册。

分享到:
评论

相关推荐

    python-flask-and-django-full-stack-python-for-web-development

    - **相对导入**:Python 支持不同类型的模块导入方式,了解这些对于维护大型项目至关重要。 - **应用目录结构**:组织良好的目录结构对于项目管理来说至关重要。 ##### 第二章 - 虚拟环境 - **虚拟环境的作用**:...

    PyPI 官网下载 | tencentcloud-sdk-python-clb-3.0.438.tar.gz

    在tencentcloud-sdk-python-clb-3.0.438压缩包中,包含的文件主要是SDK的核心库和相关文档,如`setup.py`用于安装和配置,`tencentcloud`目录下则是SDK的具体模块,如`clb`模块对应CLB服务的API接口。开发者可以通过...

    Python代码源码-实操案例-框架案例-如何通过requests模块实现Cookie登录.zip

    本案例将探讨如何利用requests模块实现Cookie登录,这对于自动化测试、爬虫或者模拟用户行为非常有用。Cookie是一种在网络浏览器和服务器之间传递信息的技术,通常用于维持用户会话状态。 首先,了解requests模块的...

    利用Python实现网络爬虫 Hands-On-Web-Scraping-with-Python-master.zip

    再者,Python的正则表达式模块re则用于处理更复杂的文本匹配需求。当网页结构复杂,BeautifulSoup无法满足我们的需求时,正则表达式可以帮助我们精确地匹配和提取数据。 对于动态加载的网页,Selenium库则是一个...

    Python-Crawler-master_爬虫_python爬虫_

    综上所述,Python-Crawler-master项目涵盖了Python爬虫的多个核心方面,从基础的HTTP请求到复杂的多线程爬取,再到数据解析与存储,以及应对反爬策略,都是学习和实践Python爬虫的重要环节。对于想要深入理解和掌握...

    Python 和 LDAP进行域认证

    `python-ldap`是一个纯Python模块,它实现了LDAPv3协议,支持搜索、绑定、修改、添加、删除等操作。在Python中使用`python-ldap`,首先需要安装相应的库,如压缩包中的`python-ldap-2.4.4.win32-py2.6.msi`等文件,...

    Python爬⾍-request模块的使用

    ### Python爬虫——request模块的使用 #### 一、request模块的作用 `requests`模块是Python中最常用的HTTP库之一,它允许用户发送HTTP/1.1请求极其方便。相较于urllib,`requests`提供了更为人性化的API接口。通过...

    Python学习笔记-基于socket基础的http服务端程序

    总的来说,通过Python的`socket`模块,我们可以学习到网络通信的基础,理解HTTP协议的工作流程,并动手实现一个简单的HTTP服务器。这个过程有助于提升对网络编程的理解,为开发更复杂的Web应用打下坚实的基础。在...

    Python代码源码-实操案例-框架案例-智慧校园考试系统.zip

    1. **Python基础**:作为源码的基础,Python的基础语法是必不可少的,包括变量、数据类型(如列表、字典、元组等)、流程控制(如条件语句、循环)、函数定义和调用以及模块导入等。 2. **Web框架**:智慧校园考试...

    python标准库-329页

    * `cookie` 模块:提供了 Cookies 相关的功能。 * `robotparser` 模块:提供了机器人解析相关的功能。 * `ftplib` 模块:提供了 FTP 客户端相关的功能。 * `gopherlib` 模块:提供了 Gopher 客户端相关的功能。 * `...

    Python-模拟新浪微博

    函数的定义和调用是程序模块化的关键,而类和对象则是实现面向对象编程的基础,对于构建复杂系统至关重要。 接下来,我们将利用Python的Web开发框架来构建后端服务。常见的Python Web框架有Django、Flask等。假设...

    python常用pycurl-7.43.0.1

    `pycurl`是基于libcurl库的Python接口,提供了丰富的功能,如HTTP请求、文件上传、代理服务器支持、SSL加密、cookie处理、限速等。在版本7.43.0.1中,它包含了对最新HTTP协议特性的支持以及对一些已知问题的修复。 ...

    Python应用实战-Python爬取、采集&可视化知乎问题的回答

    Python提供了多种数据存储方式,如CSV(pandas的read_csv/write_csv)、JSON(json模块)和数据库(如SQLite,使用sqlite3模块)。 7. **数据分析与可视化**:Python的pandas库是数据处理的强大工具,可以对爬取的...

    Python 如何通过requests模块实现Cookie登录 Python源码

    Python 如何通过requests模块实现Cookie登录 Python源码Python 如何通过requests模块实现Cookie登录 Python源码Python 如何通过requests模块实现Cookie登录 Python源码Python 如何通过requests模块实现Cookie登录 ...

    Python 图片爬虫-LofterSpider.zip

    8. **日志记录**:为了跟踪爬虫运行状态,一般会启用日志模块记录爬取过程中的关键信息,如请求成功/失败次数、下载的图片数量等。 9. **效率优化**:为了避免对服务器造成过大压力,爬虫可能采用延迟下载、限制...

    网络爬虫-如何通过requests模块实现Cookie登录-Python实例源码.zip

    网络爬虫-如何通过requests模块实现Cookie登录-Python实例源码.zip

    python 爬虫开发-爬取某站小视频的大小demo源码.zip

    通过这个Demo源码,我们可以学习到以下几个关键知识点: 1. **HTTP请求与响应**:Python的`requests`库是进行网络请求的标准工具。在爬取网页时,我们需要发送GET请求到目标URL以获取页面内容。然后,服务器会返回...

    Python源码实例-26 爬取音乐评论.rar

    Python内置了json模块,可以方便地将JSON字符串转化为Python对象,或者将Python对象转化为JSON字符串。 6. **网页分页处理**:如果评论很多,通常会被分页显示。我们需要识别出分页链接的规律,然后通过循环请求...

    Python-pythonjwt一个用来生成和验证JSONWebTokens的模块

    在Python中,`python-jwt`是一个用于生成和验证JWT的模块,它对于实现身份验证和授权服务非常有用。下面我们将深入探讨`python-jwt`的使用、原理以及如何在实际的Python开发中应用。 首先,我们要理解JWT的基本结构...

    requests-cache 是为 Python 的 Requests 库提供了持久化缓存支持的 Python 模块-python

    requests-cache 是为 Python 的 Requests 库提供了持久化缓存支持的 Python 模块 requests-cache Requests-cache 是一个透明的持久缓存请求(版本 &gt;= 1.1.0)库。 用法示例 只需编写: import requests import ...

Global site tag (gtag.js) - Google Analytics