`
uule
  • 浏览: 6351589 次
  • 性别: Icon_minigender_1
  • 来自: 一片神奇的土地
社区版块
存档分类
最新评论

Cookie总结

 
阅读更多

Cookie

Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)

比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib2库保存我们登录的Cookie,然后再抓取其他页面就达到目的了。

 

1.Opener

当你获取一个URL你使用一个opener(一个urllib2.OpenerDirector的实例)。在前面,我们都是使用的默认的opener,也就是urlopen。它是一个特殊的opener,传入的参数仅仅是url,data,timeout。

如果我们需要用到Cookie,只用这个opener是不能达到目的的,所以我们需要创建更一般的opener来实现对Cookie的设置。

 

2.Cookielib

cookielib模块的主要作用是提供可存储cookie的对象,我们可以利用本模块的CookieJar类的对象来捕获cookie并在后续连接请求时重新发送,比如可以实现模拟登录 功能。该模块主要的对象有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar。

 

它们的关系:CookieJar —-派生—->FileCookieJar —-派生—–>MozillaCookieJar和LWPCookieJar

Python3中,cookielib改成 http.cookiejar,方法里也需改成 http.cookiejar

 

1)获取Cookie保存到变量

Python代码 
  1. import urllib.request  
  2. import http.cookiejar  
  3. #声明一个CookieJar对象实例来保存cookie  
  4. cookie = http.cookiejar.CookieJar()  
  5. #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器  
  6. handler=urllib.request.HTTPCookieProcessor(cookie)  
  7. #通过handler来构建opener  
  8. opener = urllib.request.build_opener(handler)  
  9. #此处的open方法同urllib.request的urlopen方法,也可以传入request  
  10. response = opener.open('http://www.baidu.com')  
  11. for item in cookie:  
  12.     print('Name = '+item.name)  
  13.     print('Value = '+item.value)  

 结果:

Java代码 
  1. Name = BAIDUID  
  2. Value = B07B663B645729F11F659C02AAE65B4C:FG=1  
  3. Name = BAIDUPSID  
  4. Value = B07B663B645729F11F659C02AAE65B4C  
  5. Name = H_PS_PSSID  
  6. Value = 12527_11076_1438_10633  
  7. Name = BDSVRTM  
  8. Value = 0  
  9. Name = BD_HOME  
  10. Value = 0  

 

2)保存Cookie到文件

 

在上面的方法中,我们将cookie保存到了cookie这个变量中,如果我们想将cookie保存到文件中该怎么做呢?这时,我们就要用到FileCookieJar这个对象了,在这里我们使用它的子类MozillaCookieJar来实现Cookie的保存

Python代码 
  1. import http.cookiejar  
  2. import urllib.request  
  3.    
  4. #设置保存cookie的文件,同级目录下的cookie.txt  
  5. filename = 'cookie.txt'  
  6. #声明一个MozillaCookieJar对象实例来保存cookie,之后写入文件  
  7. cookie = http.cookiejar.MozillaCookieJar(filename)  
  8. #利用urllib2库的HTTPCookieProcessor对象来创建cookie处理器  
  9. handler = urllib.request.HTTPCookieProcessor(cookie)  
  10. #通过handler来构建opener  
  11. opener = urllib.request.build_opener(handler)  
  12. #创建一个请求,原理同urllib2的urlopen  
  13. response = opener.open("http://www.baidu.com")  
  14. #保存cookie到文件  
  15. cookie.save(ignore_discard=True, ignore_expires=True)  

 

 3)从文件中获取Cookie并访问

那么我们已经做到把Cookie保存到文件中了,如果以后想使用,可以利用下面的方法来读取cookie并访问网站

Python代码 
  1. import http.cookiejar  
  2. import urllib.request  
  3.    
  4. #创建MozillaCookieJar实例对象  
  5. cookie = http.cookiejar.MozillaCookieJar()  
  6. #从文件中读取cookie内容到变量  
  7. cookie.load('cookie.txt', ignore_discard=True, ignore_expires=True)  
  8. #创建请求的request  
  9. req = urllib.request.Request("http://www.baidu.com")  
  10. #利用urllib2的build_opener方法创建一个opener  
  11. opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))  
  12. response = opener.open(req)  
  13. print(response.read())  

 

如果我们的 cookie.txt 文件中保存的是某个人登录百度的cookie,那么我们提取出这个cookie文件内容,就可以用以上方法模拟这个人的账号登录百度

 

例子:

创建一个带有cookie的opener,在访问登录的URL时,将登录后的cookie保存下来,然后利用这个cookie来访问其他网址。

如登录之后才能查看的成绩查询呀,本学期课表呀等等网址,模拟登录就这么实现啦

Python代码 
  1. import urllib  
  2. import urllib2  
  3. import cookielib  
  4.    
  5. filename = 'cookie.txt'  
  6. #声明一个MozillaCookieJar对象实例来保存cookie,之后写入文件  
  7. cookie = cookielib.MozillaCookieJar(filename)  
  8. opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))  
  9. postdata = urllib.urlencode({  
  10.             'stuid':'201200131012',  
  11.             'pwd':'23342321'  
  12.         })  
  13. #登录教务系统的URL  
  14. loginUrl = 'http://jwxt.sdu.edu.cn:7890/pls/wwwbks/bks_login2.login'  
  15. #模拟登录,并把cookie保存到变量  
  16. result = opener.open(loginUrl,postdata)  
  17. #保存cookie到cookie.txt中  
  18. cookie.save(ignore_discard=True, ignore_expires=True)  
  19. #利用cookie请求访问另一个网址,此网址是成绩查询网址  
  20. gradeUrl = 'http://jwxt.sdu.edu.cn:7890/pls/wwwbks/bkscjcx.curscopre'  
  21. #请求访问成绩查询网址  
  22. result = opener.open(gradeUrl)  
  23. print result.read()  

 

===========================================================================================

 

使用Cookie模拟登录——获取电子书下载链接

(登录后获取cookie,然后将cookie放入header中传入请求)

 

我们尝试使用以下登录之后的Cookie

使用Cookie有两种方式:

  

1、直接将Cookie写在header头部

# coding=utf-8
import requests
from bs4 import BeautifulSoup

#登录后cookie
cookie = '''cisession=19dfd70a27ec0eecf1fe3fc2e48b7f91c7c83c60;CNZZDATA1000201968=1815846425-1478580135-https%253A%252F%252Fwww.baidu.com%252F%7C1483922031;Hm_lvt_f805f7762a9a237a0deac37015e9f6d9=1482722012,1483926313;Hm_lpvt_f805f7762a9a237a0deac37015e9f6d9=1483926368'''

header = {    
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36',    
'Connection': 'keep-alive',       
'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',  
'Cookie': cookie}

url = 'https://kankandou.com/book/view/22353.html'
wbdata = requests.get(url,headers=header).text
soup = BeautifulSoup(wbdata,'lxml')
print(soup)

 

2、使用requests插入Cookie

# coding=utf-8
import requests
from bs4 import BeautifulSoup

#登录后cookie
cookie = {
"cisession":"19dfd70a27ec0eecf1fe3fc2e48b7f91c7c83c60",          
"CNZZDATA100020196":"1815846425-1478580135-https%253A%252F%252Fwww.baidu.com%252F%7C1483922031",          
"Hm_lvt_f805f7762a9a237a0deac37015e9f6d9":"1482722012,1483926313",          
"Hm_lpvt_f805f7762a9a237a0deac37015e9f6d9":"1483926368"
}

url = 'https://kankandou.com/book/view/22353.html'
wbdata = requests.get(url,cookies=cookie).text
soup = BeautifulSoup(wbdata,'lxml')
print(soup)

 

。。。

 

 

 

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    cookie总结

    这是一篇关于cookie的来源,以及cookie的简单介绍,有cookie的一些方法的实例,进行简单的cookie总结

    学习cookie的笔记和总结

    ### 学习cookie的笔记和总结 #### 一、什么是Cookie? Cookie是一种小型的数据文件,由服务器发送到用户的浏览器,并存储在用户计算机上的一种机制。它主要用于保存用户的偏好设置、登录状态等信息,以便用户再次...

    cookie读写,子cookie

    总结,Cookie是Web开发中的基础组件,用于维护客户端和服务器的状态。理解Cookie的读写和子Cookie的概念,以及如何利用工具类进行操作,对于任何Web开发者来说都是至关重要的技能。通过熟练掌握这些知识,你可以更...

    C#操作cookie,解密加密cookie

    ### 总结 在C#中操作Cookie不仅涉及到基本的添加、读取和删除,还涉及到更高级的功能,如序列化、反序列化,甚至是加密与解密。通过理解和掌握这些技术,开发者可以构建更加安全、高效的应用程序。对于Cookie的管理...

    JS cookie Java cookie regex 整理结果

    总结来说,JS和Java Cookie提供了在客户端和服务器端存储和读取数据的方法,而Regex则作为一种强大的文本处理工具,用于处理和验证Cookie的格式。掌握这些技术,对于Web开发人员来说至关重要,能够帮助他们构建更加...

    易语言取设cookie

    总结来说,易语言的“取设cookie”功能是网络编程中的核心部分,对于开发基于HTTP协议的Web应用程序至关重要。通过熟练掌握`InternetSetCookieA`和`InternetGetCookieA`函数的使用,可以有效地实现用户身份验证、...

    Cookie将用户名和密码加密后存在客户端的Cookie当中

    ### Cookie存储加密用户名与密码 ...#### 六、总结 通过在客户端的Cookie中存储加密后的用户名和密码,可以实现“记住我”功能,为用户提供更便捷的体验。但同时也需要注意安全性和隐私问题,确保系统的整体安全性。

    QT访问网页获取Cookie

    总结来说,在QT中访问网页获取Cookie涉及到的主要知识点有:QNetworkAccessManager、QNetworkRequest、QNetworkReply、QNetworkCookie以及它们之间的交互。通过正确使用这些类和方法,开发者可以方便地在QT应用程序...

    cookie分析工具

    **总结** Cookie分析工具如IECookiesView v1.73是网络技术的重要辅助工具,它既有助于个人管理自己的隐私,也有助于网站开发者提升服务质量。了解和使用这类工具,可以更好地理解和控制网络环境中的数据交互,维护...

    browser-cookie 获取浏览器cookie

    #### 四、总结 `browser-cookie3`是一个非常有用的工具,可以帮助开发者轻松地将浏览器中的cookies集成到Python脚本中,以便实现自动化操作。通过这种方式,开发者可以避免重复登录等繁琐的操作,同时提高脚本的...

    原生登录cookie保持提供webview使用

    总结来说,原生登录cookie保持提供给WebView使用涉及到Android的`CookieManager`类和WebView的生命周期管理。通过以上步骤,我们可以有效地在原生应用和WebView之间共享登录状态,为用户提供无缝的浏览体验。在实际...

    C# Cookie提取工具

    总结来说,【C# Cookie提取工具】是一个利用C#编程语言实现的实用工具,通过与HTTP服务器交互并解析响应,高效地提取网站Cookie信息。它依赖于C#的网络编程功能,并可能利用自定义的NativeMethods进行底层操作,提供...

    Cookie简介及JSP处理Cookie的方法.doc

    总结来说,Cookie是Web应用程序中实现用户跟踪、状态管理的重要工具。在JSP中,利用Cookie类提供的方法,我们可以轻松创建、修改和读取Cookie,从而提供更加个性化的用户体验和服务。理解并熟练掌握Cookie的使用对于...

    android cookie获取和设置,webView的cookie的同步

    总结而言,在 Android 开发中,合理管理 Cookie 对于保持客户端与服务器之间的一致性非常重要。通过上述方法,我们可以有效地控制 Cookie 的设置和获取,从而实现更加稳定的会话管理。同时,利用 WebView 的 Cookie ...

    cookie中设置了HttpOnly属性,那么通过js脚本将无法读取到cookie信息,这样能有效的防止XSS攻击.zip_js设置cookie值

    **总结** HttpOnly属性是提升Web应用安全性的有效手段,它可以阻止JavaScript对Cookie的访问,降低XSS攻击的危害。无论是Java还是PHP,设置HttpOnly属性都是相对简单的过程,只需在创建Cookie时指定相应的选项即可...

    Extjs 关于 cookie的操作

    #### 六、总结 本文介绍了 Extjs 中如何利用 Cookie 来实现实时存储数据的功能。通过创建 `CookieProvider`,可以轻松地实现数据的读写操作。同时,通过监听表单事件,可以在适当的时候更新 Cookie,确保数据的实时...

    jquery cookie 实例下载

    总结起来,jQuery Cookie插件使得在JavaScript环境中操作Cookie变得简单易行。无论是设置、读取还是删除Cookie,或是设定有效期和范围,都有明确的API供开发者调用。通过学习并应用这些知识点,你可以提升Web应用...

    jquery.cookie.js 以及用法 cookie读取与存储

    总结,`jquery.cookie.js`简化了JavaScript对Cookie的操作,使得在Web应用中管理用户数据变得更加便捷。然而,随着Web Storage(localStorage和sessionStorage)以及IndexedDB等现代存储技术的出现,对于大量数据或...

    jquery-cookie(Jq取cookie必备).rar

    总结来说,jQuery Cookie是一个强大的工具,它使JavaScript中的Cookie操作变得简单而直观。通过使用这个插件,开发者可以更专注于业务逻辑,而不用花费太多精力在底层的Cookie操作上。无论你是初学者还是经验丰富的...

    jquery.cookie.js包

    总结起来,`jquery.cookie.js`提供了一种方便的方式来处理客户端的Cookie操作,简化了诸如“记住密码”这样的功能的实现。在实际应用中,结合适当的加密和安全策略,我们可以为用户提供更便捷的体验,同时保证数据的...

Global site tag (gtag.js) - Google Analytics