【爬虫解析4】：requests总结

uule

浏览: 6387341 次
性别:
来自: 一片神奇的土地

最近访客更多访客>>

myzcm

wangenbao1

hyjqdy

逆光下的轮廓

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Python

https://www.cnblogs.com/whatbeg/p/5320666.html

会话对象requests.Session能够跨请求地保持某些参数，比如cookies，即在同一个Session实例发出的所有请求都保持同一个cookies,而requests模块每次会自动处理cookies，这样就很方便地处理登录时的cookies问题。在cookies的处理上会话对象一句话可以顶过好几句urllib模块下的操作。即相当于urllib中的：

cj = http.cookiejar.CookieJar()

pro = urllib.request.HTTPCookieProcessor(cj)

opener = urllib.request.build_opener(pro)

urllib.request.install_opener(opener)

1：保持请求之间的Cookies，我们可以这样做。

import requests

session = requests.Session()

session.get(login_url) # 可以保持登录态

2：请求时，会加上headers，一般我们会写成这样

session.get(url, params, headers=headers)

唯一不便的是之后的代码每次都需要这么写，代码显得臃肿，所以我们可以这样:

#在构造函数中，这样设置是全局的。

# 设置请求头

s = requests.Session()

s.headers = {'balabala'}

# 移除服务器验证

s.verify = False

# 设置代理

s.proxies={'aa'}

3：默认requests请求失败后不会重试，但是我们跑case时难免遇到一些网络或外部原因导致case失败，我们可以在Session实例上附加HTTPAdapaters 参数，增加失败重试次数。

request_retry = requests.adapatrs.HTTPAdapaters(max_retries=3）

session.mount('https://',request_retry)

session.mount('http://',request_retry)

这样，之后的请求，若失败，重试3次。

4：重定向

网络请求中可能会遇到重定向，我们需要一次处理一个请求，可以把重定向禁止。

session.post(url,data,allow_redirects=False)

5： post请求提交json格式数据时(请求头为:{“Content-Type”: “application/json”})，一般先要把python对象转换成json对象。可能很多时候是这样写：

session.post(url, data=json.dumps(data))。

其实post有一个默认参数json，可以直接简写成：

session.post(url, json=data)

6：写接口请求，debug时，会需要看下代码请求的详细信息，当然我们可以使用fiddler来查看，其实我们自己也可以在代码这样获取debug信息*

import requests

import logging

import httplib as http_client

http_client.HTTPConnection.debuglevel = 1

logging.basicConfig()

logging.getLogger().setLevel(logging.DEBUG)

requests_log = logging.getLogger("requests.packages.urllib3")

requests_log.setLevel(logging.DEBUG)

requests_log.propagate = True

requests.get('https://www.baidu.com')

#更好的方法是自己封装一个装饰器，就可以为任意请求函数添加一个debug功能。

7：使用grequests实现异步请求。

pip install grequests

import grequests

urls = [

'http://www.url1.com',

'http://www.url2.com',

'http://www.url3.com',

'http://www.url4.com',

'http://www.url5.com',

'http://www.url6.com',

]

resp = (grequests.get(u) for u in urls)

grequests.map(resp)

# [<Response [200]>, <Response [200]>, <Response [200]>, <Response [200]>, <Response [200]>, <Response [200]>]

8：发送自定义cookies

我们使用Session实例来保持请求之间的cookies，但是有些特殊情况，需要使用自定义的cookies

我们可以这样

# 自定义cookies

cookie = {'guid':'5BF0FAB4-A7CF-463E-8C17-C1576fc7a9a8','uuid':'3ff5f4091f35a467'}

session.post('http://wikipedia.org', cookies=cookie)

9：需求确定前后端并行设计时，这时测试并没有办法调用接口，如何做接口测试呢？我们可以使用mock或者是httpretty

import requests

import httpretty

# 模拟返还的状态码

@httpretty.activate

def test_beta1_access():

httpretty.register_uri(httpretty.GET, "http://beta.com/",

body="here is the mocked body",

status=201)

response = requests.get('http://beta.com')

expect(response.status_code).to.equal(201)

# 模拟返还response的body

@httpretty.activate

def test_some_api():

httpretty.register_uri(httpretty.GET, "http://beta.com/",

body='{"success": false}',

content_type='text/json')

response = requests.get('http://beta.com/')

expect(response.json()).to.equal({'success': False})

详细使用可以查看API_DOC

10：统计一个API请求花费的时间，我们可以使用如下方法

session.get(url).elapsed

11：设置请求超时

session.get(url, timeout=15)

# timeout 仅对连接过程有效，与响应体的下载无关。

# timeout 并不是整个下载响应的时间限制，而是如果服务器在15 秒内没有应答，将会引发一个异常（更精确地说，是在 timeout 秒内没有从基础套接字上接收到任何字节的数据时）

关于Python ，requests的小技巧，就是这些。

分享到：

http、TCP/IP协议与socket之间的区别 | 【爬虫解析3】：JSON

2018-01-25 17:00
浏览 4486
评论(0)
分类:操作系统
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

SD规范 SDIO规范（全套规范）: 1 PartA2_SD Host_Controller_Simplified_Specification_Ver4.20 2 PartA2_SD_Host_Controller_Simplified_Specification_Ver2.00 3 PartE1_SDIO_Simplified_Specification_Ver2.00 4 PartE1_SDIO_Simplified_Specification_Ver3.00 5 Part1 PhysicalLayerSimplifiedSpecificationVer9.10Fin_20231201 6 PartE7_Wireless_LAN_Simplified_Addendum_Ver1.10 7 Part1_Extended_Security_Simplified_Addendum_Ver1.00 8 Part1_NFC_Interface_Simplified_Addendum_Ver1.00 9 Part1_UHS-II_Simplified_Addendum_Ver1.02 10 PartA1_ASSD_Extension_Simplified_Specification_Ver2.00 11 PartE2_SDIO Bluetooth_Type_A_Simplified_Specification_Ver1.00 12 SDUC-Host-Implementation-Guideline_Ver1.00

元宇宙的未来：沉浸式互联网解锁万亿社交经济: 《步入元宇宙》由马克·范·里门撰写，是一本深入探讨元宇宙概念、历史、现状以及未来潜力的书籍。作者从Web 1.0到Web 3.0的发展讲起，详细分析了从增强现实（AR）到虚拟现实（VR）再到扩展现实（XR）的技术演进。书中提出了元宇宙的六大特征：互操作性、去中心化、持久性、空间性、社区驱动和自我主权，并强调了开放元宇宙的重要性及其带来的自由和创新潜力。作者还探讨了元宇宙对个人身份、商业、教育、娱乐等领域的深远影响，并预测了元宇宙将如何推动形成一个全新的社交经济。书中引用了多位行业专家的评价，强调了无论读者对元宇宙的了解程度如何，都能从中获得新的见解和启发。

MW6S004的ads模型: 卢益峰ads仿真放大器章节所需的ads库和MW6S004的ads模型

javaSE阶段面试题: javaSE阶段面试题

《网页制作基础教程(Dreamweaver-CS6版)》第10章-网站的管理与上传.pptx: 《网页制作基础教程(Dreamweaver-CS6版)》第10章-网站的管理与上传.pptx

Abaqus双线盾构隧道超精细模型构建：涵盖软化模量与盾构注浆关键技术: 内容概要：本文详细介绍了如何使用Abaqus软件构建双线盾构隧道的超精细模型，特别是针对隧道间的联络通道、软化模量和盾构注浆等关键要素进行了深入探讨。文章首先阐述了模型的整体架构搭建，包括使用Python脚本创建隧道衬砌部件。接下来，讨论了软化模量的引入及其在材料本构模型中的定义方式，展示了如何通过塑性应变来模拟软化模量的变化。此外，文章详细讲解了盾构注浆的模拟方法，如通过单元生死技术激活注浆体单元，并提供了具体的Python代码示例。最后，文章强调了网格划分、接触设置等方面的注意事项，确保模型能够稳定运行并获得精确的结果。适合人群：从事隧道工程数值模拟的研究人员和技术人员，尤其是熟悉Abaqus软件的工程师。使用场景及目标：适用于需要进行双线盾构隧道工程力学行为研究的场合，旨在帮助工程师更好地理解和预测隧道施工过程中可能出现的问题，从而优化设计方案，提高施工效率和安全性。其他说明：文中提供的代码片段和建模技巧基于作者的实际经验和测试结果，对于初学者而言，建议逐步尝试每个步骤并在实践中不断调整参数以适应具体工程项目的需求。

《自然资源信息化时代背景与发展》.pdf: 《自然资源信息化时代背景与发展》.pdf

《网络社会学(第2版)》15-网络社会变迁.ppt: 《网络社会学(第2版)》15-网络社会变迁.ppt

西门子1214PLC与KTP700触摸屏构建双相机四轴多工位检测系统的实战案例: 内容概要：本文详细介绍了使用西门子1214PLC和KTP700Basic PN触摸屏构建双相机四轴多工位检测设备的具体实现方法。主要内容涵盖硬件配置、程序主体功能及其代码解析、触摸屏功能实现等方面。硬件方面，采用了西门子1214PLC作为核心控制器，KTP700Basic PN触摸屏为人机界面，双相机用于检测，第三设备通过Modbus RTU通讯。程序主体功能包括上下双工位4轴脉冲控制步进电机、与上位机双相机的TCP/IP通讯、与第三设备的Modbus RTU通讯。触摸屏功能则涉及多重画面、配方管理和密码保护等功能。文中还分享了一些调试经验和注意事项，如轴使能信号要用上升沿触发、相机通讯需配置心跳包机制等。适合人群：从事工业自动化领域的工程师和技术人员，特别是那些对PLC编程、触摸屏应用和多工位检测设备感兴趣的读者。使用场景及目标：适用于需要构建复杂自动化检测系统的工程项目，旨在提高检测效率和准确性，确保设备稳定可靠运行。通过学习本文，读者能够掌握如何使用西门子1214PLC和KTP700触摸屏搭建类似的检测系统。其他说明：文中提供了大量具体的代码示例和调试技巧，有助于读者更好地理解和实施相关技术。此外，还强调了实际工程中常见的问题及解决方案，如接线和接地问题、通讯参数配置等。

官方emmc规范（多个版本）: - **4.4 版本** - 介绍了基础特性和标准，适合初学者了解eMMC的基本框架。 - **4.41 版本** - 对4.4版进行了修订和完善，优化了部分规范以适应市场和技术的发展。 - **4.5 版本** - 引入了新的性能改进和技术特性，进一步提升了存储效率。 - **4.51 版本** - 包含针对4.5版的小幅修正和增强，确保技术规范的准确性和实用性。 - **5.0 版本** - 重大更新，引入更多高级功能，支持更高的数据传输速率，对现代高性能需求进行了响应。 - **5.01 版本** - 在5.0基础上的维护更新，保持标准的一致性和先进性。 - **5.1 版本** - 最新的公开版本之一，提供了更全面的标准规范，加强了数据管理能力，提升了可靠性

DeepSeek系列-提示词工程和落地场景.pdf: DeepSeek系列-提示词工程和落地场景.pdf

JDK（java）安装及配置: JDK（java）安装及配置

引力搜索算法(GSA)的MATLAB实现及其应用解析: 内容概要：本文详细介绍了引力搜索算法（Gravitational Search Algorithm, GSA）的原理、MATLAB实现及其应用场景。首先解释了GSA的基本概念，即将优化问题中的候选解视为宇宙中互相吸引的粒子，通过模拟物理现象进行优化。接着展示了核心的粒子运动方程，包括加速度计算、质量分配以及引力公式的具体实现。文中提供了多个经典的测试函数如Sphere、Rastrigin等用于验证算法性能，并通过动态绘图展示了粒子群的收敛过程。此外，讨论了算法参数设置的影响，如引力常数G的指数衰减方式，以及如何通过添加随机扰动避免粒子陷入局部最优。最后强调了GSA在解决多峰优化问题方面的优势。适合人群：对优化算法感兴趣的科研人员、学生及工程师，尤其是那些希望深入了解群体智能算法的人。使用场景及目标：适用于需要高效寻找全局最优解的问题，特别是在面对复杂的多峰函数时。目标是帮助读者理解GSA的工作机制，掌握其MATLAB实现方法，并能够根据实际情况调整参数以获得更好的优化效果。其他说明：尽管GSA在低维问题上有出色表现，但在高维优化问题中可能存在效率瓶颈，因此建议进一步研究并行计算或近似邻居搜索等改进措施。

基于Andorid的跨屏拖动应用设计.zip: 基于Andorid的跨屏拖动应用设计实现源码，主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。

DeepSeek R1 7b本地部署模型整合包及超全学习教程.rar: DeepSeek R1 7b本地部署模型整合包及超全学习教程，资源总大小420G，喜欢的自行下载。

精品推荐-最新人工智能训练师认证题库资料汇总（15份）.zip: 精品推荐，最新人工智能训练师认证资料汇总，15份。供大家学习参考。 (新版)人工智能训练师(中级)职业技能等级认定考试题库.pdf 2025年人工智能训练师(高级)职业技能鉴定参考题库(含答案).pdf 阿里认证高级人工智能训练师真题.pdf 初级人工智能训练师题库.pdf 高级人工智能化训练师认证答案解析.doc 高级人工智能训练师.docx 高级人工智能训练师题库.pdf 人工智能技术应用基础课件:人工智能训练师.pdf 人工智能训练师(服务机器人人工智能技术应用)(学生组)理论题库.pdf 人工智能训练师(服务机器人人工智能技术应用)理论题库.docx 人工智能训练师概述课件.pdf 人工智能训练师基础(上册).pdf 人工智能训练师技能等级认定四级理论知识试卷.docx 人工智能训练师试题及答案(150题).pdf 人工智能训练师职业技能标准.pdf

电力系统优化调度中基于Logistic函数的需求响应建模及其应用: 内容概要：本文探讨了Logistic函数在电力系统优化调度中的应用，特别是用于描述用户对电价变化的响应行为。文中详细介绍了Logistic函数如何通过S型曲线特性，将电价差与负荷转移率关联起来，形成死区、响应区和饱和区三个不同的响应阶段。此外，文章还展示了如何使用MATLAB进行仿真，以及在综合能源系统和微电网中的具体应用案例，如优化分时电价策略、设计需求响应激励机制等。适合人群：电力系统研究人员、微电网调度工程师、能源管理专业学生。使用场景及目标：适用于需要理解和应用需求响应模型的研究和工程项目，旨在提高电力系统的经济性和效率，优化调度策略。其他说明：文章强调了模型的实际应用挑战，如参数调校、异常处理等，并提供了具体的MATLAB代码示例，帮助读者更好地理解和应用Logistic函数模型。

测试题.docx【C语言教育】C语言考核测试题：涵盖选择题与程序设计题的综合评估系统: 内容概要：本文档是一份C语言考核测试题，分为选择题和程序设计题两大部分。选择题部分共25题，涵盖C语言的基本概念、语法细节、运算符优先级、表达式求值、数据类型转换、控制结构等方面的知识点，旨在考察学生对C语言基础知识的理解与掌握。程序设计题部分提供了多个编程题目，如求数列和、阶乘之和、货币组合方式、质数与完数的求解、日期计算等，侧重于考察学生的实际编程能力和解决问题的能力。适合人群：适合正在学习或复习C语言的学生，特别是计算机相关专业的本科生或高职高专学生。使用场景及目标：①作为课堂练习或课后作业，帮助学生巩固所学知识；②作为考试或竞赛的模拟试题，评估学生对C语言的理解程度；③为教师提供教学参考，辅助课程设计与教学计划制定。其他说明：建议考生在答题过程中仔细阅读题目要求，确保理解每个问题的具体含义。对于程序设计题，应先思考解决方案再动手编写代码，注意代码的规范性和可读性。同时，可以通过实际编译运行来验证程序的正确性。

《计算机系统维护》第1章--微型计算机简介.ppt: 《计算机系统维护》第1章--微型计算机简介.ppt

下载lvgl9.2.2模拟器在VS2022上运行: 从官网下载了lvgl9.2.2模拟器项目，用VS2022运行的流程详解

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论