`
ryan.liu
  • 浏览: 136373 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Python在URL中加入新参数

阅读更多
import urllib
import urlparse

def url_add_params(url, **params):
    """ 在网址中加入新参数 """
    pr = urlparse.urlparse(url)
    query = dict(urlparse.parse_qsl(pr.query))
    query.update(params)
    prlist = list(pr)
    prlist[4] = urllib.urlencode(query)
    return urlparse.ParseResult(*prlist).geturl()



if __name__ == "__main__":
    url = 'http://bbs.163.com/viewthread.php?tid=1660&rpid=5798&ordertype=0&page=1#pid5798'
    print url_add_params(url, token=123, site="bbs") 
分享到:
评论

相关推荐

    Python-furl一个让处理URL更简单小型Python库

    Python-furl是一个小型但功能强大的Python库,专为简化URL处理而设计。它提供了一种优雅的方式来解析、操作和重构...无论你是Python新手还是经验丰富的开发者,furl都值得加入你的工具箱,提升你在URL操作方面的效率。

    什么是磁力链接?如何用Python获取磁力种子?

    其中,`xt`参数中的`urn:btih:`后面跟随的是文件的BitTorrent Info Hash,它是文件内容的SHA1哈希,用于唯一标识文件。 Python在获取磁力种子方面能起到重要作用。通过Python编程,我们可以实现从DHT网络中获取磁力...

    解决python3 requests headers参数不能有中文的问题

    当开发者试图在Python的requests库的headers参数中包含中文字符时,会出现编码问题。这个问题的解决方法是将含有中文的参数值使用URL编码。在Python中,可以使用urllib库中的parse模块来进行URL编码和解码。 具体来...

    基于Python的网络爬虫技术研究

    - 宽度优先遍历策略:按照访问的顺序,将新页面中找到的链接立即加入待爬取队列。 - 最佳优先搜索策略:对目标网页的重要性进行评估,优先爬取评价高的页面。 ### 2.3 反爬虫策略采取概述 为了避免被网站封禁或...

    干货:Jenkins Pipeline调用shell、python、java、groovy脚本的正确使用姿势.doc

    需要注意的是,在 Jenkins 中,需要把 `File` 和 `readLines` 加入到 Script Approval 中(首次运行,会提示是否加入),加入后在 Dashboard > Script Approval 页面可以看到相关结果。 调用 Java 或者 Python 脚本...

    python+requests接口压力测试500次,查看响应时间的实例

    在本文中,我们将深入探讨如何使用Python的requests库进行接口压力测试,并着重关注如何测量响应时间。这个实例展示了如何在Python中实现一个简单的压力测试工具,以检查接口在连续500次请求下的性能。 首先,我们...

    Python3.6基于64位电脑专用 - 副本.rar

    同时,`OrderedDict`类(有序字典)在Python3.6中成为了内置类型,意味着字典在保持插入顺序的同时,性能也得到了提升。 在安全性和稳定性方面,Python3.6修复了许多已知的安全漏洞,提升了整体的可靠性。同时,它...

    python發送request給pchome讓商品自動加入購物車1

    标题中的“python發送request給pchome讓商品自動加入購物車1”表示我们要探讨的是如何使用Python编程语言向PChome(一个台湾知名的电子商务网站)发送HTTP请求,以实现自动将商品添加到购物车的功能。这通常涉及到...

    多线程爬取1000个网页_python爬虫_thread_

    在上述代码中,我们为每个URL创建了一个新的线程,并将其加入到`threads`列表中。`start()`方法启动线程并执行`crawl_url`函数,传入对应的URL参数。 然而,Python的多线程在处理I/O密集型任务(如网络爬虫)时,...

    基于Python的Post请求数据爬取的方法详解

    该网站的post请求参数有两种类型:(1)参数体放在了query中,即url拼接参数(2)body中要加入一个空的json对象,关于为什么要加入空的json对象,猜测原因为反爬虫。既有query参数又有空对象体的body参数是一件脑洞...

    Python_小程序_二维码设计_python二维码生成小程序

    如果你想要在二维码生成中加入更多的设计元素,例如自定义logo或改变颜色,可以使用`qrcode`库的扩展模块`qrcode.image.pil`,它允许你使用Python Imaging Library(PIL)对二维码图像进行更复杂的操作。 另外,...

    Python 蓝图

    #细心的伙伴还可以发现,在views.py中在使用默认endpoint的前提下,我们是没有办法使用同一个视图方法名的(当然我们也不建议在同一个文件中有两个视图方法名相同, #尽管指向他们的request.url不同),但是使用了蓝图...

    Python实现的爬虫程序

    在这个"Python实现的爬虫程序"中,我们关注的是如何利用Python来抓取百度搜索的图片功能。 首先,我们需要了解Python中的几个关键库,它们是实现爬虫的基础。`requests`库用于发送HTTP请求,获取网页内容;`...

    operadriver for python

    如果已经将驱动加入PATH,可以省略`executable_path`参数。 4. 使用WebDriver进行网页操作,例如打开一个URL: ```python driver.get('http://www.example.com') ``` 5. 执行其他测试步骤,如查找元素、点击...

    Python-基于TcpClient现实的http请求库

    GET请求常用于获取资源,参数附在URL后面;POST请求用于向服务器提交数据,通常用于表单提交或更新资源,数据包含在请求体中。 4. **Cookie管理**: Cookie是服务器端存储在客户端的小型文本文件,用于跟踪用户...

    python+Django+layui 实现web 列表增删改查

    在本项目中,我们利用Python的Web框架Django和前端组件库layui来构建一个功能完备的Web应用,实现了数据的列表展示、增加、删除和修改等CRUD(Create, Read, Update, Delete)操作。以下是关于这个实例的详细知识点...

    python抓取免费代理IP

    在IT行业中,网络爬虫和自动化任务经常需要借助代理IP来规避访问限制,提高数据抓取效率。本项目提供了一套完整的解决方案,利用Python来抓取免费代理IP,并将其存储到MySQL数据库中,同时实现定期检查和排除失效的...

    python 自动批量打开网页的示例

    2. **File Handling**:Python中的文件处理主要包括打开文件、读写文件以及关闭文件。本示例中使用了`codecs`模块打开文本文件,但实际上也可以直接使用Python内置的`open()`函数。 3. **Time模块**:`time`模块...

    python 爬虫 爬虫 遍历整个 网站RUL.rar

    6. **URL分发与遍历**:将新发现的URL加入URL队列,继续爬取,直到队列为空或达到预设条件(如最大深度、时间限制等)。 在Python中,常用的爬虫框架有Scrapy,而基础库如requests用于发送HTTP请求,BeautifulSoup...

Global site tag (gtag.js) - Google Analytics