论坛首页 入门技术论坛

粽子甜咸之争谁胜出

浏览 322 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2021-06-11  
又到一年端午节,作为中华民族的传统节日,传说粽子是为祭奠投江的屈原而传承下来的,所以吃粽子是端午的主要习俗之一。粽子的包法和形状也很有讲究,除了常见的三角粽、四角粽,还长粽、塔型粽和牛角粽等等。然后说到粽子的口味就像看说一场比赛一样,粽子几乎每年都会引发咸甜之争,有句话说的是——吃货不分南北,口味必分甜咸。
很多人出于自己不会包粽子、图方便、过节送人等考虑,直接在网上买粽子。那么什么哪种口味的粽子最受大家的欢迎呢?我们使用Python获取了淘宝网粽子商品销售数据,来分析这次关于甜咸粽哪个会赢。
作为爬虫工作者我们都知道,淘宝的反爬机制是非常完善的,在用爬虫程序登陆淘宝的时候发现淘宝能检测到并弹出滑块,然后无论怎么滑动都通过不了。并且淘宝的封ip也是很严的。所以我们在采集的时候需要挂上代理。接下来我们就附上完整代码:
#! -*- encoding:utf-8 -*-
    import requests
    import random
    # 要访问的目标页面
    targetUrl = "www.taobao.com"
    # 要访问的目标HTTPS页面
    # targetUrl = "www.taobao.com"
    # 代理服务器(产品官网 www.16yun.cn)
    proxyHost = "t.16yun.cn"
    proxyPort = "31111"
    # 代理验证信息
    proxyUser = "16GGZGCR"
    proxyPass = "534051"
    proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
        "host" : proxyHost,
        "port" : proxyPort,
        "user" : proxyUser,
        "pass" : proxyPass,
    }
    # 设置 http和https访问都是用HTTP代理
    proxies = {
        "http"  : proxyMeta,
        "https" : proxyMeta,
    }
    #  设置IP切换头
    tunnel = random.randint(1,10000)
    headers = {"Proxy-Tunnel": str(tunnel)}
    resp = requests.get(targetUrl, proxies=proxies, headers=headers)
    print resp.status_code
    print resp.text
一般南方人都是偏爱咸口味,北方偏爱甜的,不过我觉得相比外面的粽子还是自己家包的最香,话说你们都会包粽子吗?
论坛首页 入门技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics