本月博客排行
年度博客排行
-
第1名
宏天软件 -
第2名
龙儿筝 -
第3名
青否云后端云 - wallimn
- gashero
- vipbooks
- wy_19921005
- benladeng5225
- fantaxy025025
- zysnba
- ssydxa219
- e_e
- javashop
- sam123456gz
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- xiangjie88
- wiseboyloves
- ganxueyun
- lemonhandsome
- xyuma
- sichunli_030
- wangchen.ily
- jh108020
- zxq_2017
- jbosscn
- Xeden
- zhanjia
- forestqqqq
- luxurioust
- lzyfn123
- johnsmith9th
- ajinn
- nychen2000
- wjianwei666
- daizj
- hanbaohong
- 喧嚣求静
- ranbuijj
- silverend
- kingwell.leng
- lchb139128
- kristy_yy
- lich0079
- jveqi
- java-007
- sunj
- yeluowuhen
最新文章列表
关于爬虫采集中使用HTTP代理ip的认知误区
大部分人都知道,在使用爬虫多次爬取同一网站时,经常会被网站的IP反爬虫机制给禁掉,为了解决封禁 IP 的问题通常会使用代理IP。但也有一部分人在HTTP代理IP的使用上存在着误解,他们认为使用了代理IP就能解决一切问题,然而实际上代理IP不是万能的,它只是一个工具,如果使用不当,一样会被封IP。
首先我们要知道,代理IP分三种类型:透明代理、普通匿名代理、高匿名代理。
使用透明代理和普通匿名 ...
496 Next Greater Element I
You are given two arrays (without duplicates) nums1 and nums2 where nums1’s elements are subset of nums2. Find all the next greater numbers for nums1's elements in the corresponding places of nums2.
T ...
python之__new__与__init__方法的区别
先上例子:
class User:
def __new__(cls, *args, **kwargs):
print("new")
def __init__(self,name):
self.name=name
print("init")
user=User()
打印 ...
Python之生成器
generator:生成器
generator中保存的是算法,在调用时才计算。
1、列表生成式转 generator
L = [x*x for x in range(10)] ###列表
g = (x*x for x in range(10)) ###generator
通过next(g)一个一个打印元素:>>>next(g)
...
python实现字符串反转的多种方法
1、利用索引
s = 'hello'
print(s[::-1])
结果:'olleh'
b = a[i:j:s]说明:
i为起始索引(缺省为0),
j为结束索引(不包括,缺省为len(a)),
s为步进(缺省为1).
所以a[i:j:1]相当于a[i:j].
当s<0时:
i缺省时,默认为-1,
j缺省时,默认为-len(a)-1,
所以a[::-1]相当于 a[-1:-len ...
Python爬虫常用小技巧之设置代理IP
设置代理IP的原因
我们在使用Python爬虫爬取一个网站时,通常会频繁访问该网站。假如一个网站它会检测某一段时间某个IP的访问次数,如果访问次数过多,它会禁止你的访问。所以你可以设置一些代理服务器来帮助你做工作,每隔一段时间换一个代理,这样便不会出现因为频繁访问而导致禁止访问的现象。
我们在学习Python爬虫的时候,也经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败。高强度、高效率地爬取网页 ...
python9 测试代码
####测试代码###
#模块unittest (python标准库中) 单元测试
#测试函数
import unittest
from name_function import user_name
"""导入模块unittext和待测函数"""
class nameTestCase(unittest.TestCase): #这个类必须继 ...