本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
zysnba - xiangjie88
- sgqt
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wallimn
- wy_19921005
- vipbooks
- benladeng5225
- 龙儿筝
- javashop
- ranbuijj
- fantaxy025025
- zw7534313
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- jh108020
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- lemonhandsome
- jbosscn
- zxq_2017
- mengjichen
- luxurioust
- lzyfn123
- forestqqqq
- nychen2000
- wjianwei666
- Xeden
- zhanjia
- ajinn
- hanbaohong
- 喧嚣求静
- jickcai
- kingwell.leng
- mwhgJava
- silverend
- lich0079
- lchb139128
最新文章列表
是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢
RT
目前抓了淘宝的200多万家
的店铺地址(URL)了,不知道算不算流氓爬虫。估计爬了他们
95%的店铺地址
,仅供参考。
发现一个搞笑的店铺,整个店铺里都是卖避孕套之类的,分类到了数码相机类里面去了,哈哈
目前不知道taobao会不会把一个店铺分到多个类中,如何会分到多个类中的话,我这数值还要缩减,自己要来排重一下。