raphael10241024

浏览: 13965 次
性别:
来自: 北京

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (4)

社区版块

存档分类

2016-03 ( 4)
更多存档...

Python实现的淘宝直通车数据抓取（4）

python pyinstaller

最后是将程序进行发布，安装pyinstaller，直接CMD到python文件的位置，运行命令 pyinstaller start.py 即可，然后将firefox浏览器放到相应的文件夹里。看下最后的运行效果： Python实现的淘宝直通车数据抓取（1） Python实现的淘宝直通车数据抓取（2） Python实现的淘宝直通车数据抓取（3） Python实现的淘宝直通车数据抓取（4）

2016-03-24 21:09
浏览 1693
评论(0)
分类:编程语言

商家那里给出的是一个有几千行的excel表，这里使用openpyxl来读取excel。 class read_write: def __init__(self,token,cookiestr): self.subway=subwayquery(token,cookiestr) self.threadpool=threadpool.ThreadPool(32) self.centeralignment=openpyxl.styles.Alignment(horizontal='center') self.perc ...

2016-03-24 21:06
浏览 1889
评论(0)
分类:编程语言

Python实现的淘宝直通车数据抓取（2）

python json ajax 爬虫

再看我们要抓取的数据，网页是这样的：这里是我们要抓取的数据：打开chrome的调试工具发现数据是通过一个Ajax请求来获取的: 这样的话，获取数据就太简单了，因为完全不需要去解析html页面，只需要将返回的json串解析即可得到数据 class subwayquery: url='http://subway.simba.taobao.com/report/getNetworkPerspective.htm' def __init__(self,token,cookiestr): self.data= { ...

2016-03-22 11:10
浏览 6071
评论(0)
分类:编程语言

Python实现的淘宝直通车数据抓取（1）

python 爬虫淘宝 selenium

最近帮一个朋友做一个抓取淘宝直通车数据的小项目，感觉ython比较适合写爬虫程序，决定使用Python来做程序。首先是登陆程序，因为淘宝的登陆校验很复杂，所以不能直接使用命令行的形式输入账号密码。查阅资料后，发现可以使用Selenium的自动测试框架，决定用这个框架实现登陆。首先下载一个纯净版的firefox浏览器，放到主目录下，然后用python打开浏览器： def openbrowser_login(): binary=FirefoxBinary(os.getcwd()+'/Firefox/Firefox.exe') profile=Firef ...

2016-03-22 10:11
浏览 4312
评论(0)
分类:编程语言

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Python实现的淘宝直通车数据抓取（4）

Python实现的淘宝直通车数据抓取（3）

Python实现的淘宝直通车数据抓取（2）

Python实现的淘宝直通车数据抓取（1）

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Python实现的淘宝直通车数据抓取（4）

Python实现的淘宝直通车数据抓取（3）

Python实现的淘宝直通车数据抓取（2）

Python实现的淘宝直通车数据抓取（1）

最近访客更多访客>>