打算用scrapy这个东西抓点磁力链接回来。结果安装途中路漫漫,踩了很多坑,网上有各种各样的安装教程,也按照他们的试了,结果就是不同的时间、不同的环境遇到了不同的问题,不能保证一步一步操作就能安装成功,所以在此大致记录个思路,绝对能成功的。
之前安装成功过一次,不过云主机过期以后就没有了。当时的安装思路是从官网上下了scrapy的安装包,缺哪个依赖就去python的官网上找,中间还有需要设置环境变量等等的坑。最后终于安装成功了,从新机到安装完毕,装了28个依赖包,压根儿不靠谱。
这次来到新公司,有个很牛逼的技术大牛,按照他的思路很容易就安装成功了,记录一下:
1. 申请一个全新的VPS,我用的阿里云;
2. 使用CentOS 7.0版本,不是说6.5不好,妈的带的Python版本是2.6.6,非主流,会出很多坑;
3. 从https://pip.pypa.io/en/stable/installing/ 上下载geg-pip.py的安装脚本,不要用yum或者pip的安装包,每一个版本的pip对应的python版本都不一样,这个脚本会帮助自动匹配,所以不要自己乱下。然后安装pip;
4. 执行pip install scrapy,中间会报一些依赖包下载超时的错误。没关系,多试几次,已经下载下来的依赖包不会重复下载;
5. 都下来以后,会报一些安装错误,多是缺一些比较基础的依赖包比如:openSSL、libffi、libxml2、libxslt等,只要使用yum安装这些依赖包以及他们的devel开发包即可。然后不要忘记使用yum安装python-devel;
6. 然后重复地执行pip install scrapy就好了,直到安装成功。
以上是使用了多种安装方法报错最少,最简便的安装方式。
转载于:https://my.oschina.net/u/1780368/blog/716395
分享到:
相关推荐
scrapy爬虫 link_spider 图片爬虫 rere_word 生僻字爬虫scrapy爬虫 link_spider 图片爬虫 rere_word 生僻字爬虫scrapy爬虫 link_spider 图片爬虫 rere_word 生僻字爬虫scrapy爬虫 link_spider 图片爬虫 rere_word ...
然而,对于大型项目或团队协作,管理多个Scrapy爬虫可能会变得复杂。这就是可视化的Scrapy爬虫管理平台发挥作用的地方。这个项目旨在提供一个用户友好的界面,帮助开发者更有效地组织、监控和运行他们的Scrapy爬虫。...
编写第一个Scrapy爬虫 Scrapy爬虫规则与选择器 Scrapy中间件定制 Scrapy管道处理数据 Scrapy设置与优化 Scrapy日志与调试技巧 Scrapy分布式爬虫实现 Scrapy与大数据处理 Scrapy爬虫反反爬策略 Scrapy爬虫实战:新闻...
Scrapy爬虫框架 笔趣阁小说抓取 知识点:Scrapy爬虫框架使用 Scrapy爬虫框架使用 scrapy爬虫开发的基本步骤 新建项目 (scrapy startproject xxx):新建一个新的爬虫项目 明确目标 (编写items.py):明确你想要抓取...
Scratch,是抓取的意思,这个Python的爬虫框架叫Scrapy,大概也是这个意思吧,就叫它:小刮刮吧。 小刮刮是一个为遍历爬行网站、分解获取数据而设计的应用程序框架,它可以应用在广泛领域:数据挖掘、信息处理和或者...
该案例相对完整,欢饮下载交流。有疑问,可以留言,一起交流探讨并发掘爬虫世界的美!该案例结构清晰,注释明了,可以使大家很好地理解scrapy爬虫框架。
在这个“拉钩scrapy爬虫案例”中,我们将探讨如何利用Scrapy来爬取拉钩网(一个知名的招聘网站)上的职位信息,并将这些数据保存到CSV文件中,进一步上传到MySQL数据库。 首先,我们需要了解Scrapy的基本架构。...
通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首 通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首 通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首 通过 scrapy 爬虫架构爬取中国古诗网的 唐诗三百首
### Scrapy爬虫完整实例详解 #### 一、Scrapy框架简介 Scrapy是一个用于Python的快速高级网页抓取和网络爬虫框架,用于抓取网站并从页面中提取结构化的数据。它可以用于各种用途,包括收集特定类型的网页内容、为...
这个名为"scrapy爬虫实例代码"的压缩包包含了使用Scrapy进行爬虫编程的一些示例,可以帮助初学者更好地理解和掌握Scrapy的用法。 在开始学习之前,我们先了解一下Scrapy的基本构成。Scrapy基于Twisted异步网络库,...
【课程简介】 本课程适合所有需要弥补python网络爬虫的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 【全套课程列表】 01-Requests库入门(共59页...12-实例4-股票数据定向Scrapy爬虫(共23页).pptx
基于Python的网易新闻Scrapy爬虫:数据分析与可视化大屏展示-毕业源码案例设计.rar基于Python的网易新闻Scrapy爬虫:数据分析与可视化大屏展示-毕业源码案例设计.rar基于Python的网易新闻Scrapy爬虫:数据分析与可视...
在详细介绍Scrapy爬虫框架之前,我们先回顾一下爬虫的基本原理。爬虫的本质是通过定位网页中的元素来获取页面数据。其一般工作流程包括分析需求确定目标网站,分析目标网站的URL组成规则,将目标页面的URL组织成列表...
scrapy爬虫之热门网站数据爬取 1、很详细地完成了对scrapy的使用 2、其中有对正则表达式的详细使用 3、有对xpath和css选择器的使用 4、有对scrapy中的item、pipeline等类的修改和使用.zip
在这个“京东/天猫scrapy爬虫实例”中,我们将探讨如何利用Scrapy来抓取京东和天猫等电商平台的数据,并将其存储到MongoDB数据库中。 首先,我们来看`settings.py`文件。这个文件是Scrapy项目的配置中心,包含了...
Scrapy是一个强大的Python爬虫框架,它为开发者提供了一套高效、灵活的工具,用于数据抓取、处理、存储等任务。在这个主题中,我们将详细探讨如何在Python 2.7环境下安装Scrapy。 首先,确保你的系统已安装Python ...
主要讲解了利用Python语言使用scrapy爬虫框架的一些案例
在 Windows 7 64 位操作系统上安装 Python 2.7.10 和 Scrapy 爬虫框架,需要遵循以下步骤: 首先,确保你的计算机满足基本的硬件和软件需求。Windows 7 64 位系统应该可以支持 Python 2.7 和 Scrapy。下载适合你的...
scrapy爬虫项目代码.zip scrapy爬虫项目代码.zipscrapy爬虫项目代码.zipscrapy爬虫项目代码.zipscrapy爬虫项目代码.zipscrapy爬虫项目代码.zipscrapy爬虫项目代码.zipscrapy爬虫项目代码.zipscrapy爬虫项目代码....
scrapy爬虫爬取oschina开源中国博客文章保存到本地数据库。 这个是本人最近学习爬虫的一个实践案例,源码解析详情请移步博文:https://blog.csdn.net/xiaocy66/article/details/83834261