系统环境:Redhat6.5系统
1、添加scrapy环境依赖
yum install -y python-devel libxml2 zlib-devel bzip2-devel xz-libs xz wget git tar gcc gcc-c++ openssl openssl-devel pcre-devel python-devel libevent automake autoconf libtool make git sqlite-devel
2、升级python
Redhat6.5 自带python2.6.6,scrapy最新版基于python2.7,需升级到python2.7.12
可到 https://www.python.org/ftp/python/2.7.12/Python-2.7.12.tgz 下载
解压并安装
wget https://www.python.org/ftp/python/2.7.12/Python-2.7.12.tgz tar -xvf Python-2.7.12.tar cd Python-2.7.12 ./configure --prefix=/usr/local/python2.7.12 make && make install
修改系统默认python为最新安装版本
mv /usr/bin/python /usr/bin/python2.6.6 ln -s /usr/local/python2.7.12/bin/python2.7 /usr/bin/python
使用最新版python可能会导致系统的yum功能出现故障,需恢复yum的python指向
vim /usr/bin/yum 将 #!/usr/bin/python 修改为 #!/usr/bin/python2.6.6
3、安装setuptools
在 https://pypi.python.org/ 网站上搜索 setuptools 的安装包,本人下载安装的是 setuptools-26.0.0.tar.gz
解压后安装
cd setuptools-26.0.0 python setup.py install
4、安装pip
在 https://pypi.python.org/ 网站上搜索 pip 的安装包,本人下载安装的是 pip-8.1.2.tar.gz
解压后安装
cd pip-8.1.2 python setup.py install
5、设置python的命令直接使用
vim /etc/profile 添加python的路径 export PATH=$HOME/bin:/usr/local/python2.7.12/bin:/usr/local/bin:$PATH 修改完毕后重新加载生效 source /etc/profile
6、安装scrapy
pip install Scrapy
至此scrapy就可以使用了。
相关推荐
要搭建一个完整的Scrapy环境,首先需要确保你有一台装有Python的计算机。本文将详细介绍Scrapy的安装过程及其所需文件,帮助你顺利搭建Scrapy开发环境。 一、Python环境准备 在安装Scrapy之前,必须先安装Python。...
快速搭建scrapy开发环境 python pippip 百度网盘 注:不同的电脑上所带有环境不同,安装方式有些许差别 1、成功安装python并添加环境变量 2、安装pip 3、安装scrapy 解压成功后进入pip目录下命令安装pip ...
主要知识点:Windows及Linux环境下Scrapy的安装。 2、Scrapy Shell以及Scrapy Selectors的使用。 3、使用Scrapy完成网站信息的爬取。 主要知识点:创建Scrapy项目(scrapy startproject)、定义提取的结构化数据(Item)...
1搭建开发环境: 主要知识点:Windows及Linux环境下Scrapy的安装。 2、Scrapy Shell以及Scrapy Selectors的使用。 3、使用Scrapy完成网站信息的爬取。 主要知识点:创建Scrapy项目(scrapy startproject)、定义提取...
总结来说,安装和使用Scrapy涉及Python环境的搭建、pip的安装、Scrapy的安装、可能的辅助工具(如Selenium、Git)以及对Scrapy核心概念的理解和应用。同时,良好的开发文档能提升项目的专业性和可读性,对于毕业设计...
此外还讨论了Python在多种操作系统环境中(Windows/Linux)的配置注意事项,比如数据库驱动的兼容性问题等。 适合人群:有一定编程经验,特别是在Python方面有所基础的学习者及开发者。 使用场景及目标:①适用于...
在Linux环境下进行网络爬虫开发是一...通过以上知识的学习和实践,你可以在Linux环境中搭建起一个功能完善的网络爬虫系统。但要注意,爬虫技术的应用应遵循合法、道德的原则,尊重数据源,避免对目标网站造成过大负担。
项目部署在Linux环境下,可以使用Apache或Nginx作为Web服务器,Gunicorn或uWSGI作为应用服务器,配合Gevent提升性能。同时,使用supervisord管理进程,确保服务的稳定运行。了解Linux基础命令、文件系统管理、用户...
这样就完成了基本的Scrapy爬虫框架搭建。 通过上述步骤,我们不仅了解了Scrapy的基本概念和应用场景,还掌握了如何在不同操作系统下安装配置Scrapy,以及如何通过简单的示例代码来创建自己的第一个Scrapy项目。这...
- 安装Anaconda:适用于Windows、Mac OS、Linux等多种操作系统,提供了一个包含Python、R语言及其包管理器的免费开源发行版。 - 创建虚拟环境:使用`conda create --name myenv python=3.6`命令创建名为`myenv`的...
综上所述,这个压缩包中的资料为Python初学者提供了一个全面的学习路径,从Linux环境的搭建,到Python语言的核心概念,再到与Web开发相关的HTML和CSS,最后是实用的网络爬虫技术。通过系统学习,你将能够掌握Python...
- **章节目标**:教会学员如何搭建Python爬虫所需的开发环境。 - **主要内容**: - 安装Python解释器(包括Windows、Mac OS和Linux三种操作系统)。 - 配置Python环境变量。 - 安装并配置常用的Python集成开发...
综上所述,《在线小说APP支持采集运营版网站系统源码带支付接口+搭建教程》提供了一整套关于如何构建一个功能完善的小说阅读平台所需的关键技术和实施步骤。无论是对于想要快速上线产品的创业者还是希望深入了解相关...
- 掌握网络爬虫技术,熟练运用Xpath、正则表达式,了解Selenium和Scrapy框架。 **荣誉与证书** - 美国数据建模竞赛二等奖 - 全国数学建模竞赛三等奖 - 江苏省智慧交通运输创新实践大赛三等奖 - 英语六级(CET-6,...
- **环境搭建**: - 在Windows/Linux系统上安装MySQL和MongoDB。 - 使用Python的`pip`工具安装必要的爬虫库,如`urllib3`、`Requests`、`lxml`和`BeautifulSoup4`等。 - **实践案例**: - 实现一个简单的爬虫程序...
本项目的设计与实现过程涉及了多个关键技术点,包括硬件环境搭建、软件环境配置、Scrapy爬虫框架的应用、XPath解析技术以及MySQL数据库的使用等。通过这些技术和知识点的学习与实践,学生能够更好地理解和掌握大数据...
#### 四、第一个Python程序及环境搭建 **4.1 Python解释器的安装** - **官网**: [Python官方下载页面](https://www.python.org/) - **步骤**: - 下载安装包。 - 按照向导安装Python解释器。 **4.2 创建并运行...
例如,天津坤禾生物的项目中,开发者负责网页抓取和数据提取,还涉及分布式爬虫环境的搭建,这展示了其在实际工作中的应用能力。 项目经验部分,包括抓取新浪微博数据、爬取斗鱼全部房间内容等,显示了开发者在具体...
本项目"cd_lianjia_spider - centOS.zip"提供了一个基于CentOS操作系统环境下的简单爬虫框架,旨在帮助开发者快速搭建针对链家网数据的抓取系统。下面,我们将深入探讨这个框架的核心知识点以及如何在CentOS中进行...