`
minima
  • 浏览: 5957 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

scrapy环境搭建(一)-linux

阅读更多

系统环境:Redhat6.5系统

1、添加scrapy环境依赖

yum install -y python-devel libxml2 zlib-devel bzip2-devel xz-libs xz wget git tar gcc gcc-c++ openssl openssl-devel pcre-devel python-devel libevent automake autoconf libtool make git sqlite-devel
2、升级python

Redhat6.5 自带python2.6.6,scrapy最新版基于python2.7,需升级到python2.7.12

可到 https://www.python.org/ftp/python/2.7.12/Python-2.7.12.tgz 下载

解压并安装

wget https://www.python.org/ftp/python/2.7.12/Python-2.7.12.tgz
tar -xvf Python-2.7.12.tar
cd Python-2.7.12
./configure --prefix=/usr/local/python2.7.12
make && make install

 修改系统默认python为最新安装版本

mv /usr/bin/python /usr/bin/python2.6.6
ln -s /usr/local/python2.7.12/bin/python2.7 /usr/bin/python

 使用最新版python可能会导致系统的yum功能出现故障,需恢复yum的python指向

vim /usr/bin/yum  
将
#!/usr/bin/python
修改为
#!/usr/bin/python2.6.6

 3、安装setuptools

在 https://pypi.python.org/ 网站上搜索 setuptools 的安装包,本人下载安装的是 setuptools-26.0.0.tar.gz

解压后安装

cd setuptools-26.0.0
python setup.py install

 4、安装pip

在 https://pypi.python.org/ 网站上搜索 pip 的安装包,本人下载安装的是 pip-8.1.2.tar.gz

解压后安装

cd pip-8.1.2
python setup.py install

 5、设置python的命令直接使用

vim /etc/profile
添加python的路径
export PATH=$HOME/bin:/usr/local/python2.7.12/bin:/usr/local/bin:$PATH

修改完毕后重新加载生效
source /etc/profile

 6、安装scrapy

pip install Scrapy

 至此scrapy就可以使用了。

 

 

分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    Scrapy完整环境安装所需文件

    要搭建一个完整的Scrapy环境,首先需要确保你有一台装有Python的计算机。本文将详细介绍Scrapy的安装过程及其所需文件,帮助你顺利搭建Scrapy开发环境。 一、Python环境准备 在安装Scrapy之前,必须先安装Python。...

    Window环境下Scrapy开发环境搭建

    快速搭建scrapy开发环境 python pippip 百度网盘 注:不同的电脑上所带有环境不同,安装方式有些许差别 1、成功安装python并添加环境变量 2、安装pip 3、安装scrapy 解压成功后进入pip目录下命令安装pip ...

    scrapy爬虫项目爬取腾讯,斗鱼

    主要知识点:Windows及Linux环境下Scrapy的安装。 2、Scrapy Shell以及Scrapy Selectors的使用。 3、使用Scrapy完成网站信息的爬取。 主要知识点:创建Scrapy项目(scrapy startproject)、定义提取的结构化数据(Item)...

    最新Scrapy爬虫框架

    1搭建开发环境: 主要知识点:Windows及Linux环境下Scrapy的安装。 2、Scrapy Shell以及Scrapy Selectors的使用。 3、使用Scrapy完成网站信息的爬取。 主要知识点:创建Scrapy项目(scrapy startproject)、定义提取...

    Scrapy安装所需要的软件.rar

    总结来说,安装和使用Scrapy涉及Python环境的搭建、pip的安装、Scrapy的安装、可能的辅助工具(如Selenium、Git)以及对Scrapy核心概念的理解和应用。同时,良好的开发文档能提升项目的专业性和可读性,对于毕业设计...

    Python网络爬虫Scrapy框架应用详解

    此外还讨论了Python在多种操作系统环境中(Windows/Linux)的配置注意事项,比如数据库驱动的兼容性问题等。 适合人群:有一定编程经验,特别是在Python方面有所基础的学习者及开发者。 使用场景及目标:①适用于...

    linux环境下的网络爬虫

    在Linux环境下进行网络爬虫开发是一...通过以上知识的学习和实践,你可以在Linux环境中搭建起一个功能完善的网络爬虫系统。但要注意,爬虫技术的应用应遵循合法、道德的原则,尊重数据源,避免对目标网站造成过大负担。

    Python爬取疫情实战:Flask搭建webEcharts可视化大屏MySQL数据库Linux项目部署与任务定时调度.zip

    项目部署在Linux环境下,可以使用Apache或Nginx作为Web服务器,Gunicorn或uWSGI作为应用服务器,配合Gevent提升性能。同时,使用supervisord管理进程,确保服务的稳定运行。了解Linux基础命令、文件系统管理、用户...

    Python之Scrapy爬虫框架安装及简单使用详解

    这样就完成了基本的Scrapy爬虫框架搭建。 通过上述步骤,我们不仅了解了Scrapy的基本概念和应用场景,还掌握了如何在不同操作系统下安装配置Scrapy,以及如何通过简单的示例代码来创建自己的第一个Scrapy项目。这...

    Python爬虫入门到精通

    - 安装Anaconda:适用于Windows、Mac OS、Linux等多种操作系统,提供了一个包含Python、R语言及其包管理器的免费开源发行版。 - 创建虚拟环境:使用`conda create --name myenv python=3.6`命令创建名为`myenv`的...

    python最全的基础学习资料

    综上所述,这个压缩包中的资料为Python初学者提供了一个全面的学习路径,从Linux环境的搭建,到Python语言的核心概念,再到与Web开发相关的HTML和CSS,最后是实用的网络爬虫技术。通过系统学习,你将能够掌握Python...

    python爬虫教程从入门到精通

    - **章节目标**:教会学员如何搭建Python爬虫所需的开发环境。 - **主要内容**: - 安装Python解释器(包括Windows、Mac OS和Linux三种操作系统)。 - 配置Python环境变量。 - 安装并配置常用的Python集成开发...

    在线小说APP支持采集运营版网站系统源码带支付接口+搭建教程.txt

    综上所述,《在线小说APP支持采集运营版网站系统源码带支付接口+搭建教程》提供了一整套关于如何构建一个功能完善的小说阅读平台所需的关键技术和实施步骤。无论是对于想要快速上线产品的创业者还是希望深入了解相关...

    秋招马上开始了,不知道怎么写简历的小伙伴快来这吧,这里有一个简洁而不简单的简历模板简历面试这里是一个狠标准的校招面试简历

    - 掌握网络爬虫技术,熟练运用Xpath、正则表达式,了解Selenium和Scrapy框架。 **荣誉与证书** - 美国数据建模竞赛二等奖 - 全国数学建模竞赛三等奖 - 江苏省智慧交通运输创新实践大赛三等奖 - 英语六级(CET-6,...

    Python网络爬虫技术 第1章 Python爬虫环境与爬虫简介 教案.docx

    - **环境搭建**: - 在Windows/Linux系统上安装MySQL和MongoDB。 - 使用Python的`pip`工具安装必要的爬虫库,如`urllib3`、`Requests`、`lxml`和`BeautifulSoup4`等。 - **实践案例**: - 实现一个简单的爬虫程序...

    项目报告.docx

    本项目的设计与实现过程涉及了多个关键技术点,包括硬件环境搭建、软件环境配置、Scrapy爬虫框架的应用、XPath解析技术以及MySQL数据库的使用等。通过这些技术和知识点的学习与实践,学生能够更好地理解和掌握大数据...

    Python 基础课程《2.python的世界》

    #### 四、第一个Python程序及环境搭建 **4.1 Python解释器的安装** - **官网**: [Python官方下载页面](https://www.python.org/) - **步骤**: - 下载安装包。 - 按照向导安装Python解释器。 **4.2 创建并运行...

    python爬虫开发工程师应届生个人简历模板(Word可以直接使用).docx

    例如,天津坤禾生物的项目中,开发者负责网页抓取和数据提取,还涉及分布式爬虫环境的搭建,这展示了其在实际工作中的应用能力。 项目经验部分,包括抓取新浪微博数据、爬取斗鱼全部房间内容等,显示了开发者在具体...

    cd_lianjia_spider - centOS.zip

    本项目"cd_lianjia_spider - centOS.zip"提供了一个基于CentOS操作系统环境下的简单爬虫框架,旨在帮助开发者快速搭建针对链家网数据的抓取系统。下面,我们将深入探讨这个框架的核心知识点以及如何在CentOS中进行...

Global site tag (gtag.js) - Google Analytics