如何用 Python 爬取网页制作电子书

tedeum

浏览: 661553 次
性别:
来自: 昆明

最近访客更多访客>>

kellen

cyf-123456

hocker

csharpgongzi

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

技术笔记

Python 爬虫 Sigil

最近，AI 的兴起让 Python 火了一把。实际上 Python 拥有庞大的第三方支持，生态系统非常完整，可以适用各种场景和行业。这次，我们准备通过 Python 学习爬虫的开发，既简单有趣，而且是数据采集重要一环。同时脱离应用谈技术就是耍流氓，通过制作电子书学习数据的收集与整理，即能学到东西又有实用价值。

我们将通过爬取网页信息这个很小的应用场景来体会数据预处理的思想，并从中学习了解数据处理中抓取、处理、分组、存储等过程的实现。我这次分享主要分为以下几个部分：

Python 语法的讲解，通过分享掌握简单的 Python 开发语法和思路，侧重于后面爬虫开发的需要用的内容
Scrapy 爬虫开发，通过分享了解基本的 Scrapy 开发，并实现从网络爬取数据
使用 Sigil 制作 epub 电子书

最后，我希望通过分享能够入门，并喜欢上 Python 开发，并且掌握 Scrapy 爬虫开发的思路和方法。

分享地址请猛戳这里

原文地址

0
顶

0
踩

分享到：

Windows 下安装 Python2 | Hexo 支持目录

2017-12-28 16:15
浏览 1042
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

如何用 Python 爬取网页制作电子书

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

如何用 Python 爬取网页制作电子书

评论

发表评论

相关推荐

终于把B站滑动验证（getest）搞定了，网上例子早已失效

使用Python实现了B站的滑动验证和自动登录

你听说过吗：使用网页技术开发桌面串口助手工具

编程直播室第二期：CadLib 授权机制研究与实现

编程星球——水·滴创刊号 20180514

能不能三、五小时入门Python编程

编程星球主题设定

直播编码

使用Python爬取网站数据分析

源码发布：一个Angular写得Markdown编辑器

非官方GitChat客户端及代码发布

代码发布：用 Kotlin 开发 SpringBoot 之 Data JPA

用 Kotlin 开发 SpringBoot 之 Data JPA

TypeScript中的可选属性和只读属性

TypeScript使用HashMap

TypeScript 看见未来的 JavaScript

原色2017

读书笔记：《算法图解》第三章 递归

读书笔记：《算法图解》第二章 选择排序

读书笔记：《算法图解》第一章 算法简介

最近访客更多访客>>

读书笔记：《算法图解》第三章递归

读书笔记：《算法图解》第二章选择排序

读书笔记：《算法图解》第一章算法简介