- 浏览: 2662 次
- 性别:
- 来自: 哈尔滨
最新评论
-
lovesunweina:
没人顶起啊,小伙
Java爬虫框架——SeimiCrawler
文章列表
分享课程——基于Kettle+Clickhouse+Superset构建亿级大数据实时数据分析平台,2021年11月最新课程,提供课件和代码下载。
课程将联合这三大开源工具,实现一个强大的实时分析平台。该系统以热门的互联网电商实际业务应用场景为案例讲解,对电商数据的常见实战指标处理使用kettle等工具进行了详尽讲解,具体指标包括:流量分析、新增用户分析、活跃用户分析订单分析、团购分析。能承载海量数据的实时分析,数据分析涵盖全端(PC、移动、小程序)应用。
SeimiCrawler
An agile,powerful,standalone,distributed crawler framework.
SeimiCrawler的目标是成为Java世界最好用最实用的爬虫框架。
简介
SeimiCrawler是一个敏捷的,支持分布式的爬虫开发框架,希望能在最大程度上降低新手开发一个可用性高且性能不差的爬虫系统的门槛,以及提升开发爬虫系统的开发效率。在SeimiCrawler的世界里,绝大多数人只需关心去写抓取的业务逻辑就够了,其余的Seimi帮你搞定。设计思想上SeimiCrawler受Python的爬虫框架Scrapy启发很大,同时融合了 ...