- 浏览: 45938 次
最新评论
文章列表
从今天起,小编开始教大家逐步进行可视化配置操作。首先,我们来学习第一步:创建新任务,主要包括创建新任务的操作步骤,操作中的注意事项两部分内容。
一,创建新任务操作步骤:
1.添加新任务
点击任务列表右侧,新建任务文件。
【添加任务】
此时会出现一个弹框,可以在弹框中填写采集地址,修改任务名称,以及选择是否需要登录/关键词采集。
【新建任务】
2.填写采集地址
在弹窗里填写采集地址和任务名称。
【填写采集地址】
采集地址一般选择目标网站的入口地址,比如首页。
大多数情 ...
今天,小编为大家介绍一下,前嗅ForeSpider中数据浏览界面,具体内容如下:
在“数据采集”页面开始采集后,可以在“数据浏览”页面点对应的数据表,点击“刷新”按钮,即可实时查看采集到的数据。
【数据浏览界面】
1.数据列表
展示已经建立的数据表。选择需要浏览的数据表,查看具体数据。
【数据列表】
2.数据浏览
在数据浏览页面可以浏览数据库中的数据。
【数据浏览列表】
3.按条件检索
在数据浏览中,可按条件检索具体数据记录。有按字段检索、整体检索两种方式。
【 ...
今天,小编为介绍一下,前嗅ForeSpider中数据采集界面里:运行设置,IP代理设置,验证码设置,这三大设置的界面,具体内容如下:
一,运行设置
数据采集前的运行设置,包括采集速度、采集策略、任务装载、网络超时、HTTP设置、加载设置、任务模式、任务定时、预警设置、过滤设置10个部分。
【运行设置界面】
二,IP代理设置
软件支持动态和静态IP代理,http/https/socket代理。当需要启用IP代理时,需要在资源管理界面添加代理资源。
【IP代理设置界面】
1.启用IP代理
启用IP代理采集时 ...
从今天开始,前嗅的小伙伴们就开始上班了,在此小编代替前嗅所有员工,给大家拜个晚年,祝大家在新的一年工作顺利,万事如意!
同时也为大家带来了新的教程:前嗅ForeSpider数据采集中采集列表的界面介绍,大家在操作中有什么疑问的快快发过来吧~
【数据采集界面】
1.装载记录
可以实现日志的统计功能。
【装载记录-统计】
2.采集列表/装载记录
(1)采集列表
进行数据采集时,可在采集列表查看任务的采集状态。
【采集列表】
开始采集数据
先自动清空历史装载记录
并重新开始采集
...
前嗅ForeSpider数据建表和高级配置界面介绍
- 博客分类:
- 教程
今天,小编为大家介绍一下,前嗅ForeSpider的数据建表,和高级配置界面,具体内容如下:
一,数据建表
【数据建表界面】
1.采集表单
数据采集之后需要存入数据库,在ForeSpider中创建的表单,就是数据采集入库的表结构。不同的频道可以使用同一个表单,创建任意多个数据表。
【采集表单】
2.表单配置
用于配置字段属性、采集内容、数据类型、数据长度、高级类型和字段说明。(方法一:快速建表/方法二:自由建表
【表单配置】
添加字段。
编辑字段。
前嗅ForeSpider采集配置界面介绍
- 博客分类:
- 教程
今天,小编为大家介绍一下,前嗅ForeSpider的采集配置界面,具体内容如下:
启动ForeSpider采集软件后,默认界面如图所示。ROOT任务下有已经配置好的示例模板,点击网站图标即可进行采集预览。可在任务列表选择某一任务按照需求重新配置。
【采集配置界面】
1.任务列表
【任务列表】
任务对应着采集来源,通常一个采集来源对应着一个任务。如采集人民网时,人民网就是一个任务;通过百度采集全网信息时,百度就是一个任务;通过100个网址导航采集全球域名时,这100个网址导航就是一个任务。
2.任务属性配置
用户可根据采集需求与网站的设置选择性的配置任务 ...
前嗅ForeSpider教程:采集58同城数据
- 博客分类:
- 教程
天小编为大家带来的教程是,采集58同城数据,同样适用于其他类似网站,具体操作如下:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务名称,如图2:
③点击下一步,选择进行数据抽取还是链接抽取,首先采集58同城·便当分类下的分类列表的链接,所以点击抽取链接,如图3:
前嗅ForeSpider教程:采集美团网
- 博客分类:
- 教程
今天,小编为大家演示一下,如何采集美团网数据,具体操作如下:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务名称,如图2:
③点击下一步,选择进行数据抽取还是链接抽取,首先当前检索结果列表链接,所以点击抽取链接,选择链接抽取,如图3:
前嗅ForeSpider教程:采集黄页88
- 博客分类:
- 教程
今天小编为大家带来的教程是:采集黄页88,同时也适用于采集其他的企业信息网站,具体操作流程如下:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务名称,如图2:
③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页联系方式链接,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,翻页选择普通翻页,如图3:
④完成后模板抽取配置列表有两个模板,默认模板和链接列表。默认模板下自动生成两个链接抽取,一个为链接列表抽取,已与模板“链接列表”关联,一个为普通翻页链接,此链接已与默认模板自身关联,如图4 ...
前嗅ForeSpider教程:采集中国证券网
- 博客分类:
- 教程
前几天有人问如何采集中国证券网,小编整理了一下,在此为大家做一下演示,同样适用于其他金融经济型的网站:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务 ...
前嗅ForeSpider教程:采集CSDN
- 博客分类:
- 教程
上周小编介绍了如何采集360问答,今天小编再来为大家演示一下,如何采集CSDN论坛,同样适用于所有的自媒体论坛。
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务名称,如图2:
③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页博文的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3:
前嗅ForeSpider教程:采集360问答
- 博客分类:
- 教程
今天,小编来教大家如何采集论坛自媒体类网站的数据,以采集360问答为例,为大家进行演示操作,该操作同样适用于其他类似网站:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②弹窗里填写采集地址,任务名称,开启手动登录配置,如图2:
若未在此处开启登录配置,可在模板抽取配置中点击相应的模板,开启登录配置,如图3。
前嗅ForeSpider教程:采集新浪新闻
- 博客分类:
- 教程
最近后台有很多童鞋问怎么采集新闻,今天小编以采集新浪新闻为例,来为大家进行演示,同样适用于其他新闻网站的采集,具体操作如下:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务名称,如图2:
③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3:
第二步:通过定位过滤、地址过滤,得到所需链接
①按住Ctrl+鼠标左键,进行区域选择,按住Shift+鼠标左键,扩大选择区域,点击“确认选区”按钮,如 ...
昨天为大家介绍了如何采集图片/视频/资源文件后,有小伙伴问我如何采集他们的链接地址,今天小编就为大家演示如何采集图片/视频/资源文件的链接地址,操作如下:
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
②在弹窗里填写采集地址,任务名称如图2:
③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入的,所以本次需要抽取列表图片链接,所以点击抽取链接,如图3:
第二步:选择链接类型
由于本次需要取到的是图片链接,图片链接不同于其他网页链接,所以需要特殊对待,在链接(网址)属性配置下面的 ...
第一步:新建任务
①点击左上角“加号”新建任务,如图1:
【图1】
② 弹窗里填写采集地址,任务名称如图2:
【图2】
③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入的,所以本次需要抽取列表图片链接,所以点击抽取链接,如图3: