前嗅ForeSpider脚本教程-链接抽取：链接在POST请求里写脚本 -

qianxiu

浏览: 47932 次

最近访客更多访客>>

wangyy

leimingchao

masuweng

abc123

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

前嗅ForeSpider脚本教程-链接抽取：链接在POST请求里写脚本

博客分类：

教程

前嗅数据采集 ForeSpider数据采集采集教程脚本教程

今天，小编给大家带来的教程为：前嗅ForeSpider脚本教程-链接抽取中，链接在POST请求里写脚本的实战教程。具体内容如下：

当链接地址在源码中不存在，存在于post请求中时，需要使用浏览器的开发者工具来查找链接数据。

1.链接需要循环

场景：一组链接存在于JSON的某个数组中。

示例：采集豆瓣电影，列表页的电影链接。

查看源文件可知，源文件中只有一部分数据，而下拉列表出现的其他电影信息不存在源码中，此时我们需要在请求的响应正文中查找数据。在该页面右键点击“审查元素”，下拉，点击“加载更多”，出现一个请求包，查看Response，发现链接地址存在于，返回正文中。

将Response中的信息粘贴到json查看器中，以notepad++插件“JSON Viewer”为例，定位数据存在路径。

脚本实例：

var urs = “https://movie.douban.com/j/search_subjects？type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=60”;
var groc = EXTRACT.OpenDoc(CHANN,urs,0);
if(groc){ 
    var jsonStr = groc.GetDom().GetSource().ToStr();
    jScript js; 
    var json = js.RunJson(jsonStr); 
    var arr = json.subjects; 
    for(int i=0;i<arr.size;i++){ 
        url u; 
        u.title=””;
        u.urlname=arr[i].url; 
        u.entryid=CHANN.id; 
        u.tmplid=2; 
        RESULT.AddLink(u);     
        } 
    }

2.不循环

场景：少数链接是JSON的某个键值。

示例：暂无。

分享到：

前嗅ForeSpider脚本教程-链接抽取：自定义 ... | 前嗅ForeSpider脚本教程-链接抽取：链接在 ...

2019-04-12 16:52
浏览 446
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

前嗅ForeSpider脚本教程-链接抽取：链接在POST请求里写脚本

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

前嗅ForeSpider脚本教程-链接抽取：链接在POST请求里写脚本

评论

发表评论

相关推荐

从零学爬虫：采集房天下二手房信息

前嗅教你大数据：常见几种编码介绍

前嗅教你大数据：常见的网站反爬策略与解决方案

如何在ForeSpider数据采集器中设置代理IP

前嗅ForeSpider采集教程：通过关键词的【检索列表】采集【检索结果】

前嗅大数据—ForeSpider教你如何采集【列表数据】

前嗅forespider教程：关键词采集【检索结果】

ForeSpider采集教程发布（论坛类）：零基础轻松获取数据

ForeSpider采集教程发布（表格类）：零基础轻松获取数据

爬虫软件真的可以获取隐私数据？真相只有一个

大数据告诉你，五一出行，性价比最高的酒店是它

前嗅教程：如何获取精准客源，提高销量

字段在源码的html标签里

前嗅ForeSpider脚本教程-数据抽取脚本实战教程

前嗅ForeSpider脚本教程-链接过滤脚本

前嗅ForeSpider脚本教程-链接抽取：自定义链接写脚本

前嗅ForeSpider脚本教程-链接抽取：链接在源码的js变量里写脚本

前嗅ForeSpider脚本教程-链接抽取：应用场景及链接在源码的html标签里写脚本

前嗅ForeSpider脚本教程-频道脚本：脚本采集数据

前嗅ForeSpider脚本教程：频道脚本使用场景及配置关键词搜索

最近访客更多访客>>