`

前嗅ForeSpider脚本教程:模板脚本

阅读更多

链接脚本是频道的模板中的脚本。配置了模板脚本,模板的处理流程将被改变:

1.如果脚本未正确返回dom区域节点,则该模板的采集则完全由该脚本控制。

2.如果脚本返回了一个正确的dom区域节点,则该模板的所有流程(链接抽取或数据抽取)都以该区域节点为基准,区域外的信息和数据将优先作为垃圾数据处理。

 

一.可用全局对象(只读)

 

EXTRACT: 当前采集引擎[ 对象类型: extractor ]

DATADB: 当前连接的数据库[ 对象类型: dataBase ]

RESULT: 当前结果集对象[ 对象类型: result ]

URL: 当前采集的链接对象[ 对象类型: url ]

URLTEXT : 描述当前链接采集的所有状态及属性的对象[ 对象类型: urltext ]

DOC: 当前采集的文档对象[ 对象类型: grabDoc ]

DOM: 当前采集文档的dom对象[ 对象类型: dom ]

TMPL:当前结果集对象[ 对象类型: tmplTmpl ]:等价于this对象

 

二.this对象

 

当前模板 [tmplTmpl] 对象。

 

三.脚本返回值:

如果需要进行数据操作必须return 文档区域(domItem对象);否则返回0。


示例:

以下脚本查找网页(文档)中的第一个表格对象,如果找到表格则从表格中提取链接或数据;否则不处理当前页面:

 

return DOM.FindName("table");

 

如果想要特定的链接,比如关键词搜索这样的,就会用模板脚本,下面是每个模板脚本必有的代码:

 

​​​​​​​url u;u.title = "";

u.urlname = "";

u.tmplid = 3;

u.entryid = CHANN.id;

RESULT.AddLink(u);

 

分享到:
评论

相关推荐

    Linux Shell脚本教程:30分钟玩转Shell脚本编程 _

    Linux Shell脚本教程:30分钟玩转Shell脚本编程 _

    TCL脚本实例: 检查IP的脚本

    TCL脚本实例:检查IP的脚本 TCL脚本实例:检查IP的脚本是一种使用TCL语言编写的脚本,用于检查指定的IP地址是否可以ping通。本脚本可以根据配置文件中的IP地址列表,自动执行ping操作,并输出ping结果。 知识点: ...

    Bash脚本教程:Java JAR应用快速启动与监控.zip

    本Bash脚本用于自动化管理Java JAR应用的启动、停止及监控。首先检查JAR进程是否在运行,如在运行则安全终止。随后,使用预设的Java参数启动JAR文件,并将输出和错误日志重定向至日志文件。启动后,脚本持续监控JAR...

    gg模板解析_gg脚本模板_GG脚本_

    GG脚本模板是一种在特定领域内广泛使用的编程脚本,主要设计用于自动化任务、数据分析或者游戏中的各种功能实现。在本资源中,我们有一个名为"gg模板解析.lua"的文件,这显然是一份关于GG脚本的Lua语言模板,旨在...

    Installshield 脚本代码:卸载时杀掉进程

    ### Installshield 脚本代码:卸载时杀掉进程 在软件开发和部署过程中,安装程序(如Installshield)的脚本编写是一项重要的技能。本文将深入探讨一个具体的脚本示例,该脚本旨在在卸载软件时终止特定进程。通过...

    Unity3D 2018 最新最全800个脚本教程

    Unity3D教程:制作简单小汽车游戏 OnGUI的视觉化编辑 unity3d角色血条 Unity3D格斗游戏运动特效 MenuItem自定义菜单项 Unity3D脚本:导弹追踪代码 Unity3D教程:UI自动适合屏幕分辨率 中慢动作与加速动作的实现 ...

    python项目练习python自动化脚本:12306-火车票购票

    python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python...

    经典windows脚本教程

    《经典Windows脚本教程》是一份由微软官方提供的宝贵学习资源,主要涵盖了VBS(Visual Basic Script)和JS(JavaScript)在Windows环境下的脚本编程技术。这些脚本语言在系统自动化、任务调度、网页交互等多个领域都...

    routeros-中文脚本教程.zip

    中文脚本教程针对的是那些希望在RouterOS环境中使用中文进行脚本编程和系统管理的用户。本教程旨在帮助这些用户理解和掌握RouterOS中的命令行接口(CLI)以及其内置的脚本语言—— RouterOS Scripting Language(RSC...

    西门子Wincc报表控件:模板自定义、多功能数据呈现与轻松打印导出,无需脚本与数据库,操作教程简单易懂,适用于Wincc 7.4/7.5/8.0 ,西门子wincc报表控件,支持自定义模版,支持打印预

    西门子Wincc报表控件:模板自定义、多功能数据呈现与轻松打印导出,无需脚本与数据库,操作教程简单易懂,适用于Wincc 7.4/7.5/8.0。,西门子wincc报表控件,支持自定义模版,支持打印预览,支持打印PDF,支持导出...

    云控系统脚本源码:批量化控制与自动化脚本源码 #Autojs.pdf

    云控系统脚本源码:批量化控制与自动化脚本源码 #Autojs.pdf

    在unity中创建自定义模板脚本的方法

    为了提高工作效率和代码规范性,自定义模板脚本是一种非常实用的方法。这样,每次新建脚本时,可以自动包含预设的注释、作者信息、时间戳等元数据,避免手动输入这些重复信息。以下是如何在Unity中创建自定义模板...

    Unity3D教程:如何使用脚本进行控制1

    在这个“Unity3D教程:如何使用脚本进行控制”中,我们将探讨如何通过编写JavaScript脚本来控制游戏对象的行为,尤其是立方体的移动和旋转。 首先,教程创建了一个立方体GameObject作为游戏对象。为了使立方体受到...

    学习教程大全:gis python 脚本大全:2022年.pdf

    面向设计师的编程设计知识系统ArcGIS下的Python编程

    NDM脚本编写代码模板

    ### NDM脚本编写代码模板解析 #### 一、引言 在企业级文档管理和内容管理系统领域,IBM的Documentum是一套广泛使用的解决方案。而NDM(Network Data Management)是Documentum平台中的一个重要组成部分,主要用于...

    Shell脚本学习教程PDF版

    在“Shell脚本学习教程PDF版”中,你将深入理解Shell脚本的基本概念、语法结构以及高级特性。 首先,Shell脚本的基础包括变量、条件语句、循环结构和函数。变量是存储数据的地方,可以是文本、数字或者其他类型。在...

    windows脚本教程 chm

    《Windows脚本教程》是一本全面介绍Windows操作系统中脚本技术的权威指南,主要针对的是批处理脚本(Batch Scripting)和Windows PowerShell脚本。CHM格式是Microsoft的 Compiled HTML Help,通常用于电子手册或文档...

    计算机自动化测试脚本写作模板

    本文将详细探讨"计算机自动化测试脚本写作模板"的相关知识点,帮助你构建自己的测试框架。 1. **自动化测试的重要性**:自动化测试能够减少手动测试的工作量,提高测试覆盖率,同时在持续集成/持续部署(CI/CD)流程...

    C语言中文网shell脚本教程

    **C语言中文网shell脚本教程** 这是一份关于Shell脚本编程的离线学习资料,包含了一系列HTML文件,旨在帮助用户深入理解并掌握Linux Shell脚本编程技术。以下是其中涉及的一些关键知识点: 1. **Shell命令的本质**...

Global site tag (gtag.js) - Google Analytics