链接脚本是频道的模板中的脚本。配置了模板脚本,模板的处理流程将被改变:
1.如果脚本未正确返回dom区域节点,则该模板的采集则完全由该脚本控制。
2.如果脚本返回了一个正确的dom区域节点,则该模板的所有流程(链接抽取或数据抽取)都以该区域节点为基准,区域外的信息和数据将优先作为垃圾数据处理。
一.可用全局对象(只读)
EXTRACT: 当前采集引擎[ 对象类型: extractor ]
DATADB: 当前连接的数据库[ 对象类型: dataBase ]
RESULT: 当前结果集对象[ 对象类型: result ]
URL: 当前采集的链接对象[ 对象类型: url ]
URLTEXT : 描述当前链接采集的所有状态及属性的对象[ 对象类型: urltext ]
DOC: 当前采集的文档对象[ 对象类型: grabDoc ]
DOM: 当前采集文档的dom对象[ 对象类型: dom ]
TMPL:当前结果集对象[ 对象类型: tmplTmpl ]:等价于this对象
二.this对象
当前模板 [tmplTmpl] 对象。
三.脚本返回值:
如果需要进行数据操作必须return 文档区域(domItem对象);否则返回0。
示例:
以下脚本查找网页(文档)中的第一个表格对象,如果找到表格则从表格中提取链接或数据;否则不处理当前页面:
如果想要特定的链接,比如关键词搜索这样的,就会用模板脚本,下面是每个模板脚本必有的代码:
相关推荐
Linux Shell脚本教程:30分钟玩转Shell脚本编程 _
TCL脚本实例:检查IP的脚本 TCL脚本实例:检查IP的脚本是一种使用TCL语言编写的脚本,用于检查指定的IP地址是否可以ping通。本脚本可以根据配置文件中的IP地址列表,自动执行ping操作,并输出ping结果。 知识点: ...
本Bash脚本用于自动化管理Java JAR应用的启动、停止及监控。首先检查JAR进程是否在运行,如在运行则安全终止。随后,使用预设的Java参数启动JAR文件,并将输出和错误日志重定向至日志文件。启动后,脚本持续监控JAR...
### Installshield 脚本代码:卸载时杀掉进程 在软件开发和部署过程中,安装程序(如Installshield)的脚本编写是一项重要的技能。本文将深入探讨一个具体的脚本示例,该脚本旨在在卸载软件时终止特定进程。通过...
Unity3D教程:制作简单小汽车游戏 OnGUI的视觉化编辑 unity3d角色血条 Unity3D格斗游戏运动特效 MenuItem自定义菜单项 Unity3D脚本:导弹追踪代码 Unity3D教程:UI自动适合屏幕分辨率 中慢动作与加速动作的实现 ...
python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python...
《经典Windows脚本教程》是一份由微软官方提供的宝贵学习资源,主要涵盖了VBS(Visual Basic Script)和JS(JavaScript)在Windows环境下的脚本编程技术。这些脚本语言在系统自动化、任务调度、网页交互等多个领域都...
在这个“Unity3D教程:如何使用脚本进行控制”中,我们将探讨如何通过编写JavaScript脚本来控制游戏对象的行为,尤其是立方体的移动和旋转。 首先,教程创建了一个立方体GameObject作为游戏对象。为了使立方体受到...
《Windows脚本教程》是一本全面介绍Windows操作系统中脚本技术的权威指南,主要针对的是批处理脚本(Batch Scripting)和Windows PowerShell脚本。CHM格式是Microsoft的 Compiled HTML Help,通常用于电子手册或文档...
本文将详细探讨"计算机自动化测试脚本写作模板"的相关知识点,帮助你构建自己的测试框架。 1. **自动化测试的重要性**:自动化测试能够减少手动测试的工作量,提高测试覆盖率,同时在持续集成/持续部署(CI/CD)流程...
编写C-shell脚本前,首先需要理解C-shell的脚本文件首行的作用。如果脚本首行以#!开始,后面紧跟一个程序名,系统会用那个程序执行后续的命令。如果首行以#开始,系统会用C-shell执行脚本。如果首行不是以#开始,...
1. 文件下载(无回显)脚本: 使用VBS脚本可以实现文件下载,并且不显示下载过程。 2. 列举进程脚本: 使用VBS脚本可以列举系统中的进程。 3. 终止进程脚本: 使用VBS脚本可以终止系统中的进程。 4. 重启系统...
**SCDM概述** SCDM全称为ANSYS SpaceClaim Direct Modeler,是一款基于直接建模理念的3D建模和几何处理软件。它摒弃了传统CAD系统中的历史记录...通过学习和实践SCDM脚本,工程师可以更高效地完成仿真分析前处理工作。
BAT脚本,全称为Batch Script,是Windows操作系统中的一种脚本语言,主要用于自动化执行一系列DOS命令。在本文中,我们将深入学习几个基础且常用的BAT脚本命令:echo、@、call、pause以及rem。 首先,`echo`命令...
(完整word版)分镜头脚本模板.pdf
4. 生成脚本:点击生成按钮,NSG2将根据配置生成TCL脚本文件。 5. 查看和编辑:生成的脚本可以在NSG2内部进行查看和编辑,利用其内置的代码编辑功能。 五、持续学习与提升 在掌握了TCL基础和NSG2的使用后,可以...
2. 录制脚本:使用 LoadRunner 的 Visual User Generator 工具,录制用户的操作,并生成测试脚本。录制过程中,用户需要遵循录制原则,包括提高脚本执行效率、录制具有代表性的功能、选择具有影响的事务等。 3. ...
### FileMaker高级教程:脚本 #### 重要性与作用 在FileMaker Pro软件中,脚本是一项极其重要且强大的工具。它使开发者能够创建自动化的任务流程,从而极大地提高工作效率并减少人为错误。通过本章节的学习,我们...
- 调试脚本:在PADS环境中运行脚本,观察执行结果,根据需要进行调试和优化。 - 整合到工作流程:将脚本整合到设计流程中,例如设置快捷键或者作为批处理任务的一部分。 5. **脚本学习资源**: - 官方文档:PADS...
它允许开发者通过自定义模板来快速创建复杂的SQL脚本,极大地提高了开发效率。以下是对CodeSmith使用和SQL脚本生成模板的详细解释: 首先,我们来看"Script.cst"和"ScriptsTest.cst"这两个文件。它们是CodeSmith的...