`

前嗅ForeSpider脚本教程:链接过滤脚本

阅读更多

链接过滤脚本是地址和标题过滤中的脚本, 过滤类型必须选择脚本过滤时过滤脚本才能生效,过滤脚本用于处理复杂的链接或标题过滤需求。

 

一.可用全局对象(只读)

 

EXTRACT: 当前采集引擎[ 对象类型: extractor ]

DATADB: 当前连接的数据库[ 对象类型: dataBase ]

RESULT: 当前结果集对象[ 对象类型: result ]

URL: 当前采集的链接对象[ 对象类型: url ]

URLTEXT : 描述当前链接采集的所有状态及属性的对象[ 对象类型: urltext ]

DOC: 当前采集的文档对象[ 对象类型: grabDoc ]

DOM: 当前采集文档的dom对象[ 对象类型: dom ]

ITEM: 当前链接dom树的href标签节点[ 对象类型: domItem ]

TMPL: 当前文档模板对象[ 对象类型: tmplTmpl ]

LINK:当前链接抽取对象[ 对象类型: tmplLink ]

VALUE:当前被过滤的字符串[ 对象类型: string ]

 

二.this对象

 

当前链接过滤[tmplFilter]对象。

 

三.脚本返回值

 

返回非0保留,否则过滤。

 

示例:

 

1.以下脚本过滤空白链接:

 

if(VALUE) 
return true;
else return false;

 

2.【标题过滤】以下脚本过滤标题的长度小于5个字符的链接:

 

if(VALUE.length>=5)
 return true;
 else return false;

 

分享到:
评论

相关推荐

    Linux Shell脚本教程:30分钟玩转Shell脚本编程 _

    Linux Shell脚本教程:30分钟玩转Shell脚本编程 _

    TCL脚本实例: 检查IP的脚本

    TCL脚本实例:检查IP的脚本 TCL脚本实例:检查IP的脚本是一种使用TCL语言编写的脚本,用于检查指定的IP地址是否可以ping通。本脚本可以根据配置文件中的IP地址列表,自动执行ping操作,并输出ping结果。 知识点: ...

    Bash脚本教程:Java JAR应用快速启动与监控.zip

    本Bash脚本用于自动化管理Java JAR应用的启动、停止及监控。首先检查JAR进程是否在运行,如在运行则安全终止。随后,使用预设的Java参数启动JAR文件,并将输出和错误日志重定向至日志文件。启动后,脚本持续监控JAR...

    Installshield 脚本代码:卸载时杀掉进程

    ### Installshield 脚本代码:卸载时杀掉进程 在软件开发和部署过程中,安装程序(如Installshield)的脚本编写是一项重要的技能。本文将深入探讨一个具体的脚本示例,该脚本旨在在卸载软件时终止特定进程。通过...

    Linux下链接脚本基础

    11. 暗含的连接脚本:链接器有默认的内置链接脚本,但也可以通过-T选项指定自己的链接脚本文件,或者使用隐含的连接脚本来增加自定义的链接命令。 了解链接脚本的基本概念和格式是进行嵌入式Linux系统开发的基础。...

    Unity3D 2018 最新最全800个脚本教程

    Unity3D教程:制作简单小汽车游戏 OnGUI的视觉化编辑 unity3d角色血条 Unity3D格斗游戏运动特效 MenuItem自定义菜单项 Unity3D脚本:导弹追踪代码 Unity3D教程:UI自动适合屏幕分辨率 中慢动作与加速动作的实现 ...

    python项目练习python自动化脚本:12306-火车票购票

    python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python项目练习python自动化脚本:12306-火车票购票python...

    跨站脚本攻击字符过滤

    ### 跨站脚本攻击与字符过滤技术解析 #### 一、引言 随着互联网的飞速发展,网站已经成为人们日常生活中不可或缺的一部分。然而,在享受便捷的同时,我们也面临着各种网络安全威胁,其中“跨站脚本攻击”(Cross-...

    经典windows脚本教程

    《经典Windows脚本教程》是一份由微软官方提供的宝贵学习资源,主要涵盖了VBS(Visual Basic Script)和JS(JavaScript)在Windows环境下的脚本编程技术。这些脚本语言在系统自动化、任务调度、网页交互等多个领域都...

    gcc链接脚本详解.pdf

    GCC链接脚本是控制GCC连接器(ld)如何组织输入文件中的section并形成输出文件(通常是目标文件或可执行文件)的重要工具。本文档详细介绍了链接脚本的基本编写规则,并通过实例帮助读者深入理解其工作原理。 链接...

    windows脚本教程 chm

    《Windows脚本教程》是一本全面介绍Windows操作系统中脚本技术的权威指南,主要针对的是批处理脚本(Batch Scripting)和Windows PowerShell脚本。CHM格式是Microsoft的 Compiled HTML Help,通常用于电子手册或文档...

    linux链接脚本详解

    ### Linux链接脚本详解 #### 1. 什么是链接脚本? 链接脚本在Linux环境中扮演着关键角色,尤其在构建内核时更是不可或缺的一部分。简单来说,链接脚本文档是一种特殊的文本文件,用于指导链接器如何组合多个目标...

    Linux下的lds链接脚本资源

    Linux下的链接脚本(Linker Script,简称lds)是一种控制链接器行为的脚本语言,用于指定程序各段(sections)在最终生成的可执行文件中的布局。了解lds链接脚本对于定制可执行文件的结构和优化程序内存使用至关重要...

    Genesis2000、InCAM脚本图文教程

    编写C-shell脚本前,首先需要理解C-shell的脚本文件首行的作用。如果脚本首行以#!开始,后面紧跟一个程序名,系统会用那个程序执行后续的命令。如果首行以#开始,系统会用C-shell执行脚本。如果首行不是以#开始,...

    SCDM脚本开发入门教程

    **SCDM概述** SCDM全称为ANSYS SpaceClaim Direct Modeler,是一款基于直接建模理念的3D建模和几何处理软件。它摒弃了传统CAD系统中的历史记录...通过学习和实践SCDM脚本,工程师可以更高效地完成仿真分析前处理工作。

    BAT脚本编写教程

    BAT脚本,全称为Batch Script,是Windows操作系统中的一种脚本语言,主要用于自动化执行一系列DOS命令。在本文中,我们将深入学习几个基础且常用的BAT脚本命令:echo、@、call、pause以及rem。 首先,`echo`命令...

    Link-Script语法/ HighTec用户手册/ 链接脚本

    【Link-Script语法/ HighTec用户手册/ 链接脚本】 在嵌入式系统开发中,链接脚本(Linker Script)是至关重要的一个环节,它用于控制编译器如何将编译后的对象文件组织成最终的可执行文件。在HighTec EDV-Systeme ...

    按键精灵VBS经典脚本教程

    1. 文件下载(无回显)脚本: 使用VBS脚本可以实现文件下载,并且不显示下载过程。 2. 列举进程脚本: 使用VBS脚本可以列举系统中的进程。 3. 终止进程脚本: 使用VBS脚本可以终止系统中的进程。 4. 重启系统...

    FileMaker高级教程 脚本

    ### FileMaker高级教程:脚本 #### 重要性与作用 在FileMaker Pro软件中,脚本是一项极其重要且强大的工具。它使开发者能够创建自动化的任务流程,从而极大地提高工作效率并减少人为错误。通过本章节的学习,我们...

    LoadRunner创建测试脚本教程.docx

    2. 录制脚本:使用 LoadRunner 的 Visual User Generator 工具,录制用户的操作,并生成测试脚本。录制过程中,用户需要遵循录制原则,包括提高脚本执行效率、录制具有代表性的功能、选择具有影响的事务等。 3. ...

Global site tag (gtag.js) - Google Analytics