`

前嗅ForeSpider脚本教程:字段处理脚本

阅读更多

字段处理脚本用于清洗字段的取值。点击某个字段后,在字段处理的下拉菜单中选择脚本处理后,需要配置的脚本。这一步是通过脚本进一步清洗获取的数据。

 

一.可用全局对象(只读)

 

EXTRACT: 当前采集引擎[ 对象类型: extractor ]

DATADB: 当前连接的数据库[ 对象类型: dataBase ]

RESULT: 当前结果集对象[ 对象类型: result ]

URL: 当前采集的链接对象[ 对象类型: url ]

URLTEXT : 描述当前链接采集的所有状态及属性的对象[ 对象类型: urltext ]

DOC: 当前采集的文档对象[ 对象类型: grabDoc ]

DOM: 当前采集文档的dom对象[ 对象类型: dom ]

ITEM: 当前dom树被取值节点[ 对象类型: domItem ]

TMPL: 当前文档模板对象[ 对象类型: tmplTmpl ]

DATA: 当前数据抽取对象[ 对象类型: tmplData ]

REC: 当前记录集对象[ 对象类型: record ]

VALUE: 当前字段获取的字符串类型的值。[ 对象类型: string ]

 

二.this对象

 

当前数据字段抽取[ tmplVal ]对象

 

三.脚本返回值

 

必须返回处理后的的数据结果[返回类型: string]

 

四.示例

 

<div class="lumn_left01"><a>商品大类</a>><a><a>商品列表</a>><a>商品品牌</a>></div>

【网页源码】

 

以下脚本将取数据“商品大类”的右串:

return DOM.GetTextAll(DOM.FindClass("lumn_left01",div)).Right("商品大类");

取出的结果为:>商品列表>商品品牌

 

注释:

GetTextAll:取出其中所有的文本。             

FindClass:通过标签class属性值查找标签节点。     

Right: 返回字符串右边的字符串。     

 

以下脚本将清除数据前后的空白符:

return VALUE.TrimAll();
分享到:
评论

相关推荐

    Linux Shell脚本教程:30分钟玩转Shell脚本编程 _

    Linux Shell脚本教程:30分钟玩转Shell脚本编程 _

    Bash脚本教程:Java JAR应用快速启动与监控.zip

    本Bash脚本用于自动化管理Java JAR应用的启动、停止及监控。首先检查JAR进程是否在运行,如在运行则安全终止。...本脚本提供了灵活的配置和错误处理机制,为Java应用的运维管理带来了便捷与可靠性。

    Installshield 脚本代码:卸载时杀掉进程

    ### Installshield 脚本代码:卸载时杀掉进程 在软件开发和部署过程中,安装程序(如Installshield)的脚本编写是一项重要的技能。...此外,在实际应用中还需要考虑异常处理和错误提示等方面,以确保脚本的健壮性。

    Unity3D 2018 最新最全800个脚本教程

    Unity3D教程:制作简单小汽车游戏 OnGUI的视觉化编辑 unity3d角色血条 Unity3D格斗游戏运动特效 MenuItem自定义菜单项 Unity3D脚本:导弹追踪代码 Unity3D教程:UI自动适合屏幕分辨率 中慢动作与加速动作的实现 ...

    ArcGIS(ArcPy)脚本excel批量添加字段

    本文将深入探讨如何使用ArcPy脚本来批量地在Excel表格中添加字段,这对于处理大量地理属性数据非常有用。 首先,了解ArcPy的基本结构是必要的。ArcPy包含了多个模块,如arcpy.env用于设置环境变量,arcpy....

    经典windows脚本教程

    6. **错误处理与调试**:任何编程过程中都避免不了错误,本教程也会介绍如何在VBS和JS中进行有效的错误处理,以及使用Visual Studio或Script Editor等工具进行脚本调试。 7. **安全性考虑**:由于脚本可以直接操作...

    FileMaker高级教程 脚本

    ### FileMaker高级教程:脚本 #### 重要性与作用 在FileMaker Pro软件中,脚本是一项极其重要且强大的工具。它使开发者能够创建自动化的任务流程,从而极大地提高工作效率并减少人为错误。通过本章节的学习,我们...

    linux-shell脚本命令:awk命令简介

    Linux系统中的awk命令是一个功能强大的文本处理工具,它可以对输入(通常是文件)进行模式扫描和处理。awk命令常用于在Linux shell脚本中进行数据提取、文本转换、数据报告生成等操作。本文将对awk命令的基本知识...

    windows脚本教程 chm

    《Windows脚本教程》是一本全面介绍Windows操作系统中脚本技术的权威指南,主要针对的是批处理脚本(Batch Scripting)和Windows PowerShell脚本。CHM格式是Microsoft的 Compiled HTML Help,通常用于电子手册或文档...

    SCDM脚本开发入门教程

    **SCDM概述** SCDM全称为ANSYS SpaceClaim Direct Modeler,是一款基于直接建模理念的3D建模和几何处理软件。它摒弃了传统CAD系统中的历史记录...通过学习和实践SCDM脚本,工程师可以更高效地完成仿真分析前处理工作。

    Genesis2000、InCAM脚本图文教程

    编写C-shell脚本前,首先需要理解C-shell的脚本文件首行的作用。如果脚本首行以#!开始,后面紧跟一个程序名,系统会用那个程序执行后续的命令。如果首行以#开始,系统会用C-shell执行脚本。如果首行不是以#开始,...

    Oracle数据库中添加单个字段操作脚本。

    Oracle数据库中,对已存在数据的表中插入单个字段信息。

    sqlserver 导出表及字段说明脚本.rar

    这个压缩包"sqlserver 导出表及字段说明脚本.rar"包含了一个名为"sqlserver 导出表及字段说明脚本.sql"的文件,这通常是一个用于生成SQL语句的脚本,用于描述数据库中的表结构以及各字段的详细信息。以下是对这个...

    PowerDesigner字段名生成备注说明脚本.vbs

    PowerDesigner字段名生成备注说明脚本.vbs

    PADS常用脚本文件

    - 调试脚本:在PADS环境中运行脚本,观察执行结果,根据需要进行调试和优化。 - 整合到工作流程:将脚本整合到设计流程中,例如设置快捷键或者作为批处理任务的一部分。 5. **脚本学习资源**: - 官方文档:PADS...

    按键精灵VBS经典脚本教程

    1. 文件下载(无回显)脚本: 使用VBS脚本可以实现文件下载,并且不显示下载过程。 2. 列举进程脚本: 使用VBS脚本可以列举系统中的进程。 3. 终止进程脚本: 使用VBS脚本可以终止系统中的进程。 4. 重启系统...

    BAT脚本编写教程

    BAT脚本,全称为Batch Script,是Windows操作系统中的一种脚本语言,主要用于自动化执行一系列DOS命令。在本文中,我们将深入学习几个基础且常用的BAT脚本命令:echo、@、call、pause以及rem。 首先,`echo`命令...

    AD铺铜脚本.rar

    用户需要对AD的脚本语言有一定的了解,或者能够找到相关的教程来学习如何使用这些脚本。 使用这些铺铜脚本的优点包括: 1. 提升效率:自动化的铺铜过程节省了手动操作的时间。 2. 规则一致性:脚本可以确保整个...

    PhotoShop脚本教程及生成所有图层坐标的案例

    Photoshop脚本教程是针对Adobe Photoshop的编程接口——Scripting API进行的学习资源,它允许用户通过编写脚本来自动化复杂的图像处理任务,提高工作效率。在这款专业图像编辑软件中,脚本功能尤其对设计师和摄影师...

    Unity3D脚本:如何调用更改其他脚本中的变量2

    在Unity3D游戏开发中,...4. 在Unity编辑器中将对应的对象实例拖放到相应的脚本字段上,完成实例的绑定。 通过这种方式,你可以轻松地在Unity3D中实现不同脚本之间的数据共享和交互,从而提高代码的复用性和可维护性。

Global site tag (gtag.js) - Google Analytics