`

前嗅ForeSpider脚本教程:字段取值脚本

阅读更多

字段取值脚本是字段的取值类型选择脚本取值时,需要配置的脚本。这一步是通过脚本来获取字段的填充值。

 

注意:一旦有了字段取值脚本,则字段处理脚本将失效。

 

 

 

一.可用全局对象(只读)

 

 

 

EXTRACT: 当前采集引擎[ 对象类型: extractor ]

 

DATADB: 当前连接的数据库[ 对象类型: dataBase ]

 

RESULT: 当前结果集对象[ 对象类型: result ]

 

URL: 当前采集的链接对象[ 对象类型: url ]

 

URLTEXT : 描述当前链接采集的所有状态及属性的对象[ 对象类型: urltext ]

 

DOC: 当前采集的文档对象[ 对象类型: grabDoc ]

 

DOM: 当前采集文档的dom对象[ 对象类型: dom ]

 

ITEM: 当前dom树被取值节点[ 对象类型: domItem ]

 

TMPL: 当前文档模板对象[ 对象类型: tmplTmpl ]

 

DATA: 当前数据抽取对象[ 对象类型: tmplData ]

 

REC: 当前记录集对象[ 对象类型: record ]

 

 

 

二.this对象

 

 

 

当前数据字段抽取 [ tmplVal ] 对象。

 

 

 

三.脚本返回值

 

 

 

必须返回获取的数据值 [返回类型:string]

 

 

 

四.示例

 

 

 

<div class="lumn_left01"><a>商品大类</a>><a><a>商品列表</a>><a>商品品牌</a>></div>

                                            【网页源码】

 

 

 

以下脚本将取数据中所有文本:

 

return DOM.GetTextAll(DOM.FindClass("lumn_left01",div));

取出的结果为:

 

商品大类>商品列表>商品品牌>

 

注释:

 

GetTextAll:取出其中所有的文本。      

 

FindClass:通过标签class属性值查找标签节点。        

 

Right: 返回字符串右边的字符串。     

 

 

 

以下脚本直接取值为当前的dom节点所有文本:

 

return DOM.GetText(ITEM);

 

分享到:
评论

相关推荐

    Activiti 5.22.0数据库表结构(21张表全部表和字段中文注释和取值说明)

    1、21张表全部表和字段中文注释和取值说明建表脚本(单SQL文件) 2、21张表全部表和字段中文注释和取值说明添加注释脚本(单SQL文件) 3、21张表全部表和字段中文注释和取值说明添加注释脚本(一表一SQL文件) 自己...

    kettle通过java脚本获取数据库的值

    kettle通过java脚本获取数据库的值..................................................................

    通过groovy自定义函数实现提取明细表字段至主表字段.rar

    通过观看"通过groovy自定义函数实现提取明细表字段至主表字段.mp4"视频教程,我们可以深入学习如何在实际环境中应用这些知识点,逐步构建并优化这个功能。学习和掌握Groovy自定义函数的使用,不仅可以提升工作效率,...

    Linux-定期清内存缓存-shell脚本

    - 配置格式为`分钟 小时 日期 月份 星期 命令`,其中每个字段都有特定的取值范围。 通过以上分析,我们可以了解到如何编写和执行一个简单的shell脚本来定期清理Linux系统的内存缓存,以及如何使用crontab来自动化...

    linux环境定时执行程序或者脚本的方法

    例如,以下是一个示例定时任务,它在每天的凌晨1点执行`backup.sh`脚本: ```bash 0 1 * * * /path/to/backup.sh ``` 在设置`cron`任务时,务必注意时间格式的正确性,并确保要执行的命令或脚本路径是准确无误的。...

    LoadRunner参数化取值与连接数据库

    例如,创建一个简单的脚本: ```cpp Action() { lr_eval_string("{testParam}"); return 0; } ``` 在脚本中,我们通过右键点击参数,选择参数属性,然后使用Data Wizard来配置数据库连接。选择“Spectify SQL ...

    数据库脚本

    通过以上分析,我们可以看到数据库脚本不仅定义了表结构,还设置了必要的约束来确保数据的完整性和一致性,同时添加了对字段的注释以增强代码的可读性。这对于后续的数据管理和维护都是非常有帮助的。

    TD工作流定制基础指南

    - **用途**:此向导主要用于设置“Primary/Secondary规则”,即根据某个字段(主字段)的取值来动态改变另一个字段(次字段)的下拉列表选项。 - **操作步骤**: 1. **选择字段**:首先选择主字段和次字段。 2. ...

    Linux下定时执行脚本.docx

    时间字段的取值范围是: - 分钟:0-59 - 小时:0-23 - 日期:1-31 - 月份:1-12 - 星期:0-7,0和7都代表周日 星号(*)代表所有可能的值,斜线(/)用于设定步进值,例如`*/3`表示每三单位执行一次。`run-parts`...

    Powerdesigner字段备注导入到数据库

    备注可以包括字段的业务含义、取值范围、数据格式、限制条件等,对后期的维护和扩展非常有帮助。 3. **在PowerDesigner中添加字段备注** 在PowerDesigner的物理数据模型中,用户可以为每个表和字段设置详细的属性...

    crontab实现每隔多少天执行一次脚本的两种方法

    1. 创建一个名为 `running.sh` 的辅助脚本,用于判断执行条件并执行目标脚本: ```bash INTERVAL=27 LAST_RUN_DATE=$(cat /path/to/last_run_date.txt 2&gt;/dev/null || echo "0") CURRENT_DATE=$(date +%s) if ...

    数据质量检查策略.doc

    此脚本用于查找指定表中特定字段为空或包含空格、null的记录。 **规范性检查**: 规范性检查关注数据的格式和长度是否符合预设标准,以保持数据的一致性。检查内容包括: 1. 数据格式验证:确保数据按照既定的格式...

    crontab定时任务服务详解.docx

    可以在命令前加上`&gt;&gt; /var/log/cron.log 2&gt;&1`将输出重定向到日志文件中。 6. **系统负载过高**:在系统负载非常高时,Crontab可能会延迟执行任务。确保系统的资源足够处理所有任务。 #### 五、总结 通过上述内容...

    mysql中造3千条数据(3种方法)

    3. 设置每个字段的取值规则,例如,`name` 字段可以从 `animal` 表中随机取值。 4. 清空 `pet` 表,使用 `DELETE from pet;` 命令。 5. 执行生成数据命令,查看执行时间。 6. 查看生成的数据,使用 `SELECT COUNT(*)...

    jquery validation验证表单插件

    **常见校验器及其取值** - `required`:字段必须有值。 - `digits`:字段值只能包含数字。 - `minlength`:字段值的最小长度。 - `maxLength`:字段值的最大长度。 - `email`:字段值必须符合电子邮件格式。 - `...

    crontab shell linux

    Crontab配置文件的每一行都由六个字段组成,每个字段之间用空格分隔: ``` 分钟 小时 日期 月份 星期 命令 ``` - **分钟**:取值范围为0-59。 - **小时**:取值范围为0-23。 - **日期**:取值范围为1-31,可以指定...

    ESK数据交换平台之拍拍接口.doc

    - **增加映射字段**:细化映射字段的设置,如表名、主键名、取值主键名等。 - **设置参数**:进一步配置模型参数,确保数据传输的准确性。 - **设置执行脚本**:定义数据转换完成后执行的操作脚本。 - **调试...

    《SQL Server 2000数据库基础与应用》测试题二.doc

    7. **字段取值限制**:在SQL中,保证字段取值不低于800元的最直接方法是在创建表时为"工资"字段建立检查约束,选项B。检查约束允许定义列值的合法性规则。 8. **字符串连接**:在SQL Server中,Select语句中用来...

Global site tag (gtag.js) - Google Analytics