数据抽取脚本与数据过滤并列的脚本,它的作用是对抽取的数据进行过滤。数据处理脚本是数据抽取中的脚本。点击“数据抽取”节点,在“数据脚本”的下拉菜单必须选择“数据抽取脚本”。配置了数据处理脚本,数据的抽取流程将被改变:
1.如果脚本未正确返回dom区域节点,则该数据抽取的规则将完全由该脚本控制。
2.如果脚本返回了一个正确的dom区域节点,则此数据抽取以返回的区域节点为基准,区域外的数据则优先当做垃圾信息处理。
注意:一旦有了数据抽取脚本则数据过滤脚本将失效,即“数据脚本”的下拉菜单必须选择“数据抽取脚本”。
一.可用全局对象(只读)
EXTRACT: 当前采集引擎[ 对象类型: extractor ]
DATADB: 当前连接的数据库[ 对象类型: dataBase ]
RESULT: 当前结果集对象[ 对象类型: result ]
URL: 当前采集的链接对象[ 对象类型: url ]
URLTEXT : 描述当前链接采集的所有状态及属性的对象[ 对象类型: urltext ]
DOC: 当前采集的文档对象[ 对象类型: grabDoc ]
DOM: 当前采集文档的dom对象[ 对象类型: dom ]
ITEM: 模板区域的dom树节点(如果模板未选择区域则为dom树的根节点)[ 对象类型: domItem ]
TMPL: 当前文档模板对象[ 对象类型: tmplTmpl ]
REC: 当前记录集对象[ 对象类型: record ]
二.this对象
当前数据抽取[tmplData]对象
三.脚本返回值
如果欲采集某个特征区域内的数据,则必须返回该区域的dom节点对象( domItem对象); 否则该数据抽取则完全由脚本控制。
示例
在数据模板表单各字段的区域特征定位无法取值时,就要写数据抽取脚本。
1.数据抽取脚本基本的样式
2.采集第一个Form表单中的数据
相关推荐
Linux Shell脚本教程:30分钟玩转Shell脚本编程 _
Wincc与Excel数据集交互:全脚本实现快速查询数据,提高数据检索效率无需每次都加载Excel文件,WinCC与Excel数据交互的全脚本实现:提高数据查询速度的自动化查询方式,wincc与Excel数据交互,全脚本实现,根据条件...
水箱水位温度MCGS嵌入版7.7动画仿真脚本程序:实时数据与历史报表曲线综合展示系统动态与价格概况,**水箱水位与温度监控系统:MCGS嵌入版脚本程序动画仿真,历史与实时数据报表及曲线分析工具**,水箱水位温度MCGS...
### Installshield 脚本代码:卸载时杀掉进程 在软件开发和部署过程中,安装程序(如Installshield)的脚本编写是一项重要的技能。本文将深入探讨一个具体的脚本示例,该脚本旨在在卸载软件时终止特定进程。通过...
### ArcGIS教程:脚本环境 #### 知识点概览 1. **脚本工具中的环境设置原理** 2. **环境值的应用机制** 3. **脚本内环境设置覆盖方法** 4. **ArcPy环境处理函数介绍** 5. **独立脚本与被调用脚本的环境设置** ####...
Unity3D教程:制作简单小汽车游戏 OnGUI的视觉化编辑 unity3d角色血条 Unity3D格斗游戏运动特效 MenuItem自定义菜单项 Unity3D脚本:导弹追踪代码 Unity3D教程:UI自动适合屏幕分辨率 中慢动作与加速动作的实现 ...
"新能源汽车电机标定数据处理脚本:基于MTPA与弱磁控制的三维表制作与数据可视化",新能源汽车电机标定数据处理脚本 mtpa,弱磁 电机标定数据处理脚本,可用matlab2021打开,用于处理电机台架标定数据,将台架标定的...
3. 数据查询:省市区数据脚本需要提供高效的数据查询功能,以便用户可以方便地查询到某个特定区域的详细信息,或者根据不同的关键字(如邮编、区号、名称等)查询相关区划数据。 4. 数据更新与维护:行政区划会随着...
Wincc与Excel数据交互全脚本实现:条件自动查询,数据集方式提高查询速度.pdf
《经典Windows脚本教程》是一份由微软官方提供的宝贵学习资源,主要涵盖了VBS(Visual Basic Script)和JS(JavaScript)在Windows环境下的脚本编程技术。这些脚本语言在系统自动化、任务调度、网页交互等多个领域都...
脚本将读取CSV文件中的数据,并使用Matplotlib库创建一个柱状图,显示每个产品的销售额。图形将在一个新的窗口中显示。 如果需要,可以取消注释plt.savefig('sales_bar_chart.png')行,将图形保存为PNG图片文件。
《WinCC 全套脚本总结:实现与第三方设备数据交互》 WinCC,全称为SIMATIC WinCC,是西门子推出的一款人机界面(HMI)软件,用于监控和控制工业自动化系统中的过程变量。在WinCC中,脚本功能是一个强大的工具,它...
管道则可以连接多个命令,让前一个命令的输出成为后一个命令的输入,形成数据流的处理链。 函数和数组也是Shell脚本中不可或缺的部分。函数能实现代码复用,提高效率,而数组则允许我们存储一组相关的值,方便处理...
### FileMaker高级教程:脚本 #### 重要性与作用 在FileMaker Pro软件中,脚本是一项极其重要且强大的工具。它使开发者能够创建自动化的任务流程,从而极大地提高工作效率并减少人为错误。通过本章节的学习,我们...
中文脚本教程针对的是那些希望在RouterOS环境中使用中文进行脚本编程和系统管理的用户。本教程旨在帮助这些用户理解和掌握RouterOS中的命令行接口(CLI)以及其内置的脚本语言—— RouterOS Scripting Language(RSC...
**C语言中文网shell脚本教程** 这是一份关于Shell脚本编程的离线学习资料,包含了一系列HTML文件,旨在帮助用户深入理解并掌握Linux Shell脚本编程技术。以下是其中涉及的一些关键知识点: 1. **Shell命令的本质**...
《Windows脚本教程》是一本全面介绍Windows操作系统中脚本技术的权威指南,主要针对的是批处理脚本(Batch Scripting)和Windows PowerShell脚本。CHM格式是Microsoft的 Compiled HTML Help,通常用于电子手册或文档...
本文将详细介绍如何使用Logstash结合Ruby脚本来从MongoDB和MySQL数据库中抽取数据。 首先,我们来看`mongodb.rb`脚本。这是一个Logstash插件,通常用于定义如何从MongoDB中提取数据。MongoDB是一个流行的NoSQL...
请注意,一旦删除元数据,一些关于图像的信息将永久丢失,因此在执行此操作前应备份原始文件。 6. 脚本处理完成后,保存修改过的图像文件。你可以选择以不同的格式保存,如JPEG或PNG,以进一步压缩文件大小。 通过...