IWorkloadStorable接口:
Spider的主要工作之一就是处理访问过的和将要访问的站点的列表,称为作业。IWorkloadStorable接口定义的对象就可以存入和取出作业中的网页.
最主要的两个方法:
public String assignWorkload();//取出作业里的网页
public void addWorkload(String url);//向作业里存入网页;
除此以外,还有其他的一些方法和成员变量:
1. package com.heaton.bot;
2.
3. /**
4. * This interface defines a class that can
5. * be used to store a spider's workload(作业).
6. * The Bot package currently supports two
7. * different workload stores:
8. *
9. * SpiderInternalWorkload - Stores the
10. * contents of the workload in memory.
11. *
12. * SpiderSQLWorkload - Stores the contents
13. * of the workload in an SQL database.
14. */
15. public interface IWorkloadStorable {
16.
17. /**
18. * A workload entry has a status of running
19. * if the spider worker is opening or downloading
20. * that page. This state usually goes to COMPLETE
21. * or ERROR.
22. */
23. public static final char RUNNING = 'R';
24.
25. /**
26. * Processing of this URL resulted in an
27. * error.
28. */
29. public static final char ERROR = 'E';
30.
31. /**
32. * This URL is waiting for a spider
33. * worker to take it on.
34. */
35. public static final char WAITING = 'W';
36.
37. /**
38. * This page is complete and should not
39. * be redownloaded.
40. */
41. public static final char COMPLETE = 'C';
42.
43. /**
44. * The status is unknown.
45. */
46. public static final char UNKNOWN = 'U';
47.
48. /**
49. * Call this method to request a URL
50. * to process. This method will return
51. * a WAITING URL and mark it as RUNNING.
52. *
53. * @return The URL that was assigned(指定,分配).
54. * 相当于getworkload()。
55. */
56. public String assignWorkload();
57.
58. /**
59. * Add a new URL to the workload, and
60. * assign it a status of WAITING.
61. *
62. * @param url The URL to be added.
63. */
64. public void addWorkload(String url);
65.
66. /**
67. * Called to mark this URL as either
68. * COMPLETE or ERROR.
69. *
70. * @param url The URL to complete.
71. * @param error true - assign this workload a status of ERROR.
72. * false - assign this workload a status of COMPLETE.
73. */
74. public void completeWorkload(String url,boolean error);
75.
76. /**
77. * Get the status of a URL.
78. *
79. * @param url Returns either RUNNING, ERROR
80. * WAITING, or COMPLETE. If the URL
81. * does not exist in the database,
82. * the value of UNKNOWN is returned.
83. * @return Returns either RUNNING,ERROR,
84. * WAITING,COMPLETE or UNKNOWN.
85. */
86. public char getURLStatus(String url);
87.
88. /**
89. * Clear the contents of the workload store.
90. */
91. public void clear();
92. }
93.
其他几个方法不是常用到,倒是那几个状态变量可以留作理清思路之用。
That‘s OK!
分享到:
相关推荐
java网络蜘蛛源码发展套件 ...IWorkloadStorable Link Log Recognize RecognizeCountry RecognizeLink Spider SpiderInternalWorkload SpiderSQLWorkload SpiderWorker URLUtility
修炼成Javascript中级程序员必知必会_资源分享
内容概要:本文详细介绍了如何使用MATLAB的深度学习工具箱,在果树病虫害识别任务中从数据准备、模型设计、训练优化到最后的模型评估与应用全流程的具体实施步骤和技术要点。涵盖了MATLAB深度学习工具箱的基本概念及其提供的多种功能组件,如卷积神经网络(CNN)的应用实例。此外,文中还具体讲述了数据集的收集与预处理方法、不同类型的深度学习模型搭建、训练过程中的超参数设定及其优化手段,并提供了病虫害识别的实际案例。最后展望了深度学习技术在未来农业领域的潜在影响力和发展前景。 适合人群:对深度学习及农业应用感兴趣的科研人员、高校师生和相关从业者。 使用场景及目标:①希望掌握MATLAB环境下构建深度学习模型的方法和技术细节;②从事果树病虫害管理研究或实践,寻找高效的自动化解决方案。 阅读建议:在阅读本文之前,建议读者熟悉基本的MATLAB编程环境及初步了解机器学习的相关概念。针对文中涉及的理论和技术难点,可以通过官方文档或其他教程进行补充学习。同时,建议动手实践每一个关键点的内容,在实践中加深理解和掌握技能。
nodejs010-nodejs-block-stream-0.0.7-1.el6.centos.alt.noarch.rpm
机械模型与技术交底书的融合:创新点详解与解析,机械模型加技术交底书,有创新点 ,机械模型; 技术交底书; 创新点,创新机械模型与技术交底书详解
免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
nodejs010-nodejs-cmd-shim-1.1.0-4.1.el6.centos.alt.noarch.rpm
西门子四轴卧加后处理系统:828D至840D兼容,四轴联动高效加工解决方案,支持图档处理及试看程序。,西门子四轴卧加后处理,支持828D~840D系统,支持四轴联动,可制制,看清楚联系,可提供图档处理试看程序 ,核心关键词:西门子四轴卧加后处理; 828D~840D系统支持; 四轴联动; 制程; 联系; 图档处理试看程序。,西门子四轴卧加后处理程序,支持多种系统与四轴联动
基于黏菌优化算法(SMA)的改进与复现——融合EO算法更新策略的ESMA项目报告,黏菌优化算法(SMA)复现(融合EO算法改进更新策略)——ESMA。 复现内容包括:改进算法实现、23个基准测试函数、多次实验运行并计算均值标准差等统计量、与SMA对比等。 程序基本上每一步都有注释,非常易懂,代码质量极高,便于新手学习和理解。 ,SMA复现;EO算法改进;算法实现;基准测试函数;实验运行;统计量;SMA对比;程序注释;代码质量;学习理解。,标题:ESMA算法复现:黏菌优化与EO算法融合改进的实证研究
基于MATLAB的Stewart平台并联机器人仿真技术研究与实现:Simscape环境下的虚拟模拟分析与应用,MATLAB并联机器人Stewart平台仿真simscape ,MATLAB; 并联机器人; Stewart平台; 仿真; Simscape; 关键技术。,MATLAB中Stewart平台并联机器人Simscape仿真
Grad-CAM可视化医学3D影像
探索comsol泰勒锥:电流体动力学的微观世界之旅,comsol泰勒锥、电流体动力学 ,comsol泰勒锥; 电流体动力学; 锥形结构; 电场影响,COMSOL泰勒锥与电流体动力学研究
免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
PFC6.03D模型动态压缩模拟与SHPB霍普金森压杆系统理论及实验数据处理技术解析,PFC6.03D模型,动态压缩模拟,还包括: SHPB霍普金森压杆系统理论知识介绍,二波法和三波法处理实验数据,提出三波波形,计算动态压缩强度等 ,PFC模型; 动态压缩模拟; SHPB霍普金森压杆系统; 理论介绍; 二波法处理; 三波法处理; 三波波形; 动态压缩强度。,"PFC模型下的动态压缩模拟及SHPB理论实践研究"
ProASCI 开发板原理图,适用于A3P3000
免费JAVA毕业设计 2024成品源码+论文+录屏+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
1、文件内容:pykde4-devel-4.10.5-6.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/pykde4-devel-4.10.5-6.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装
基于Comsol模拟的三层顶板随机裂隙浆液扩散模型:考虑重力影响的瞬态扩散规律分析,Comsol模拟,考虑三层顶板包含随机裂隙的浆液扩散模型,考虑浆液重力的影响,模型采用的DFN插件建立随机裂隙,采用达西定律模块中的储水模型为控制方程,分析不同注浆压力条件下的浆液扩散规律,建立瞬态模型 ,Comsol模拟; 随机裂隙浆液扩散模型; 浆液重力影响; DFN插件; 达西定律模块储水模型; 注浆压力条件; 浆液扩散规律; 瞬态模型,Comsol浆液扩散模型:随机裂隙下考虑重力的瞬态扩散分析
A simple fast, easy use distributed file system written by golang(similar fastdfs).go-fastdfs