- 浏览: 11625 次
- 性别:
- 来自: 长沙
最新评论
-
a_10jqka_2010:
博主,说话很诚恳,这让我敬重。
至于你说得阶段,不知是指什么层 ...
关于网络机器人(蜘蛛程序)的一些分析 -
wb17534806:
a_10jqka_2010 写道大家的思路怎么都这样,难道就没 ...
关于网络机器人(蜘蛛程序)的一些分析 -
a_10jqka_2010:
大家的思路怎么都这样,难道就没有想过做点索引追踪的事情?别光站 ...
关于网络机器人(蜘蛛程序)的一些分析 -
rickwang:
leon0122 写道计算机水平:国家劳动和社会保障部的“软件 ...
指点下我的个人简历(多多批评) -
dopic:
我看不惯newer的,很垃圾,一次我陪同学去看,还做了试卷,拿 ...
指点下我的个人简历(多多批评)
文章列表
Apache+tomcat实现负载均衡
集群背景介绍
术语定义
服务软体是b/s或c/s结构的s部分,是为b或c提供服务的服务性软件系统。
服务硬体指提供计算服务的硬件、比如pc机、pc服务器。
服务实体通指服务软体和服务硬体。
...
Heritrix在Windows下的运行
作者:wans 日期:2009-12-15
大家还是下载吧!编辑内容太伤脑筋了。。。保护脑细胞要紧!
我的人生就像茶几,上面摆满了杯具!
Lucene学习文档
索引
何谓索引:
1.从理论的角度理解:索引时一个单独的、物理的数据结构,它是某个表中一列或若干列值的集合、和相应的 指向表中物理标识这些值的 数据页的 逻辑指针清单。
2.从通俗的角度理解: 如果以上暂时不能理解,那你可以认为这也是一个单一的数据库,为了提高检索速度或其他原因,新建的一个简单的数据存储空间。
建立索引的优点
1.大大加快数据的检索速度;
什么是网络机器人
网络机器人又称为Spider程序,是一种专业的Bot程序。用于查找大量的Web页面。它从一个简单的Web页面上开始执行,然后通过其超链接在访问其他页面,如此反复理论上可以扫描互联网上的所有页面。
基于因特网的搜索引擎是Spider的最早应用。例如搜索巨头Google公司,就利用网络机器人程序来遍历Web站点,以创建并维护这些大型数据库。
网络机器人还可以通过扫描Web站点的主页来得到这个站点的文件清单和层次机构。还可以扫描出中断的超链接和拼写错误等。
网络机器人的结构分析
- 2009-12-05 17:15
- 浏览 1950
- 评论(3)
一个简单的蜘蛛程序,没有实现多线程,只考虑了一些特定的情况。
一句话:一切从简!
下载提供测试页面。
源码:
package com.wans.spider;
import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.HttpURLC ...
- 2009-12-05 17:04
- 浏览 1747
- 评论(0)
网络蜘蛛程序学习1
Bot程序:一种“有意识”的Internet程序,能从指定的Internet站点上检索信息。有人叫这个为:网络机器人。
例如:桌面应用程序会检查邮箱邮件,有新邮件会自动提醒。但是Bot程序是否合法?有些网站明令禁止,比如:股票站点。所以,作为Bot程序搜索必须合法。
Spider程序:一种专业化的Bot程序,用于查找大量的Web页面,
- 2009-12-05 16:32
- 浏览 1482
- 评论(0)
学校里的学习已经结束,但是学习还没有结束!
知识,温故而知新!
oracle10g--------1个月
java--------《thinking in java》2遍
jsp--------《jsp技术手册》
struts1.x and struts2.x--------one month
hibernate--------Time for half a month
spring--------Time for half a month
按时完成!加油!
- 2009-07-21 16:47
- 浏览 922
- 评论(0)