0 0

急求一些搜索引擎的相关技术(不是站内,而是用爬虫的那种!)3

毕业设计需要用Java做搜索引擎,要用到爬虫,而且只爬取网络上一些博客空间的文章(其它东西一概不爬)。

请问要构建这样的搜索引擎,需要用什么技术,Nutch能派上用场吗?爬虫产品好像有很多种(像Heritrix/JSpider/Crawler4j/Ex-Crawler等等),用哪一种比较好?
2010年12月08日 12:51

1个答案 按时间排序 按投票排序

0 0

我用HTMLPARSER ,很方便,而已现在以完成采集所有视频信息的部分,推荐下

2010年12月08日 12:54

相关推荐

Global site tag (gtag.js) - Google Analytics