文章列表
这几天没事就在折腾hertrix,因为毕设就是做搜索引擎的。以前也没接触过这方面的东西,所以就按指导老师的推荐借了几本搜苏引擎的书在家看。然后首先就按《开发自己的搜苏引擎Lucene2.0+Hertrix》来玩Heritrix来抓。首先想偷懒就直接在verycd上找了那本书的光碟直接把作者配置好的heritrix项目导到自己的Myeclipse里运行,然后完全按着书上的步骤一步一步配置,结果配置好了点start,抓取总是显示30 queued等了半个小时还没抓到一个网页。 。到了第二晚上又继续奋战,去网上找别人的配置过程,然后每个每个的试,但还是出现那老问题。我怀疑可能原书配置好 ...