论坛首页 Java企业应用论坛

Lucene-2.0学习文档(1)

浏览 26624 次
该帖已经被评为良好帖
作者 正文
   发表时间:2006-12-27  

最近一年一直在搞搜索,我来谈谈体会吧

1、lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题

2、不建议用多线程来建索引,产生的互锁问题很麻烦。经常发现索引被lock,无法重新建立的情况

3、中文分词是个大问题,目前免费的分词效果都很差。如果有能力还是自己实现一个分词模块,用最短路径的切分方法,网上有教材和demo源码,可以参考。

4、建增量索引的时候很耗cpu,在访问量大的时候会导致cpu的idle为0

5、默认的评分机制不太合理,需要根据自己的业务定制

 

整体来说lucene要用好不容易,必须在上述方面扩充他的功能,才能作为一个商用的搜索引擎

0 请登录后投票
   发表时间:2006-12-28  

方世玉 写道:

整体来说lucene要用好不容易,必须在上述方面扩充他的功能,才能作为一个商用的搜索引擎





0 请登录后投票
   发表时间:2007-02-01  
楼主,你写的示例代码有问题哦,光是关闭了writer你还没有优化了,不然的话效率很低的!!!//优化索引
fsWriter.Optimize();
fsWriter.Close();
0 请登录后投票
   发表时间:2007-08-27  
这篇文章我怎么在csdn上看到过啊
0 请登录后投票
   发表时间:2007-08-27  
2.0的确现在还没有什么好的中文参考资料。。所以公司的网站还没敢换上
上次替换了一部分出了一些问题 。。还在解决中
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics