锁定老帖子 主题:Lucene-2.0学习文档(1)
该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2006-12-27
最近一年一直在搞搜索,我来谈谈体会吧 1、lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题 2、不建议用多线程来建索引,产生的互锁问题很麻烦。经常发现索引被lock,无法重新建立的情况 3、中文分词是个大问题,目前免费的分词效果都很差。如果有能力还是自己实现一个分词模块,用最短路径的切分方法,网上有教材和demo源码,可以参考。 4、建增量索引的时候很耗cpu,在访问量大的时候会导致cpu的idle为0 5、默认的评分机制不太合理,需要根据自己的业务定制
整体来说lucene要用好不容易,必须在上述方面扩充他的功能,才能作为一个商用的搜索引擎 |
|
返回顶楼 | |
发表时间:2006-12-28
方世玉 写道: 整体来说lucene要用好不容易,必须在上述方面扩充他的功能,才能作为一个商用的搜索引擎 |
|
返回顶楼 | |
发表时间:2007-02-01
楼主,你写的示例代码有问题哦,光是关闭了writer你还没有优化了,不然的话效率很低的!!!//优化索引
fsWriter.Optimize(); fsWriter.Close(); |
|
返回顶楼 | |
发表时间:2007-08-27
这篇文章我怎么在csdn上看到过啊
|
|
返回顶楼 | |
发表时间:2007-08-27
2.0的确现在还没有什么好的中文参考资料。。所以公司的网站还没敢换上
上次替换了一部分出了一些问题 。。还在解决中 |
|
返回顶楼 | |