论坛首页 Java企业应用论坛

Lucene搜索方法总结

浏览 36693 次
精华帖 (1) :: 良好帖 (7) :: 新手帖 (2) :: 隐藏帖 (4)
作者 正文
   发表时间:2010-01-20  
summerbell 写道
sonyfe25cp 写道
同样不能看lz给的更多内容的链接..
你给的链接是不是你编辑文章时候的那个链接?而不是发布之后的?(猜测...)

lz 能不能讲解下 RemoteSearchable 这个相关使用?
对lz的分布式搜索比较感兴趣~~

谢谢~


链接问题是我自己大意了~已修正。
至于RemoteSearchable,lucene java项目自己是没有提供的。
据说可以采用分布式文件系统,如Hadoop中的HDFS。
另一个很直观的做法就是自己写一个分布式通信系统,轮询多台存放lucene索引的节点,并整合每个节点返回的结果作为最后的搜索结果。

我自己使用的是最偷懒的做法,放弃了lucene java,而转用mysql的全文检索功能。这样每个mysql数据库维护一套索引,用的时候直接查就好,通信系统mysql自带了。我觉得mysql比lucene唯一有缺陷的地方在于mysql没有一个很好的评级公式,来计算文档与查询的相关度。不过我们可以自己实现该评级公式,仿造lucene或者原创一个。效果也挺好的。

主要因为我在实验室里,对性能什么要求不高,少写代码多办事是王道。

细节就比较麻烦了,大概思路是这样,多多交流了。



hdfs曾经考虑过..由于种种原因而搁置.
现在研究lucene自带的各种remoteSearch..
跟lz情况恰好相反...我在实验室做导师的工程项目..要求性能、并发,事就那么多..怎么快怎么来..

多多交流~~

0 请登录后投票
   发表时间:2010-09-02  
恩,LZ写不错,系统的总结了。
0 请登录后投票
   发表时间:2010-12-02  
请问 lucene 支持附件内容 检索吗,支持的话 用哪个方法可以实现?
0 请登录后投票
   发表时间:2010-12-03  
lijin2031427 写道
请问 lucene 支持附件内容 检索吗,支持的话 用哪个方法可以实现?


附件?我只知道将附件视为一个文本来做,同时与正文关联~
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics