论坛首页 Java企业应用论坛

全文检索 方案比较

浏览 12896 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2011-05-23  
gougou851129 写道
直接用nutch好了
基于lucen,整合hadoop
调研不足啊

接触过nutch,当时主要用它的爬虫及与lucene集成的功能....既然要整合hadoop,就不需要nutch了,hadoop已经脱离nutch.
0 请登录后投票
   发表时间:2011-05-23  
魔力猫咪 写道
如果可以的话,直接DB全文检索索引不成吗?应该足够应付需要了吧?

DB全文检索,弊端较多.
倒是DB2 提供了NSE 全文检索功能,目前正在研究.
0 请登录后投票
   发表时间:2011-05-23  
kimmking 写道
andyao 写道
建议你深入了解一下solr,提供很多特性,比如:
Cache
Replication
Auto Suggest
Faceted Query
等等
而且有商业公司Lucidworks支持,有非常多的成功案例

在企业搜索领域,目前没有看到比solr更好的开源解决方案。

我们表示 solr很棒~


我表示,已经在下载solr了
0 请登录后投票
   发表时间:2011-05-23  
liuyupy 写道

是企业内部论坛,其索引的更新与查询频率较低(无非主题帖和回帖),且数据量不大(后期也很难超过1G)

 

这个需要做分布式索引么,我觉得直接Lucene单点解决。

0 请登录后投票
   发表时间:2011-05-23   最后修改:2011-05-23
太多了。  
0 请登录后投票
   发表时间:2011-05-23  
riching 写道
katta

说点题外话,katta很久没有更新,而且katta的架构我不觉得好,
如果真需要分布式的场景,我更愿意选择 elasticsearch http://www.elasticsearch.org/
0 请登录后投票
   发表时间:2011-05-23  
solr很好,很强大,我已经成功应用了一个按钮,效果很ok
0 请登录后投票
   发表时间:2011-05-23  
直接用nutch好了
基于lucen,整合hadoop
调研不足啊
0 请登录后投票
   发表时间:2011-05-23  
对lucence了解一点点,学习了
0 请登录后投票
   发表时间:2011-05-23  
方案四倒是可行。目前krugle是基于方案四实现的代码搜索。
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics