锁定老帖子 主题:全文检索 方案比较
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2011-05-23
gougou851129 写道 直接用nutch好了
基于lucen,整合hadoop 调研不足啊 接触过nutch,当时主要用它的爬虫及与lucene集成的功能....既然要整合hadoop,就不需要nutch了,hadoop已经脱离nutch. |
|
返回顶楼 | |
发表时间:2011-05-23
魔力猫咪 写道 如果可以的话,直接DB全文检索索引不成吗?应该足够应付需要了吧?
DB全文检索,弊端较多. 倒是DB2 提供了NSE 全文检索功能,目前正在研究. |
|
返回顶楼 | |
发表时间:2011-05-23
kimmking 写道 andyao 写道 建议你深入了解一下solr,提供很多特性,比如:
Cache Replication Auto Suggest Faceted Query 等等 而且有商业公司Lucidworks支持,有非常多的成功案例 在企业搜索领域,目前没有看到比solr更好的开源解决方案。 我们表示 solr很棒~ 我表示,已经在下载solr了 |
|
返回顶楼 | |
发表时间:2011-05-23
liuyupy 写道
是企业内部论坛,其索引的更新与查询频率较低(无非主题帖和回帖),且数据量不大(后期也很难超过1G)
这个需要做分布式索引么,我觉得直接Lucene单点解决。 |
|
返回顶楼 | |
发表时间:2011-05-23
最后修改:2011-05-23
太多了。
|
|
返回顶楼 | |
发表时间:2011-05-23
riching 写道 katta
说点题外话,katta很久没有更新,而且katta的架构我不觉得好, 如果真需要分布式的场景,我更愿意选择 elasticsearch http://www.elasticsearch.org/ |
|
返回顶楼 | |
发表时间:2011-05-23
solr很好,很强大,我已经成功应用了一个按钮,效果很ok
|
|
返回顶楼 | |
发表时间:2011-05-23
直接用nutch好了
基于lucen,整合hadoop 调研不足啊 |
|
返回顶楼 | |
发表时间:2011-05-23
对lucence了解一点点,学习了
|
|
返回顶楼 | |
发表时间:2011-05-23
方案四倒是可行。目前krugle是基于方案四实现的代码搜索。
|
|
返回顶楼 | |