`
edwardpro
  • 浏览: 310115 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

lucene的前端集群思路

阅读更多

你的搜索可以集群吗(这里单指前端应用集群)?这是一个突然发来的问题。。。其实lucene说实话什么都好就是集群不方便。。。

查看了些资料基本上做集群都是利用系统的集群文件系统等实现的,这个效率不会好。

突然我觉得可以这样的结构来做集群:

一台单机做索引,索引文件存在这台物理机上

然后利用nfs将索引文件映射到多台前端子机,子机将nfs的内容用RAMDirectory读到内存索引中,然后子机各自使用web服务提供前台访问

前端再使用集群服务器实现前台的集群

当索引更新的时候可使用jms通知子机及时同步nfs和RAMDirectory的内容

不过这样对服务器有些限制,比如: 索引量不能很大,无限大需要无限大的内存支持,这严重地限制了索引增长,但大多数应用还是可实现的,一个几G的索引已经不小了。

2
2
分享到:
评论
3 楼 yuling1217 2008-04-28  
最近做收索看了看lucene的源码,觉得很不好啊,首先说来不支持中文字典的分词,另外国内有几个关于中文分词的可以称为lucene的小插件吧,也不够商业话,当然一般企业小应用还是可以的。
  另外查看lucene的源码后发现很多地方都不够优化,问题多多哦
2 楼 johnnyhg 2008-04-21  
将索引分类,然后分放到不同的机器上,是不是也可以达到同样的效果。
1 楼 grantbb 2008-04-19  
你的方案还是有道理的,不过nfs的速度和可靠性也要评估。
索引太大了,使用RAMDirectory确实会很慢。

相关推荐

    lucene,lucene教程,lucene讲解

    lucene,lucene教程,lucene讲解。 为了对文档进行索引,Lucene 提供了五个基础的类 public class IndexWriter org.apache.lucene.index.IndexWriter public abstract class Directory org.apache.lucene.store....

    lucene3.0 lucene3.0

    lucene3.0 lucene3.0 lucene3.0 lucene3.0 lucene3.0

    Annotated Lucene 中文版 Lucene源码剖析

    在实际应用中,Lucene通常与其他框架或库结合使用,例如Solr和Elasticsearch,它们提供了更高级的服务,如分布式搜索、集群管理和RESTful API。通过阅读《Annotated Lucene 中文版 Lucene源码剖析》,读者不仅能掌握...

    计算机专业外文翻译(lucene相关)

    向外扩展是指使用多个小相互服务器应用程序的部署,网络集群,例如谷歌、雅虎、eBay、亚马逊等公司使用向外扩展解决方案。 Lucene相关 论文中研究了一个新兴的商业应用,非结构化数据的检索,使用了Lucene搜索...

    Java搜索引擎 Lucene

    在实际应用中,Lucene通常与Solr或Elasticsearch等工具结合使用,以提供更高级的功能,如集群管理、分布式搜索、实时索引和更丰富的搜索特性。这些工具在Lucene的基础上添加了更多管理和扩展功能,使搜索解决方案...

    lucene全文搜索ajax例子

    在这个压缩包中,你可能会找到如`index.jsp`(前端页面)、`search.java`(后端处理搜索请求的Java类)、`Analyzer配置`(用于定制分词规则)、`索引文件`(由Lucene创建的存储搜索数据的文件)等组件。 总的来说,...

    lucene-4.7.0全套jar包

    【Lucene 4.7.0 全套JAR包详解】 Lucene是一个开源全文搜索引擎库,由Apache软件基金会开发并维护。它提供了一个高级、灵活的文本搜索API,允许开发者轻松地在应用程序中实现复杂的搜索功能。这次提供的“lucene-...

    lucene in action英文版 lucene 3.30包

    《Lucene in Action》是关于Apache Lucene的权威指南,这本书深入浅出地介绍了全文搜索引擎的构建和优化。Lucene是一个高性能、全文本搜索库,它允许开发人员在应用程序中轻松实现复杂的搜索功能。这本书主要面向...

    Lucene3.5源码jar包

    本压缩包包含的是Lucene 3.5.0版本的全部源码,对于想要深入理解Lucene工作原理、进行二次开发或者进行搜索引擎相关研究的开发者来说,是一份非常宝贵的学习资源。 Lucene 3.5.0是Lucene的一个重要版本,它在3.x...

    lucene包,lucene实现核心代码

    - 高级用户可以使用Solr或Elasticsearch,它们基于Lucene,提供了分布式搜索、集群管理和更多高级特性。 在"lucensetest"文件中,可能是包含一些测试代码,用于演示如何使用上述组件和类来建立索引、执行搜索以及...

    Lucene时间区间搜索

    Lucene是一款强大的全文搜索引擎库,广泛应用于各种数据检索场景。在C#环境下,利用Lucene进行时间区间搜索是提高数据检索效率和精确度的重要手段。本篇将深入探讨如何在C#中实现Lucene的时间区间查询匹配,以及涉及...

    Lucene简介.介绍

    【Lucene 简介】 Lucene 是一个强大的开源全文搜索库,由 Java 编写,主要用于为应用程序添加全文检索功能。它不是一个完整的全文搜索引擎应用,而是一个工具包,允许开发者将其集成到自己的软件中,以实现高效、...

    springmvc集成lucene全文搜索

    同时,可以在Controller层创建一个接口,接收用户的搜索请求,调用搜索引擎进行查询,并将结果返回给前端。 7. **优化性能**:根据需求考虑使用倒排索引、分词器的选择、缓存策略等手段来提高搜索性能。 8. **实时...

    Lucene示例 BM25相似度计算

    在IT领域,搜索引擎技术是至关重要的,而Lucene作为一个开源全文搜索引擎库,广泛应用于各种文本检索系统中。本文将深入探讨Lucene示例中的BM25相似度计算,旨在帮助初学者理解如何利用Lucene 4.7.1版本构建索引、...

    lucene 2.0 api以及lucene 3.0 api

    **Lucene 2.0 API 和 Lucene 3.0 API 深度解析** Lucene 是一个由 Apache 软件基金会开发的全文搜索引擎库,它为开发者提供了在 Java 应用程序中实现高性能、可扩展的全文搜索功能的能力。Lucene 的 API 设计得相当...

    LUCENE的搜索引擎例子

    在IT行业中,Lucene是一个非常重要的开源全文搜索引擎库,由Apache软件基金会开发并维护。本篇文章将深入探讨如何在B/S(浏览器/服务器)架构下利用Lucene实现一个简单的搜索引擎实例。 首先,我们需要了解Lucene的...

    Weblucene 站内搜索

    - **集成API**:在你的网站后端代码中,调用Weblucene的API进行搜索请求,获取结果后返回给前端展示。 - **优化与调整**:根据实际效果,可能需要调整分词策略、评分算法等,以提高搜索质量和速度。 **4. 进阶使用*...

    Lucene的原理完整版pdf

    **Lucene原理详解** Lucene是一个高性能、全文检索库,由Apache软件基金会开发并维护,是Java编程语言中广泛使用的搜索引擎库。它提供了一个简单但功能强大的API,用于索引和搜索文本数据,使得开发者可以轻松地在...

    lucene所有的jar包

    《全面解析Lucene jar包:从基础到应用》 在信息技术高速发展的今天,搜索引擎已经成为我们获取信息不可或缺的工具。在Java领域,Lucene作为一个强大的全文搜索引擎库,深受开发者喜爱。本文将详细介绍“lucene所有...

    Lucene资料大全(包括Lucene_in_Action书等)

    标题"Lucene资料大全(包括Lucene_in_Action书等)"表明这是一个包含全面Lucene学习资源的集合,其中最显著的是《Lucene_in_Action》这本书。这是一本广泛认可的关于Apache Lucene的权威指南,通常被简称为LIA,它深入...

Global site tag (gtag.js) - Google Analytics