作者
Ryan Slobojan
译者
崔康
发布于
2008年11月13日 上午7时27分
Apache Solr项目
,是一款基于Apache Lucene
的开源企业搜索服务器,最近发布了1.3版。InfoQ采访了Solr的创建者Yonik Seeley
,了解了新版本的更多信息和Solr提供给最终用户的功能。
Seeley首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr的关键特性包括:
-
基于标准的开放接口
——Solr搜索服务器支持通过XML、JSON和HTTP查询和获取结果。
-
易管理
——Solr可以通过HTML页面管理,服务器统计数据以JMX输出,Solr配置通过XML完成。
-
分面浏览
——搜索结果自动分类。
-
突出显示命中词
——匹配的字符自动在搜索结果中高亮显示。
-
可伸缩性
——快速增量更新和快照分发/复制到其他服务器。
-
灵活的插件体系
——新功能能够以插件
的形式方便的添加到Solr服务器上。
Seeley同时谈到了该版本中的主要新功能:
-
分布式搜索
——索引现在可以透明的分割成多个部分,单个Solr服务器基于各个配置和模式支持多索引,无须停止Solr服务器就可以改动主要的配置。
-
扩展了查询功能
——包含了一个新的Java客户端(SolrJ
)和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
-
增强了数据导入工具
——数据库和其他结构化数据源现在都可以导入、映射和转化。
-
更多可定制扩展点
——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
-
性能增强
——显著提高了索引速度,二进制响应格式和快速查询删除功能。
详细的更新日志可以这里
获得。
Seeley谈到了更多Solr在伸缩性、功能和实用性方面的细节:
Solr已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr应该能够处理数十亿的文档集合。
Solr基于Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。
AOL正在使用Solr增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr的搜索功能也应用于Netflix、 Zappos、Gamespot、和Internet Archive。还有很多
大客户我目前还不能透漏。
关于Solr的未来计划,Seeley提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用Spring配置插件。Seeley同时提供了一个邮件列表
,在那里他详细讨论了Solr未来、特别是2.0版的计划。
分享到:
相关推荐
Apache Solr是基于Lucene的高性能企业级搜索平台,也是目前最受欢迎的企业级搜索解决方案之一。相比Lucene,Solr提供了更丰富的功能集和更好的集群支持能力,适用于大规模数据的实时检索场景。 ##### 2.1 Solr的...
Solr是基于Lucene构建的企业级搜索平台,它为Lucene提供了更高级的API和更易用的管理界面。Solr的核心特性包括: 1. **配置友好**:Solr通过XML配置文件定义索引字段和处理规则,简化了设置过程。 2. **Web服务接口...
5. **Lucene-Solr Grandparent**: `lucene-solr-grandparent.jar` 可能与Solr有关,Solr是基于Lucene的全文搜索引擎服务器,提供了更高级的功能,如集群、分布式搜索、近实时搜索等。这个jar可能包含了与Solr集成的...
1. **Solr和Elasticsearch**:Solr是基于Lucene的开源搜索服务器,提供了更高级的管理和集群功能。Elasticsearch则是在Solr基础上发展起来的分布式搜索和分析平台,更适合大数据量的场景。 2. **分布式搜索**:通过...
Solr是Apache Lucene项目的一个子项目,是一个高性能、全文本搜索服务器,广泛应用于各种大数据检索场景。在4.9版本中,Solr引入了集群功能,以支持高可用性和可扩展性。在这个集群环境中,Tomcat作为Servlet容器...
它能够提供高效、可扩展的搜索和分析功能。为了实现高可用性和负载均衡,通常会将Solr部署在分布式环境中,这就需要用到Zookeeper进行集群协调。而Tomcat作为Java应用服务器,常被用来运行Solr服务器。本文将详细...
Solr的特点包括:高度可扩展性、分布式搜索能力、灵活的数据索引和查询机制等。 #### 二、Solr的安装与配置 ##### 2.1 安装准备 在进行Solr的安装之前,需要准备以下环境: - **操作系统**:推荐使用Linux系统,如...
- **Solr** 是一款开源的企业级搜索平台,基于Lucene库构建而成。它支持高度可扩展且容错性强的搜索服务,并提供了丰富的功能集来满足各种搜索需求。 - **Solr集群** 是指多个Solr实例组成的集合,能够提供高可用性...
Solr是Apache Lucene的一个子项目,是一款高性能、可扩展的搜索和分析平台。它支持全文索引、 faceted search(分面搜索)、实时添加文档等高级功能。在本案例中,Solr集群也是采用伪分布式模式进行安装,即在单个...
Solr集群搭建是一个复杂但重要的过程,用于实现大型、高可用性和可扩展性的搜索解决方案。Apache Solr是一款基于Lucene的开源全文搜索引擎,它提供了分布式搜索、近实时处理、多字段排序等功能。以下是对Solr集群...
Solr是一款开源的、基于Lucene的全文搜索引擎。它提供了一个高性能、可伸缩的企业级搜索平台。Solr不仅支持分布式部署(集群模式),还支持多种索引和查询功能,这使得它成为众多企业搜索解决方案的首选。 #### 二...
Solr服务器是一个强大的全文搜索引擎,它是Apache Lucene项目的一个子项目。Solr提供了一个高效、可扩展的平台,用于处理和检索大量数据。基于Solr搭建的服务器旨在为各种应用程序提供快速、高效的搜索功能,使其...
Apache Solr 是一个基于Apache Lucene构建的开源搜索服务器,它为企业提供了高效、可扩展的全文检索解决方案。Solr 的设计目标是使搜索功能变得简单,即使开发者没有深入的Java技术背景也能轻松使用,因为其通信协议...
最后,Solr是Apache Lucene的一个分支,是一个高度可定制的、高性能的全文搜索引擎服务器。Lucene是Java最著名的全文检索库,而Solr在其基础上增加了集群、分布式搜索、多文档格式支持等功能,使得大规模数据的搜索...
它基于Java开发,能够处理多种数据源,包括XML、JSON、CSV等,提供了高效、可扩展的搜索解决方案。 在Solr中,主要涉及以下几个核心概念: 1. **索引**:索引是Solr处理数据的基础,它是对文档进行预处理后的结果...
Solr是Apache Lucene项目的一部分,专为处理和检索大量文档而设计,广泛应用于网站搜索、企业级信息检索、电子商务产品搜索等领域。在最新版Linux Solr 8.11.0中,包含了多项性能提升、新功能和优化,以提供更强大、...
Solr是基于Lucene的搜索服务器,它提供了一个分布式、可配置、可扩展的搜索和导航层,支持多种数据源的索引和高效检索。**SolrJ**则是Solr提供的Java客户端库,它允许开发者通过Java代码与Solr服务器进行交互,包括...
3. 使用Solr:Apache Solr是基于Lucene的全文搜索服务器,它提供了一整套完善的全文检索解决方案,包括易配置、可扩展性以及优化的索引和搜索性能。Solr是推荐的站内搜索技术选型,因为它在灵活性和易用性之间取得了...
接下来,Solr4J是Solr(一个基于Lucene的搜索服务器)的Java客户端,它提供了一组方便的API,使得开发者可以轻松地与Solr服务器进行交互,包括添加、删除、更新索引以及执行查询。Solr4J的主要特性有: 1. 异步操作...