- 浏览: 626758 次
- 性别:
- 来自: 北京
文章分类
- 全部博客 (819)
- java开发 (110)
- 数据库 (56)
- javascript (30)
- 生活、哲理 (17)
- jquery (36)
- 杂谈 (15)
- linux (62)
- spring (52)
- kafka (11)
- http协议 (22)
- 架构 (18)
- ZooKeeper (18)
- eclipse (13)
- ngork (2)
- dubbo框架 (6)
- Mybatis (9)
- 缓存 (28)
- maven (20)
- MongoDB (3)
- 设计模式 (3)
- shiro (10)
- taokeeper (1)
- 锁和多线程 (3)
- Tomcat7集群 (12)
- Nginx (34)
- nodejs (1)
- MDC (1)
- Netty (7)
- solr (15)
- JSON (8)
- rabbitmq (32)
- disconf (7)
- PowerDesigne (0)
- Spring Boot (31)
- 日志系统 (6)
- erlang (2)
- Swagger (3)
- 测试工具 (3)
- docker (17)
- ELK (2)
- TCC分布式事务 (2)
- marathon (12)
- phpMyAdmin (12)
- git (3)
- Atomix (1)
- Calico (1)
- Lua (7)
- 泛解析 (2)
- OpenResty (2)
- spring mvc (19)
- 前端 (3)
- spring cloud (15)
- Netflix (1)
- zipkin (3)
- JVM 内存模型 (5)
- websocket (1)
- Eureka (4)
- apollo (2)
- idea (2)
- go (1)
- 业务 (0)
- idea开发工具 (1)
最新评论
-
sichunli_030:
对于频繁调用的话,建议采用连接池机制
配置TOMCAT及httpClient的keepalive以高效利用长连接 -
11想念99不见:
你好,我看不太懂。假如我的项目中会频繁调用rest接口,是要用 ...
配置TOMCAT及httpClient的keepalive以高效利用长连接
Solr是Apache Lucene的一个子项目。Lucene为全文搜索功能提供了完备的API,但它只作为一个API库存在,而不能直接用于搜索。因此,Solr基于Lucene构建了一个完整的搜索引擎,它可以为搜索引擎添加文档,对文档内容进行分析,并为用户提供搜索功能,在此基础上提供了一个扩展功能,如hit highline, suggetion等。
一、概述
(一)基础内容
1、Solr的版本号与Lucene的版本号保持一直,直到2014年7月,最新版本号为4.9.0。
2、Solr提供了一个example,可以简单快速的搭建起搜索环境。参见http://blog.csdn.net/jediael_lu/article/details/36419497
(二)配置文件
Solr的关键配置文件有以下三个:
solr.xml—Defines properties related to administration, logging, sharding, and SolrCloud
solrconfig.xml—Defines the main settings for a specific Solr core
schema.xml—Defines the structure of your index, including fields and field types
启动搜索引擎时,服务器按照以下顺序导入配置:
(1)从全局java系统属性中查看solr.solr.home,一般定义为:$SOLR_INSTALL/example/solr/。
(2)搜索上述目录中哪个子目录中包含有 core.properties,每个 core.properties对应一个core。
(3)从 core.properties中找出name属性,其值作为一个core。
(4)查找这个core下面的conf子目录,找到solrconfig.xml与schema.xml
1、solr.xml
与整个搜索引擎相关的配置。
2、solrconfig.xml。
与某个core相关的主要配置,如定义updatehandler用于索引文件,requesthandler用于搜索内容等。
3、schema.xml
定义了某类型文档的索引格式。
4、core.properties
记录了一个core的基本信息,除一个name为必备属性外,其余均为可选
二、索引
索引,是将文档中的内容经过分析后,形成一个Term---Document的映射,并将其写入索引文件的过程,即说明哪些文档中包括某个词汇。
(一)向搜索引擎中提交文档的方法
1、命令行方式
使用example程序中提供的post.jar或者post.sh提供文档,它支持XML/JSON/CSV三种文件格式。
如java -jar post.jar *.xml
但本质上,它只是将solr提供的API进行了封装,最核心的类为SimplePostTool,此类调用了SolrJ的接口。
2、SolrJ
使用solr提供的API,进行文档的添加。
3、其它第三方工具
(1)Data Import Handler (DIH)
将外部数据导入Solr,如网站、关系型数据库等内容。
(2)ExtractingRequestHandler, aka Solr Cell
对Tika进行了封装,可用于导入富文本内容,如pdf,office等
(3)Nutch
抓取网页并将其导入solr。
三、分析
四、索引
五、扩展功能
转自:http://blog.csdn.net/jediael_lu/article/details/37813295
一、概述
(一)基础内容
1、Solr的版本号与Lucene的版本号保持一直,直到2014年7月,最新版本号为4.9.0。
2、Solr提供了一个example,可以简单快速的搭建起搜索环境。参见http://blog.csdn.net/jediael_lu/article/details/36419497
(二)配置文件
Solr的关键配置文件有以下三个:
solr.xml—Defines properties related to administration, logging, sharding, and SolrCloud
solrconfig.xml—Defines the main settings for a specific Solr core
schema.xml—Defines the structure of your index, including fields and field types
启动搜索引擎时,服务器按照以下顺序导入配置:
(1)从全局java系统属性中查看solr.solr.home,一般定义为:$SOLR_INSTALL/example/solr/。
(2)搜索上述目录中哪个子目录中包含有 core.properties,每个 core.properties对应一个core。
(3)从 core.properties中找出name属性,其值作为一个core。
(4)查找这个core下面的conf子目录,找到solrconfig.xml与schema.xml
1、solr.xml
与整个搜索引擎相关的配置。
2、solrconfig.xml。
与某个core相关的主要配置,如定义updatehandler用于索引文件,requesthandler用于搜索内容等。
3、schema.xml
定义了某类型文档的索引格式。
4、core.properties
记录了一个core的基本信息,除一个name为必备属性外,其余均为可选
二、索引
索引,是将文档中的内容经过分析后,形成一个Term---Document的映射,并将其写入索引文件的过程,即说明哪些文档中包括某个词汇。
(一)向搜索引擎中提交文档的方法
1、命令行方式
使用example程序中提供的post.jar或者post.sh提供文档,它支持XML/JSON/CSV三种文件格式。
如java -jar post.jar *.xml
但本质上,它只是将solr提供的API进行了封装,最核心的类为SimplePostTool,此类调用了SolrJ的接口。
2、SolrJ
使用solr提供的API,进行文档的添加。
3、其它第三方工具
(1)Data Import Handler (DIH)
将外部数据导入Solr,如网站、关系型数据库等内容。
(2)ExtractingRequestHandler, aka Solr Cell
对Tika进行了封装,可用于导入富文本内容,如pdf,office等
(3)Nutch
抓取网页并将其导入solr。
三、分析
四、索引
五、扩展功能
转自:http://blog.csdn.net/jediael_lu/article/details/37813295
发表评论
-
Elasticsearch中mapping全解实战
2022-03-23 10:01 190Elasticsearch中mapping全解实战 深入学习 ... -
如何快速搭建一个简易的ELK日志分析系统
2022-03-22 23:56 182如何快速搭建一个简易的ELK日志分析系统 -
ElasticSearch-ik分词器
2022-03-12 20:11 225ElasticSearch-ik分词器 利用Kibana来 ... -
解决elasticsearch配置network.host: 0.0.0.0导致elasticsearch服务启动不成功的问题
2022-03-10 13:53 1520解决elasticsearch配置network.host: ... -
ElasticSearch中keyword的属性ignore_above详解
2022-02-14 19:54 567ignore_above 含义 在ElasticSearch中 ... -
elasticsearch的keyword与text的区别
2022-01-05 15:46 209elasticsearch的keyword与text的区别 ... -
java使用ElasticSearch的RestHighLevelClient集群配置
2016-08-16 14:23 632Elasticsearch Guide elasticsea ... -
solr下载地址
2016-08-16 09:41 370http://lucene.apache.org/solr/d ... -
Solr中的概念:分析器(analyzer)、字符过滤器(character filter)、分词器(Tokenizer)、词元过滤器(Token Filter
2016-08-15 09:53 1302文本中包含许多文本处理步骤,比如:分词,大写转小写,词干化,同 ... -
solrCloud源码分析之CloudSolrClient
2016-08-12 08:36 997CloudSolrClient是solrj提供的客户端与sol ... -
solr常用查询语句如何写
2016-08-12 08:34 399工作中用到solr,就自己工作中常用查询,简单总结下solr查 ... -
Solr的学习使用之(七)Solr高级查询facet、facet.pivot简介
2016-08-12 08:36 13581 、什么是Faceted Search Facet['fæ ... -
Solr JAVA客户端SolrJ 4.9使用示例教程
2016-08-12 08:37 470简介 SolrJ是操作Solr的JAVA客户端,它提供了增加 ... -
solr 3.5 配置及应用(三)
2016-08-12 08:37 396在solr 3.5 配置及应用(二)中在 Document文档 ... -
solr主从复制的原理
2016-08-11 11:20 757master的工作 对于Replicati ... -
solrj 更新部分索引域的值
2016-08-11 09:33 3052solrj可以用关键字set对索引进行部分字段更新: Has ...
相关推荐
Solr的术语部分涉及到了多个与Solr操作相关的概念,例如Auto-warming是指自动预热操作,有助于提高查询性能;Facet指的是查询结果的分组统计功能;Document是指索引中的文档;Field指的是文档中的字段;IndexWriter...
下面是 Solr 相关知识点: 1. Solr 的应用场景:Solr 主要应用于站内搜索,解决 MySQL 数据库 I/O 读写瓶颈问题,提高搜索效率。 2. Solr 的优点:Solr 支持多种数据类型格式,可以实时搜索,解决分布式系统的数据...
在本套课程中,我们将全面的讲解Solr,从Solr基础到Solr高级,再到项目实战,基本上涵盖了Solr中所有的知识点。 主讲内容 章节一:Solr基础(上) 1. 环境搭建 2. 核心讲解 3. 数据导入 4. 各种中文分析器 章节二:...
以下是对Solr 8.11.1中关键知识点的详细解释: 1. **SolrCloud模式**:从版本8开始,Solr支持SolrCloud模式,这是一个分布式搜索和索引存储解决方案。它允许Solr集群进行自动故障转移和数据恢复,确保高可用性和...
Solr 是一个开源的企业级搜索服务器,底层使用易于扩展和修改的Java 来实现。服务 器通信使用标准的HTTP 和XML,所以如果使用Solr 了解Java 技术会有用却不是必须的要 求。 Solr 主要特性有:强大的全文检索功能,...
Apache Solr 是一个开源的全文搜索引擎,由Apache软件基金会维护,是Lucene项目的一部分。它提供了高效、可扩展的搜索和导航功能...熟悉这些知识点,可以帮助你更好地利用Apache Solr构建高性能的企业级搜索解决方案。
### Solr 学习知识点详解 #### 一、Solr 概述 - **定义**:Solr 是 Apache 下的一个顶级开源项目,采用 Java 开发,它是基于 Lucene 的全文搜索服务器。Solr 可以独立运行在 Jetty、Tomcat 等 Servlet 容器中。 -...
Solr是中国Apache软件基金会开发的一款高性能、基于Java的全文搜索引擎服务器。...在本资源包中,包含了Solr 4.10.3...通过理解和应用这些知识,你将能够成功地搭建起一个功能完备的Solr搜索引擎服务,满足各种搜索需求。
3. **dist** 文件夹:包含Solr的JAR文件和相关的依赖库,这些文件在启动Solr时会被加载。 4. **docs** 文件夹:包含了Solr的用户文档,可以帮助开发者和管理员了解Solr的使用方法和API。 5. **example** 文件夹:...
### Solr 4.7 服务搭建详细指南 #### 一、环境准备 为了搭建 Solr 4.7 服务,我们需要确保以下环境已经准备好: 1. **Java Development Kit (JDK) 1.7**:Solr 需要 Java 运行环境支持,这里我们选择 JDK 1.7 ...
根据提供的信息,我们可以总结出以下关于Apache Solr的相关知识点: ### Apache Solr简介 Apache Solr是一款开源的、高性能的企业级搜索平台,基于Lucene库构建。它支持高度可配置的全文检索与分析,并提供了丰富...
这里我们将围绕"solr-9.0.0-src.tgz"这个源码包,详细探讨其主要组成部分、核心功能以及开发过程中的关键知识点。 1. **Solr架构** Solr的架构基于Lucene,一个强大的全文搜索引擎库。它提供了分布式、可扩展、高...
Solr是Apache软件基金会开发的一款开源全文搜索引擎,它基于Java平台,是Lucene的一个扩展,提供了更为...通过研究其源码,开发者不仅可以学习到搜索引擎的相关知识,还可以提升在大数据处理和分布式系统设计上的技能。
solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...
### Solr教材知识点详解 #### 一、概述 **1.1 企业搜索引擎方案选型** 在企业级应用中,为了提升用户体验并更好地处理大量数据的检索需求,选择合适的搜索引擎解决方案至关重要。通常有几种常见的方案: 1. **...
Solr 是一个开源的全文搜索...以上就是 Solr 4.4.0 版本的主要知识点,以及如何在 Linux 环境下进行安装和部署到 Tomcat。通过熟练掌握这些步骤,你将能够成功地在生产环境中运行 Solr,提供高效、强大的全文搜索服务。
Apache Solr 是一个开源的全文搜索引擎,广泛应用于各种企业级数据搜索和分析场景。增量更新是Solr的一个关键特性,它允许系统仅处理自...在实际应用中,理解并掌握这些知识点对于提升Solr系统的稳定性和效率至关重要。
让我们详细地探讨一下其中涉及的知识点。 1. **Apache Solr**:Solr是一个开源的企业级全文搜索引擎,它提供了高效、可扩展的搜索和分析功能。它支持多种数据源,可以处理大量结构化和非结构化数据,提供快速的全文...
Solr服务器是Apache Lucene项目的一个子项目,是一款开源的企业级搜索平台,专门用于处理大量文本数据的全文检索、搜索和分析。它基于Java开发,能够处理多种数据源,包括XML、JSON、CSV等,提供了高效、可扩展的...
Solr4.9是Apache Solr的一个版本,它是一个基于Lucene的全文搜索服务器,用于构建高效的、可扩展的搜索应用。...通过了解和熟练掌握上述知识点,开发者可以高效地利用Solr4.9搭建和管理高性能的搜索应用。