本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- siemens800
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
最新文章列表
Solr优化之路之Recovering
一、Solr的Recovering问题解决
经常碰到solr的recovering的问题,经过检查大部分的recovering的情况在lead的error日志中都会出现如下错误日志。
错误1:[ERROR] 16:46 ...
solr(lucene)的reRank的核心实现源码解读
换公司了,公司的solr使用的是4.10,使用了ReRankQuery,我自己看了下源码。
先介绍一下solr的reRank,他的意思是进行两轮查找,第一轮对所有的doc进行查找,指定要查找多少个doc,第二轮是在第一轮中查找到的所有的doc中在进行一遍查找,使用一个不同的查询逻辑(也就是另一个query),重新打分,可以指定两次得分的最终处理的策略,最后返回需要查找的结果。说白了,他就 ...
solr中的filterCache使用场景源码解读
都知道solr有四个缓存,queryResultCache,documentCache,filterCache,fieldValueCache,今天我要好好说一下filterCache,据说他是用来缓存fq的docid的,也就是当搜索 ...
solr 5.0 集群搭建
一,搭建zookeeper集群
1.下载zookeeper解压3份,分别重命名为zookeeper-3.4.10-42181,zookeeper-3.4.10-42182,zookeeper-3.4.10-42183(4218* 表示连接端口)
2. 进入D:\mysoftsetup\solr-colud\zookeeper\zookeeper-3.4.10-42181\conf目录修改
(zook ...
solr的主从复制实现原理
换公司了,因为历史遗留原因,新公司不用solrcloud,他们使用的是主从复制模式,所以趁没有任务就看了下主从复制的原理,记个笔记。
先说下solrcloud下复制的原理吧,solrcloud中每个doc是要添加到对应的shard中,并且添加的一定是leader,然后由leader写到自己的索引后再转发到其他的replica中,也就是采用的push的方式,并且是每个doc都会进行这样的操作。l ...
依赖Lucene的电话号码查询优化
某天的生产环境服务器突然报告有cpu load超负荷的报警,然后赶紧查看查询日志,发现里里面有大量类似这样的查询:
{q=(customer_mobile:/[0-9]{7}7785/+OR+code:7785)&distrib=false&_stateVer_=search4card:1494&start=0&fentityid:123456&row ...
快速上手数据挖掘之Solr5搜索引擎高级教程
快速上手数据挖掘之Solr5搜索引擎高级教程
分享下载地址——https://pan.baidu.com/s/1kXiSxvD 密码: 3va7
https://pan.baidu.com/s/1eUdCSXc 密码: r28s
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询 ...
solr、tomcat与jdk版本的关系
Solr与JDK对应版本关系,Tomcat与JDK版本对应关系
最新在部署solrCloud集群,由于自己机器上用的JDK都是JDK1.7的,然后我就从网上下载了最新下载了最先的solr6.6.0和最新的Tomcat9.0,部署了一下,开始报错,提示solr和JDK版本不兼容,Tomcat和JDK版本不兼容,所以在这里特意记录一下solr、JDK、Tomcat版本对应关系。
一、solr与 ...
基于Nested Document的RealtimeGet实现
原生的solr中有/get 的request handler实现(org.apache.solr.handler.component.RealTimeGetComponent),实现原理是,先到tlog的内存中去找记录,找不到再到indexSearch中去找。这样当用户利用solrj客户端提交到solr服务端之后,可以不需要等待服务端softcommit,就能立即从服务端中取得最新提 ...
solr 4.9 学习
1.下载solr 4.9.0 下载地址:http://archive.apache.org/dist/lucene/solr/4.9.0/solr-4.9.0.zip。
2.解压solr-4.9.0.zip,把solr-4.9.0\dist 目录中的solr-4.9.0.war 解压放到tomcat7的webapps ...
solr VS es
今天看了一个对比es和solr的文章,是《lucene in action》的作者写的:
https://www.datanami.com/2015/01/22/solr-elasticsearch-question/,他在这篇文章中对solr赞美的话毫不吝啬,认为solr绝对不比es差,反而认为es不如solr的地方很多,尤其是我觉的最后的一段话不错:如果你已经在solr上投入了大量精力,那 ...
Solr/Lucene使用docValue查询的一个坑
发现问题
最近在使用docValue发现了一个坑,初学者稍不注意很有可能入坑,进而会得出Lucene性能有问题的结论,所以我需要将这个坑填平以正视听。
接到业务方的一个需求,需要在查询结果上按照某一个字段去除重复,假设有以下两条记录:
学号
班级id
班级排名
001
1
1
002
Solr查询语言 JSON Request API
全文阅读http://click.aliyun.com/m/23536/
一、背景与动机
JSON Request API是由noggit作者(同时也Solr Committer Leader)在Solr.5.3带来新特性,意在改善Solr原来复杂且又 ...
本机部署solr服务器教程
本机部署solr服务器基本步骤如下:
1、下载solr,网址:http://mirror.bit.edu.cn/apache/lucene/solr/6.6.0/,并解压到本地文件夹
2、下载tomcat,网址:http://tomcat.apache.org/,并解压到本地文件夹,E:\packs\run\tomcat8.0-solr6
3、将solr-6.6.0\server\solr-weba ...
solr中的reload
一直在使用solr的reload命令,不过一直使用的是集合的reload,即ip:port/solr/admin/collections?action=RELOAD&name=xx,其中xx是集合的名字;最近发现还有core的reload,即:ip:port/solr/admin/cores?action=RELOAD&core=coreName,本来觉得这个solr可是真好,还提供 ...
solr中的dismax解析器
之前一直用dismax,但是一直没有看看他到底是怎么实现的,今天终于看了一遍源码,记个笔记,方便以后查阅。
当我们使用defType=dismax的时候就会使用到DisMaxQParser这个类,他是一个QParser,用于根据用户的输入解析为一个Query类的实例。我们看看他的解析方法:
@Override
public Query parse() throws SyntaxEr ...