最新文章列表

Solr优化之路之Recovering

一、Solr的Recovering问题解决 经常碰到solr的recovering的问题,经过检查大部分的recovering的情况在lead的error日志中都会出现如下错误日志。 错误1:[ERROR] 16:46 ...
dongliboyqq 评论(0) 有3646人浏览 2018-01-26 10:59

解决solr缓存造成的query查询问题

背景 目前在公司,实现solr的一个菜名推荐模块的时候,遇到了一个困扰了好几天的问题,就是当实现了模块的逻辑代码并确认功能实现后,在部署测试 ...
粟谷_sugu 评论(0) 有3165人浏览 2018-01-22 19:07

solr(lucene)的reRank的核心实现源码解读

换公司了,公司的solr使用的是4.10,使用了ReRankQuery,我自己看了下源码。   先介绍一下solr的reRank,他的意思是进行两轮查找,第一轮对所有的doc进行查找,指定要查找多少个doc,第二轮是在第一轮中查找到的所有的doc中在进行一遍查找,使用一个不同的查询逻辑(也就是另一个query),重新打分,可以指定两次得分的最终处理的策略,最后返回需要查找的结果。说白了,他就 ...
suichangkele 评论(0) 有2128人浏览 2018-01-21 19:09

solr中的filterCache使用场景源码解读

都知道solr有四个缓存,queryResultCache,documentCache,filterCache,fieldValueCache,今天我要好好说一下filterCache,据说他是用来缓存fq的docid的,也就是当搜索 ...
suichangkele 评论(0) 有1102人浏览 2018-01-21 17:01

solr(lucene)中的value source

在上一篇博客中已经说了,valueSource就是获得一个doc的某些值,这个值可以是doc的某些域的值,也可以是现计算的一些函数值,这个博客里面就说一下so ...
suichangkele 评论(0) 有1950人浏览 2018-01-20 10:56

SOLR Cloud(8)Deployment and Backup Cloud

SOLR Cloud(8)Deployment and Backup Cloud Since we already have EFS on the old cluster, we stop consumer and back up the data first >http://alljobs1.us-east-1.elasticbeanstalk.com/solr/admin/collect ...
sillycat 评论(0) 有693人浏览 2018-01-18 23:57

solr 5.0 集群搭建

一,搭建zookeeper集群 1.下载zookeeper解压3份,分别重命名为zookeeper-3.4.10-42181,zookeeper-3.4.10-42182,zookeeper-3.4.10-42183(4218* 表示连接端口) 2. 进入D:\mysoftsetup\solr-colud\zookeeper\zookeeper-3.4.10-42181\conf目录修改 (zook ...
gjp014 评论(0) 有604人浏览 2018-01-13 14:55

solr的主从复制实现原理

换公司了,因为历史遗留原因,新公司不用solrcloud,他们使用的是主从复制模式,所以趁没有任务就看了下主从复制的原理,记个笔记。 先说下solrcloud下复制的原理吧,solrcloud中每个doc是要添加到对应的shard中,并且添加的一定是leader,然后由leader写到自己的索引后再转发到其他的replica中,也就是采用的push的方式,并且是每个doc都会进行这样的操作。l ...
suichangkele 评论(0) 有959人浏览 2018-01-09 17:15

依赖Lucene的电话号码查询优化

  某天的生产环境服务器突然报告有cpu load超负荷的报警,然后赶紧查看查询日志,发现里里面有大量类似这样的查询: {q=(customer_mobile:/[0-9]{7}7785/+OR+code:7785)&distrib=false&_stateVer_=search4card:1494&start=0&fentityid:123456&row ...
mozhenghua 评论(0) 有1767人浏览 2017-12-07 18:40

快速上手数据挖掘之Solr5搜索引擎高级教程

快速上手数据挖掘之Solr5搜索引擎高级教程 分享下载地址——https://pan.baidu.com/s/1kXiSxvD 密码: 3va7 https://pan.baidu.com/s/1eUdCSXc 密码: r28s Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询 ...
天地合1 评论(0) 有300人浏览 2017-10-26 09:47

solr、tomcat与jdk版本的关系

Solr与JDK对应版本关系,Tomcat与JDK版本对应关系   最新在部署solrCloud集群,由于自己机器上用的JDK都是JDK1.7的,然后我就从网上下载了最新下载了最先的solr6.6.0和最新的Tomcat9.0,部署了一下,开始报错,提示solr和JDK版本不兼容,Tomcat和JDK版本不兼容,所以在这里特意记录一下solr、JDK、Tomcat版本对应关系。 一、solr与 ...
liushuiwuyan 评论(0) 有788人浏览 2017-09-29 09:39

基于Nested Document的RealtimeGet实现

       原生的solr中有/get 的request handler实现(org.apache.solr.handler.component.RealTimeGetComponent),实现原理是,先到tlog的内存中去找记录,找不到再到indexSearch中去找。这样当用户利用solrj客户端提交到solr服务端之后,可以不需要等待服务端softcommit,就能立即从服务端中取得最新提 ...
mozhenghua 评论(0) 有1238人浏览 2017-09-15 15:47

solr 4.9 学习

1.下载solr 4.9.0 下载地址:http://archive.apache.org/dist/lucene/solr/4.9.0/solr-4.9.0.zip。 2.解压solr-4.9.0.zip,把solr-4.9.0\dist 目录中的solr-4.9.0.war 解压放到tomcat7的webapps ...
gjp014 评论(0) 有484人浏览 2017-09-05 11:04

solr VS es

今天看了一个对比es和solr的文章,是《lucene in action》的作者写的: https://www.datanami.com/2015/01/22/solr-elasticsearch-question/,他在这篇文章中对solr赞美的话毫不吝啬,认为solr绝对不比es差,反而认为es不如solr的地方很多,尤其是我觉的最后的一段话不错:如果你已经在solr上投入了大量精力,那 ...
suichangkele 评论(2) 有1020人浏览 2017-08-02 17:16

Solr/Lucene使用docValue查询的一个坑

发现问题 最近在使用docValue发现了一个坑,初学者稍不注意很有可能入坑,进而会得出Lucene性能有问题的结论,所以我需要将这个坑填平以正视听。 接到业务方的一个需求,需要在查询结果上按照某一个字段去除重复,假设有以下两条记录: 学号 班级id 班级排名 001 1 1 002
mozhenghua 评论(0) 有2515人浏览 2017-06-21 18:26

Solr查询语言 JSON Request API

全文阅读http://click.aliyun.com/m/23536/ 一、背景与动机 JSON Request API是由noggit作者(同时也Solr Committer Leader)在Solr.5.3带来新特性,意在改善Solr原来复杂且又 ...
liangyan9966 评论(0) 有761人浏览 2017-06-19 13:51

本机部署solr服务器教程

本机部署solr服务器基本步骤如下: 1、下载solr,网址:http://mirror.bit.edu.cn/apache/lucene/solr/6.6.0/,并解压到本地文件夹 2、下载tomcat,网址:http://tomcat.apache.org/,并解压到本地文件夹,E:\packs\run\tomcat8.0-solr6 3、将solr-6.6.0\server\solr-weba ...
liushuiwuyan 评论(0) 有536人浏览 2017-06-15 15:07

solr中的reload

一直在使用solr的reload命令,不过一直使用的是集合的reload,即ip:port/solr/admin/collections?action=RELOAD&name=xx,其中xx是集合的名字;最近发现还有core的reload,即:ip:port/solr/admin/cores?action=RELOAD&core=coreName,本来觉得这个solr可是真好,还提供 ...
suichangkele 评论(0) 有2034人浏览 2017-05-06 16:26

solr中的dismax解析器

之前一直用dismax,但是一直没有看看他到底是怎么实现的,今天终于看了一遍源码,记个笔记,方便以后查阅。 当我们使用defType=dismax的时候就会使用到DisMaxQParser这个类,他是一个QParser,用于根据用户的输入解析为一个Query类的实例。我们看看他的解析方法: @Override public Query parse() throws SyntaxEr ...
suichangkele 评论(0) 有1368人浏览 2017-04-22 16:07

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics