本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- Xeden
- luxurioust
- lzyfn123
- zhanjia
- forestqqqq
- johnsmith9th
- nychen2000
- ajinn
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- mwhgJava
- silverend
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
最新文章列表
Solr原理
1.倒排索引基本概念
总括:
倒排索引:
单词词典+倒排文件
单词词典中:单词就是索引单位,一个单词对应一个索引,在单词词典内每条索引信息记录着单词本身信息和指向的倒排列表指针(自身的倒排列表在倒排文件的位置)
单词词典一般用hashmap的存储或可以快速有序查找的树形结构B+tree,中的节点存范围分捅导航信息,叶子节点才存单词本身和倒排列表位置信息
倒排列表:
...
solr数据导入的几种方式
solr数据导入,经过这几天的查资料,我觉得solr数据导入可以有三种方式:
1、编写数据xml文件,通过post.jar导入;
2、通过DIH导入;
3、利用solrj导入数据;
执行
E:\source\example>java -jar -Dc=arpenker -Dauto e:\source\example\exampledocs\po
st.jar e:\source\exam ...
solr8 启动集群官方流程
Exercise 1: Index Techproducts Example Data
This exercise will walk you through how to start Solr as a two-node cluster (both nodes on the same machine) and create a collection during startup. Then you ...
ElasticSearch开始
什么时Elasticsearch?
Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功 ...
Solr 7.5 Expected mime type application/json but got text/plain.
SolrJ版本7.5,Solr版本7.5。查询测试代码如下:
SolrClient solr = new HttpSolrClient.Builder(solrUrl).build();
SolrQuery query=new SolrQuery();
query.set("q","title:"+q ...
sorl 增加删除修改更新
package com.zhen.course.controller;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collection;
import java.util.HashMap;
import org.apache.solr.client.solrj.SolrClie ...
solr的Nested Doc的详解及应用
nested doc,是solr提供的一种父子文档嵌套的结构,但是由于在lucene中,所有文档的存储都是扁平结构的,所以嵌套只是逻辑上的说法,在物理存储中,父子嵌套是根据所有相关联的父子文档紧密排列,并且按照 子->子->父 的顺序排序,每个区块都必须父作为结尾。
如何添加nested doc结构的索引?
直接上代码
SolrIn ...
solr的facet源码解读(三)——facet.field之数字单值域类型
(这个使用的solr的版本是4.10)
承接上一篇文章,在对单值域的数字类型的域做facet的时候,会使用FCS方法,里面再调用的方法是NumericFacets.getCounts(searcher, base, field, offset, limit, mincount, missing, sort);所以看看这个的代码吧:
/**
* 处理单值域的数字类型的facet
* @ ...
solr的facet源码解读(二)——facet.field
facet.field比facet.query要复杂的多,参数也更多,看看代码吧,方法是:SimpleFacets.getFacetFieldCounts()
public NamedList<Object> getFacetFieldCounts() throws IOException, ...
solr的facet源码解读(一)——facet.query
solr的facet query意思很简单,表示在所有的搜索到的结果中,符合某个query的doc有多少个。他的实现原理也很简单。
solr中所有的facet的操作都在facetComponent中,在这个类的process方法里面,会将facet委托给SimpleFacet这个类,然后调用simpleFacet.getFacetCounts方法。我们要说的facet.query就是在这个类中 ...
solr对docValue的使用
前面写了十来篇博客都是介绍lucene的docValue的,有五中docValue,但是在solr里面却只有一个配置,即在schema.xml中的<field>中添加docValues=true,那么solr在 ...