最新文章列表

搜索引擎solr研究-从数据库创建索引

solr功能非常强大,可以建立各种数据的索引,常见的企业应用中,少不了数据库的索引的创建,可以通过写程序 可以将数据读出100条,如果你的内存够大,可以是1000条甚至更多,然后放入Collection中,批量提交至solr。或者读取数据写入xml文件中,再将该文件提交到solr等等。但是,solr也只带了数据库创建索引的功能,步骤如下:一、通过solr自带的example准备工作:1、在apac ...
liuquanjc 评论(0) 有638人浏览 2021-07-22 23:26

为了实现在线库的复杂查询,你还在双写吗?

一、在线库不支持在线复杂查询 -------------- 做在线业务的开发者经常会碰到这样的难题:在线数据库上面运行稍微复杂点的查询,在线业务就挂了!不管是单机数据库如MySQL、PG,还是分布式数据库,HBase、MongoDB、Cassandra都有这个问题。下面,本文就以HBase为例对该问题进行说明,其他库原理类似。 HBase作为海量在线存储引擎,被广泛应用于推荐、风控、物联网、画像 ...
大涛学长 评论(0) 有377人浏览 2019-11-25 15:38

Solr原理

1.倒排索引基本概念   总括:   倒排索引:    单词词典+倒排文件 单词词典中:单词就是索引单位,一个单词对应一个索引,在单词词典内每条索引信息记录着单词本身信息和指向的倒排列表指针(自身的倒排列表在倒排文件的位置) 单词词典一般用hashmap的存储或可以快速有序查找的树形结构B+tree,中的节点存范围分捅导航信息,叶子节点才存单词本身和倒排列表位置信息 倒排列表: ...
y806839048 评论(0) 有303人浏览 2019-07-30 07:21

solr的核心创建

以下是windows下的solr搭建教程 第一步,下载solr 进入solr官网进行下载:http://lucene.apache.org/solr/ 第二步: 将解压的solr放到自己指定的文件夹 第三步: 由于solr有自带服务器,所以可以通过自带服务器进行启动: 首先进入解压后的这个目录: 然后shift+鼠标右键选择进入Powershell窗口 执行s ...
arpenker 评论(0) 有515人浏览 2019-07-18 19:15

solr数据导入的几种方式

solr数据导入,经过这几天的查资料,我觉得solr数据导入可以有三种方式: 1、编写数据xml文件,通过post.jar导入; 2、通过DIH导入; 3、利用solrj导入数据; 执行 E:\source\example>java -jar -Dc=arpenker -Dauto e:\source\example\exampledocs\po st.jar e:\source\exam ...
arpenker 评论(0) 有624人浏览 2019-07-18 19:15

solr8 导数据

背景知识:solr按官网上的步骤跑起来之后。数据是空的。那么就用XML把数据导进来。 E:\source\example\exampledocs>java -jar -Dc=data-1 -Dauto post.jar * SimplePostTool ...
arpenker 评论(0) 有471人浏览 2019-07-16 18:12

solr8 启动集群官方流程

Exercise 1: Index Techproducts Example Data This exercise will walk you through how to start Solr as a two-node cluster (both nodes on the same machine) and create a collection during startup. Then you ...
arpenker 评论(0) 有839人浏览 2019-07-16 17:29

ElasticSearch开始

什么时Elasticsearch? Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功 ...
subject 评论(0) 有619人浏览 2018-11-19 13:36

Solr 7.5 Expected mime type application/json but got text/plain.

SolrJ版本7.5,Solr版本7.5。查询测试代码如下: SolrClient solr = new HttpSolrClient.Builder(solrUrl).build(); SolrQuery query=new SolrQuery(); query.set("q","title:"+q ...
mayang_lang 评论(0) 有1345人浏览 2018-10-26 18:09

sorl 增加删除修改更新

package com.zhen.course.controller; import java.io.IOException; import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import org.apache.solr.client.solrj.SolrClie ...
viplisong 评论(0) 有335人浏览 2018-07-16 11:38

solr的Nested Doc的详解及应用

        nested doc,是solr提供的一种父子文档嵌套的结构,但是由于在lucene中,所有文档的存储都是扁平结构的,所以嵌套只是逻辑上的说法,在物理存储中,父子嵌套是根据所有相关联的父子文档紧密排列,并且按照 子->子->父 的顺序排序,每个区块都必须父作为结尾。 如何添加nested doc结构的索引?         直接上代码 SolrIn ...
粟谷_sugu 评论(1) 有2428人浏览 2018-05-23 18:54

solr利用functionQuery实现根据距离远近的自定义评分

本文主要结合一个业务需求,记录一下solr中一个functionQuery的用法。 需求 简要说明一下业务需求。在店铺搜索时,要根据查询的坐标值与店铺的距离以 ...
粟谷_sugu 评论(0) 有1486人浏览 2018-04-09 13:57

Solr之强大搜索器

*、自己看了下solr,找到了一个博客翻译了入门部分,这里我只是简单写下自己的理解,哈哈,有坑自己跳,哈哈,最好能拉我一把。\(^o^)/~ 下载: https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/5.5.5/   *、建核心或集合---若是数据库,即表空间 solr create -c 核心名称 -d 目录名称(有要求的 ...
lBovinl 评论(0) 有605人浏览 2018-03-21 16:13

solr的facet源码解读(四)——facet.field之非数字单值域类型

上一篇博客中写了单值域数字类型的域是如何做facet的,这一篇写单值域的非数字类型的facet。他的思路是分开多个段进行收集,在收集后最后再进行聚 ...
suichangkele 评论(0) 有858人浏览 2018-02-19 19:15

solr的facet源码解读(三)——facet.field之数字单值域类型

(这个使用的solr的版本是4.10) 承接上一篇文章,在对单值域的数字类型的域做facet的时候,会使用FCS方法,里面再调用的方法是NumericFacets.getCounts(searcher, base, field, offset, limit, mincount, missing, sort);所以看看这个的代码吧: /** * 处理单值域的数字类型的facet * @ ...
suichangkele 评论(0) 有710人浏览 2018-02-18 20:44

solr的facet源码解读(二)——facet.field

facet.field比facet.query要复杂的多,参数也更多,看看代码吧,方法是:SimpleFacets.getFacetFieldCounts() public NamedList<Object> getFacetFieldCounts() throws IOException, ...
suichangkele 评论(0) 有1296人浏览 2018-02-18 19:30

solr的facet源码解读(一)——facet.query

solr的facet query意思很简单,表示在所有的搜索到的结果中,符合某个query的doc有多少个。他的实现原理也很简单。 solr中所有的facet的操作都在facetComponent中,在这个类的process方法里面,会将facet委托给SimpleFacet这个类,然后调用simpleFacet.getFacetCounts方法。我们要说的facet.query就是在这个类中 ...
suichangkele 评论(0) 有1321人浏览 2018-02-17 17:54

solr对docValue的使用

前面写了十来篇博客都是介绍lucene的docValue的,有五中docValue,但是在solr里面却只有一个配置,即在schema.xml中的<field>中添加docValues=true,那么solr在 ...
suichangkele 评论(0) 有1148人浏览 2018-02-17 12:11

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics