最新文章列表

SolrCloud之Sharding路由介绍

在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是: (1)大数据量下更高的性能 (2)更好扩展性 (3)更高的可靠性 (4)更简单易用 什么时候应该使用SolrCloud(Shard)呢? (1)更大的数据量 (2)更大的索引体积 (3)想并行索引和查询 (4)想自定义数据分区 SolrCloud路由的分类 A:显式路由(Composi ...
qindongliang1922 评论(0) 有3442人浏览 2016-07-19 16:07

SolrCloud6.1.0之SQL查询测试

Solr发展飞快,现在最新的版本已经6.1.0了,下面来回顾下Solr6.x之后的一些新的特点: (1)并行SQL特性支持,编译成Streaming 表达式,可以在solrcloud集 ...
qindongliang1922 评论(2) 有2384人浏览 2016-07-12 11:21

Lucene/Solr/ElasticSearch搜索问题案例分析

最近收集的两个搜索的case,如下: 案例一: 使用 A关键词:“中国诚通控股公司”搜索,不能搜到 B结果“中国诚通控股集团有限公司” 从关键词 ...
qindongliang1922 评论(0) 有1850人浏览 2016-06-23 18:08

本地通过源码方式启动solr

  首先,下载solr5.5.0源码,http://apache.fayea.com/lucene/solr/5.5.0/solr-5.5.0-src.tgz   解压完成后,分为几个目录,然而solr是通过ant编译的,我们想将其转换为maven方式,发现其中存在dev-tools/maven中,其中对应的说明:   Copy the Maven POM templates f ...
brandNewUser 评论(0) 有2438人浏览 2016-06-14 11:41

通过Solr的Suggest实现提示词

需求:在Web端或移动设备上实现用户输入汉字或汉字的首字母,提供关联词提示。 解决方案:通过Solr提供的Suggest实现此功能,Solr版本为4.10.4 在Solr的 ...
nettm 评论(0) 有3429人浏览 2016-06-12 16:20

solr5.x快速入门

  转载请声明出处,谢谢。翻译也很辛苦      solr学习交流扣扣群340954928      快速开始   Solr为程序员开发复杂,高性能与先进的搜索应用程序功能,如分类(安排搜索结果列数值项关键术语)。
韩悠悠 评论(1) 有3766人浏览 2016-06-06 19:39

Lucene+Solr+ElasticSearch查询匹配优化

当我们在处理搜索业务时候,需求往往是灵活多变的,有时候我们需要精确匹配,有时候我们又需要全文检索,而有时候,我们又想匹配度高而且还能全文检索,这似乎是精确匹配和模糊匹配一个妥协的策略,没错这就是搜索引擎出现的目的,以往的数据库是没法解决这种问题的,数据库只能回答有,没有,存在,不存在,并不能在有和没有之间做一个完美的妥协,比如说能把最匹配最相关的结果放在topN,仅靠like模糊查询是解决不了这种 ...
qindongliang1922 评论(0) 有2933人浏览 2016-06-01 19:37

转自:跟益达学Solr5之使用Tomcat部署Solr

    最近忙着面试以及生活琐事把时间都霸占了,博客拖了4天没更新了,让各位久等了,望多多包涵!不过还好,工作已经敲定了,终于可以安心的学习Solr并分享我学习的点点滴滴啦!         上回我们在Jetty下部署了,不过我想小伙伴们使用Tomcat还是要多点,所以这回我们就来试试把Solr5部署到Tomcat下,这里以Win7 64bit Tomcat7.0.55为例,linux环境下同 ...
mengxiangfeng101 评论(0) 有496人浏览 2016-05-31 14:12

[转]搜索引擎选择: Elasticsearch与Solr

搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以 ...
CurrentJ 评论(0) 有525人浏览 2016-05-24 15:30

如何通过JMX远程监控Solr?

有时候,我们在服务器端部署了JAVA程序,而又想在windows上监控这个程序的JVM的情况,该如何操作呢? 答案就是通过JMX监控,需要在启动的java程序中, ...
qindongliang1922 评论(0) 有2025人浏览 2016-05-23 16:07

转自:跟益达学Solr5之玩转post.jar

为了方便用户往solr中添加索引,Solr为用户提供了一个post.jar工具,用户只需要在命令行下运行post.jar并传入一些参数就可以完成索引的增删改操作,对,它仅仅是一个供用户进行Solr测试的工具而已,有关post.jar的使用说明如下: Txt代码   SimplePostTool version 5.1.0   Usage: java [SystemPrope ...
mengxiangfeng101 评论(0) 有558人浏览 2016-05-23 11:58

Solr Suggest组件的使用

使用suggest的原因,最主要就是相比于search速度快,In general, we need the autosuggest feature to satisfy two main requirements:   ■ It must be fast; there are few things that are more annoying than a clunky type- a ...
brandNewUser 评论(0) 有4337人浏览 2016-05-12 18:57

如何实现Solr自定义评分查询

(一)背景介绍 大多数时候我们使用lucene/solr/elasticsearch自带的评分查询都是没问题的,当然这也仅仅限于简单的业务或者对搜索排名 不敏感的场景中,假设业务方要求有若干业务因子要干扰到排名,同时还不能放弃框架本身的文本相似度评分,那么应该怎么做呢? 这种场景尤其是在电商类的一些垂直搜索中体现比较明显,比如,新商品加分,口碑好的加分,图片清晰的加分,商品介绍详细的加分,大 ...
qindongliang1922 评论(2) 有4860人浏览 2016-05-12 17:49

浅谈Lucene中的DocValues

前言: 在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,这对于广大的solr和elasticsearch用户,无疑来说是一个福音,这玩意的出现通过牺牲一 ...
qindongliang1922 评论(2) 有7578人浏览 2016-05-10 19:12

开源大数据索引项目hive-solr

github地址:https://github.com/qindongliang/hive-solr 欢迎大家fork和使用 关于这个项目的介绍,请参考散仙前面的文章: http://qindongliang.iteye.com/blog/2283862 最新更新: (1)添加了对solrcloud集群的支持 (2)修复了在反序列时对于hive中null列和空值的处理bug (3)优化了在构建 ...
qindongliang1922 评论(0) 有1969人浏览 2016-05-06 16:15

Solr-DIH建立索引并执行简单初步的查询

我们将solr的安装目录设置为$SOLR_INSTALL,   ./solr start,不使用任何原有的examples来进行,启动完成后,不存在任何的core,提示No cores available。   在手动执行Add Core操作时,需要保证instanceDir和dataDir事先必须存在,以便能够建立目录成功。       根据错误提示,目录应该建立在$SOLR ...
brandNewUser 评论(0) 有2277人浏览 2016-05-04 13:40

浅谈Solr和ElasticSearch建索引性能优化策略

由于Solr和ElasticSearch都是基于Lucene构建的,所以他们之间有很大程度的相似性,故而他们的一些优化策略基本也是通用的,面对越来越多的海量数据, ...
qindongliang1922 评论(0) 有2208人浏览 2016-04-27 18:48

Solr查询语法

还以为网上的solr最基础的东西应该很多,结果发现je这边都是一些部署的资料。到没用人给最基本的查询语法。在做查询时十分吃力,自己整理了几个例子来分享下,希望别人不要再走弯路。   首先说下,查询都是基于solrj。如果不清楚solrj。可以当做是对solr查询语句的一个api封装。 solr的查询其实都是向select这个servlet穿字符型的参数,例如: Solr代码   ...
gqsunrise 评论(0) 有1518人浏览 2016-04-25 16:37

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics