最新文章列表

solr中文搜索倒排索引和数据存储结构

传统的方式(正排索引)是从关键点出发,然后再通过关键点找到关键点代表的信息中能够满足搜索条件的特定信息,既通过KEY寻找VALUE。而Lucene的搜索 ...
aoyouzi 评论(0) 有3163人浏览 2016-04-17 15:09

SolrJ操作solr API

使用SolrJ操作Solr会比利用httpClient来操作Solr要简单。SolrJ是封装了httpClient方法,来操作solr的API的。SolrJ底层还是通过使用httpClient中的方法来完成Solr的操作。 1、 首先,你需要添加如下jar包 其中apache-solr-solrj-3.4.0.jar、slf4j-api-1.6.1.jar可以在下载的apache-sol ...
aoyouzi 评论(0) 有1850人浏览 2016-04-17 15:06

全文检索引擎Solr

Solr采用Lucene搜索库为核心,提供全文索引和搜索开源企业平台,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那么就和我一起来入门吧!本教程以solr4.8作为测试环境,jdk版本需要1.7及以上版本。 准备 本文假设你对Java有初中级以上水平,因此不再介绍Java相关环境的配置。下载解压缩solr,在example目录有start.jar文件,启动: ...
aoyouzi 评论(0) 有1518人浏览 2016-04-17 15:05

solr 应用相关

http://my.oschina.net/lsf930709/blog/620738 (solr 5.5  开发环境的搭建) http://iamyida.iteye.com/category/338597 (solr 牛人的博客,19篇) http://my.oschina.net/scottCoder/blog/640653 (solr 5.5 直接用自带的jetty启动配置开发环境) ...
yjph83 评论(0) 有1013人浏览 2016-04-13 16:40

solr jetty start for debug

/* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for additional information regarding ...
wingoal 评论(0) 有524人浏览 2016-04-08 18:04

Solrcloud部署

Solrcloud部署文档 上传安装包 1. 上传solrcloud-imsearch.zip至/usr/local/im目录 2. 解压solrcloud-imsearch.zip,得到如下目录结构 配置zookeeper 1.修改zookeeper配置 cd zookeeper/conf/ vim zoo.cfg a. 修改dataDir和dataLogDir目录或创建目录: mkdir ...
ledefe 评论(0) 有506人浏览 2016-04-07 16:42

Solr入门

  由于现公司要强化一下搜索相关的功能,特对Solr及Lucene进行简要的研究,并做一些个人总结。    Solr采用Lucene搜索库为核心,提供全文索引和搜索的开源企业平台,提供REST的HTTP/XML和JSON的API。   Solr项目的英文主页:http://lucene.apache.org/solr/,其中介绍了Solr的基本情况:Solr is highly rel ...
brandNewUser 评论(0) 有1462人浏览 2016-04-06 21:15

Hadoop的8088页面失效问题

前两天重启了测试的hadoop集群,今天访问集群的8088任务监控页面,发现不能用了,总是报500错误,空指针异常,但是以前却是好好的 2016-03-31 10:59:55,418 ERROR org.mortbay.log: /cluster java.lang.NullPointerException at org.apache.http.client.utils. ...
qindongliang1922 评论(0) 有4450人浏览 2016-03-31 11:21

Mongodb 和 Solr 实时同步

   大数据搜索 博客上线了     一、安装前准备   1、mongo-connector(基于python)中间件   2、python-3.4.3.msi   3、Mongodb     4、Solr 二、配置Mongodb集群   1)、配置replica set     我的MONGO_HOME为 F:\mongodb     目录树如下:     -r ...
netuml 评论(0) 有1250人浏览 2016-03-22 10:09

tomcat 集成 Solr5.4.0 (Window 7 环境 )

方法步骤 1、解压 Tomcat 到一个目录,例如 F:\Apache\Tomcat 2、将 solr 压缩包中 solr-5.4.0/ D:\solr-5.4.0\server\solr-webapp\文件夹下有个webapp文件夹,将之复制到Tomcat\webapps\目录下,并改成solr (名字随意,通过浏览器进行访问solr管理界面时要用到) 3、将 solr 压缩包中 solr ...
henu_zhangyang 评论(0) 有1552人浏览 2016-03-18 15:17

如何使用Hive集成Solr?

(一)Hive+Solr简介 Hive作为Hadoop生态系统里面离线的数据仓库,可以非常方便的使用SQL的方式来离线分析海量的历史数据,并根据分析的结果,来干一 ...
qindongliang1922 评论(0) 有2846人浏览 2016-03-17 15:05

solr学习笔记--从数据库中创建索引dataimport

solr4.10  1、需要准备的jar包;数据库驱动jar包  mysql-connector-java-5.1.17-bin.jar,solr-dataimporthandler-4.10.0.jar; solrconfig.xml 中引入 <lib dir="F:/SolrHome/multicore/lib" regex=".*\.jar" ...
yovi 评论(0) 有763人浏览 2016-03-17 14:43

solr同义词的配置

格式编码为UTF-8 注:如下是基于solr-5.3.1进行的配置 schema.xml配置和同义词词库的配置 中文,这里采用mmseg4j作为分词器,同义词一般只要进行查询的配置就可以了,同义词的配置一般位于分词器的后面 下面是中文的同义词和分词的配置      <fieldType name="text_mmseg4j_simple" class="solr. ...
yiduwangkai 评论(0) 有1876人浏览 2016-03-16 14:45

solr sharding策略

solr中含有两种sharding策略,一种是默认的compositeId(一致性hash),一般在指定numShards参数时,会自动切换到router="compositeId",如果采用compositeId方式,那么就不能动态增加shard。如果采用的是implicit方式,就可以动态的增加shard。 compositeId:该路由为一致性哈希路由,shards的哈希范 ...
yiduwangkai 评论(0) 有1490人浏览 2016-03-16 14:38

solr的原子更新

solr的更新,目前网上基本流传了两个版本,一个是通过solrj来实现的,一个是通过自己写HttpClient来写的。 solrj来进行原子更新 主要分为如下几种: set add remove removeregex inc set设置或者替换掉指定的值,如果是null,或者是个空的集合,将会删除掉原来的值 add对于指定的字段增加一个值 remove删除掉指定字段的值 removeregex从多 ...
yiduwangkai 评论(0) 有1402人浏览 2016-03-16 14:35

solr UTC时区的问题

solr中默认获取的是Timezone是UTC或者GMT时间(这两个时区是一致的),但是通常我们数据库中的时区,是取的当前的本地的时区,所以就要通过指定时区,这个可以在启动时,通过-Duser.timezone来指定,一般是通过GMT+08,来指定 bin/solr start -Duser.timezone=GMT+08 -c -z 192.168.36.84:2181/solr -Dcom.su ...
yiduwangkai 评论(0) 有3096人浏览 2016-03-16 14:30

Solr查询语法

一.基本查询   q – 查询字符串,必须的。fl – 指定返回那些字段内容,用逗号或空格分隔多个。start – 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。rows – 指定返回结果最多有多少条记录,配合start来实现分页。sort – 排序,格式:sort=<field name>+<desc|asc>[,<field name> ...
lucien_zzy 评论(0) 有3114人浏览 2016-03-15 20:01

solr4.7.2+mmseg2.0+pinyinAnalyzer实现拼音、简拼检索

生产环境: solr4.7.2 jdk1.6 lucene4.7.2 mmseg4j-core-1.10 (https://github.com/chenlb/mmseg4j-core.git) mmseg-solr-2.0 (https://github.com/chenlb/mmseg4j-solr.git) pinyin4j-2.5.0 pinyinAnalyzer (htt ...
冰糖葫芦 评论(4) 有4035人浏览 2016-03-14 13:02

Solr中如何使用游标进行深度分页查询

通常,我们的应用系统,如果要做一次全量数据的读取,大多数时候,采用的方式会是使用分页读取的方式,然而 分页读取的方式,在大数据量的情况 ...
qindongliang1922 评论(0) 有3808人浏览 2016-03-10 16:34

Zookeeper+SolrCloud+Tomcat搭建分布式搜索应用

一.简介 SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式。 二.特色功能 SolrCloud有几个特色功能: 集中式的配置信息 使用ZK进行集中配置。启动时可以指定把Solr的相关配置文件上传Zookeeper ...
suko 评论(0) 有1034人浏览 2016-03-10 15:39

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics