本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
- kingwell.leng
最新文章列表
全文检索引擎Solr
Solr采用Lucene搜索库为核心,提供全文索引和搜索开源企业平台,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那么就和我一起来入门吧!本教程以solr4.8作为测试环境,jdk版本需要1.7及以上版本。
准备
本文假设你对Java有初中级以上水平,因此不再介绍Java相关环境的配置。下载解压缩solr,在example目录有start.jar文件,启动:
...
solr jetty start for debug
/*
* Licensed to the Apache Software Foundation (ASF) under one or more
* contributor license agreements. See the NOTICE file distributed with
* this work for additional information regarding ...
Solrcloud部署
Solrcloud部署文档
上传安装包
1. 上传solrcloud-imsearch.zip至/usr/local/im目录
2. 解压solrcloud-imsearch.zip,得到如下目录结构
配置zookeeper
1.修改zookeeper配置
cd zookeeper/conf/
vim zoo.cfg
a. 修改dataDir和dataLogDir目录或创建目录:
mkdir ...
Solr入门
由于现公司要强化一下搜索相关的功能,特对Solr及Lucene进行简要的研究,并做一些个人总结。
Solr采用Lucene搜索库为核心,提供全文索引和搜索的开源企业平台,提供REST的HTTP/XML和JSON的API。
Solr项目的英文主页:http://lucene.apache.org/solr/,其中介绍了Solr的基本情况:Solr is highly rel ...
Hadoop的8088页面失效问题
前两天重启了测试的hadoop集群,今天访问集群的8088任务监控页面,发现不能用了,总是报500错误,空指针异常,但是以前却是好好的
2016-03-31 10:59:55,418 ERROR org.mortbay.log: /cluster
java.lang.NullPointerException
at org.apache.http.client.utils. ...
tomcat 集成 Solr5.4.0 (Window 7 环境 )
方法步骤
1、解压 Tomcat 到一个目录,例如 F:\Apache\Tomcat
2、将 solr 压缩包中 solr-5.4.0/ D:\solr-5.4.0\server\solr-webapp\文件夹下有个webapp文件夹,将之复制到Tomcat\webapps\目录下,并改成solr (名字随意,通过浏览器进行访问solr管理界面时要用到)
3、将 solr 压缩包中 solr ...
solr学习笔记--从数据库中创建索引dataimport
solr4.10
1、需要准备的jar包;数据库驱动jar包 mysql-connector-java-5.1.17-bin.jar,solr-dataimporthandler-4.10.0.jar;
solrconfig.xml 中引入
<lib dir="F:/SolrHome/multicore/lib" regex=".*\.jar" ...
solr同义词的配置
格式编码为UTF-8
注:如下是基于solr-5.3.1进行的配置
schema.xml配置和同义词词库的配置
中文,这里采用mmseg4j作为分词器,同义词一般只要进行查询的配置就可以了,同义词的配置一般位于分词器的后面
下面是中文的同义词和分词的配置
<fieldType name="text_mmseg4j_simple" class="solr. ...
solr sharding策略
solr中含有两种sharding策略,一种是默认的compositeId(一致性hash),一般在指定numShards参数时,会自动切换到router="compositeId",如果采用compositeId方式,那么就不能动态增加shard。如果采用的是implicit方式,就可以动态的增加shard。
compositeId:该路由为一致性哈希路由,shards的哈希范 ...
solr的原子更新
solr的更新,目前网上基本流传了两个版本,一个是通过solrj来实现的,一个是通过自己写HttpClient来写的。
solrj来进行原子更新
主要分为如下几种:
set
add
remove
removeregex
inc
set设置或者替换掉指定的值,如果是null,或者是个空的集合,将会删除掉原来的值
add对于指定的字段增加一个值
remove删除掉指定字段的值
removeregex从多 ...
solr UTC时区的问题
solr中默认获取的是Timezone是UTC或者GMT时间(这两个时区是一致的),但是通常我们数据库中的时区,是取的当前的本地的时区,所以就要通过指定时区,这个可以在启动时,通过-Duser.timezone来指定,一般是通过GMT+08,来指定
bin/solr start -Duser.timezone=GMT+08 -c -z 192.168.36.84:2181/solr -Dcom.su ...
solr4.7.2+mmseg2.0+pinyinAnalyzer实现拼音、简拼检索
生产环境:
solr4.7.2
jdk1.6
lucene4.7.2
mmseg4j-core-1.10 (https://github.com/chenlb/mmseg4j-core.git)
mmseg-solr-2.0 (https://github.com/chenlb/mmseg4j-solr.git)
pinyin4j-2.5.0
pinyinAnalyzer (htt ...