本月博客排行
-
第1名
wy_19921005 -
第2名
mft8899 -
第3名
benladeng5225 - Anmin
- wddpwzzhao123
年度博客排行
-
第1名
龙儿筝 -
第2名
宏天软件 -
第3名
benladeng5225 - wy_19921005
- vipbooks
- kaizi1992
- e_e
- tanling8334
- 青否云后端云
- sam123456gz
- arpenker
- zysnba
- fantaxy025025
- xiangjie88
- wallimn
- lemonhandsome
- jh108020
- ganxueyun
- Xeden
- xyuma
- wangchen.ily
- zhanjia
- johnsmith9th
- zxq_2017
- forestqqqq
- jbosscn
- daizj
- xpenxpen
- 喧嚣求静
- kingwell.leng
- lchb139128
- kristy_yy
- jveqi
- javashop
- lzyfn123
- sunj
- yeluowuhen
- ajinn
- lerf
- silverend
- chenqisdfx
- xiaoxinye
- flashsing123
- lyndon.lin
- bosschen
- zhangjijun
- sunnylocus
- lyj86
- paulwong
- sgqt
最新文章列表
solr4.3的入门配置
solr4.3的入门配置 目前阿帕奇官方仅推荐2个比较稳定的版本一个是4.3的版本,一个3.6的版本 3.6的版本没有用过,所以在此无涉及,下面就来说说solr4.3的入门配置 solr4.3与solr4.2最大的区别就在与solr4.3的日志模块与核心模块分离出来了 所以在进行安装配置时需要另行配置,其他的步骤基本与solr4.2的相同 准备环境tomcat ...
solr检索建议的功能
比较详细的介绍了拼写检查的功能,本篇笔者就来说一下检索建议的功能,可能好多才学的solr的人,都容易把二者搞混,误以为他们是同一个东西,其实不然,他们的侧重点,还是不同的,拼写检查就是用来检查用户输入的检索内容是否存在,如果不存在则,给它提示出相近,或相似的内容,而检索建议则是用户输入某个检索条件后,会立刻友好的给出一系列提示内容,并推荐首个出现的相似的词,作为推荐词。如果这个条件想关的东西一个 ...
solr中文分词的种类
上一篇讲了使用solr4.3自带的smartcn进行中文分词,这一篇说一下,怎么使用IK进行分词, 在这之前先对中文分词的种类介绍一下,目前的中文分词主要有两种 1,基于中科院ICTCLAS的隐式马尔科夫hhmm算法的中文分词器,例如smartcn等。(不支持自定义扩展词库) 2,基于正向迭代最细粒度切分算法(正向最大匹配并且最细分词)例如IK,庖丁等(支持自定义扩展词库) 安装分词前,可以去h ...
solr4.3默认的分词器
solr4.3默认的分词器是一元分词器,这个本来就是对英文进行分词的,英文大部分就是典型的根据空格进行分词,而中文如果按照这个规则,那么显然是要有很多的冗余词被分出来,一些没有用的虚词,数词,都会被分出来,影响效率不说,关键是分词效果不好,所以可以利用solr的同步发行包smartcn进行中文切词,smartcn的分词准确率不错,但就是不能自己定义新的词库,不过smartcn是跟solr同步的, ...
solr增量索引配置
solr增量索引配置 1.在进行增量索引前,首先要弄懂几个必要的属性,以及数据库建表事项,和dataimporter.properties data-config.xml里面的数据 <!-- transformer 格式转化:HTMLStripTransformer 索引中忽略HTML标签 ---> <!-- query:查询 ...
solr从数据库导入数据到索引中
solr从数据库导入数据到索引中 准备工作需要从solr4.2中C:\Users\cuichao\Desktop\solr\solr-4.2.1\dist目录下 把solr-dataimporthandler-4.2.1.jar包拷到D:\tomcat6\apache-tomcat-6.0.36.0\webapps\solr\WEB-INF\lib目录下 第一步,需要在solrconfig.x ...
Hbase+Solr实现二级索引提供高效查询
接着上一篇介绍协处理器的文章http://qindongliang.iteye.com/blog/2277145,本篇我们来实战一个例子,看下如何使用协处理来给Hbase建立二级索引。
github地址:h ...
Solr DocValues详解
什么是docValues?
docValues是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的。
为什么要使用docValues?
这种形式比老版本中利用fieldCache来实现正排查找更加高效,更加节省内存。倒排索引将字段内存切分成一个term列表,每个term都对应着一个docid列表,这样一种结构使得查询 ...
如何使用Spark大规模并行构建索引
使用Spark构建索引非常简单,因为spark提供了更高级的抽象rdd分布式弹性数据集,相比以前的使用Hadoop的MapReduce来构建大规模索引,Spark具有更灵活的api操作,性能更高,语法更简洁等一系列优点。
先看下,整体的拓扑图:
然后,再来看下,使用scala写的spark程序:
package com.easy.build.index
import jav ...
Solr facet rage 查询
需求是在按照某一个时间字段统计在一个时间区间中,以天为单位统计时间单位内的记录条数:
使用的Solr file type是:org.apache.solr.schema.TrieDateField
查询url是:
http://10.1.7.41:8983/solr/search4totalpay_shard1_replica1/select?
fl ...
solr5.2..1中关于velocity搜索界面的部分配置
确定分面字段。
参考文档:\ solr-5.2.1\example\files\README.txt 的内容在Ubuntu平台操作,
得到 solr-5.2.1/server/solr/files/conf/velocity 文件夹
复制到 core或collection中的conf文件夹中。
修改solrconfig.xml文件。配置velocity writer
修改参考:solr-5.2.1 ...
中文分词mmseg4j+solr 5.3.1配置
基础环境:
solr 5.3.1
mmseg4j-solr-2.3.0.jar
mmseg4j-core-1.10.0.jar
CentOS release 6.2 (Final)
java version "1.7.0_71"
jar添加:
位置:solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib
配置:
在schema.xml中 ...
Caused by: org.apache.solr.common.SolrException: Invalid UUID String: '1'
问题:引用Caused by: org.apache.solr.common.SolrException: Invalid UUID String: '1'
参考:https://issues.apache.org/jira/browse/SOLR-3398
当使用
<fieldType name="uuid" class="solr.UUIDField&qu ...
solr5 配置 与 创建core
1. 准备安装包(保证tomat能正常启动)
solr5.0
tomcat-7.0.41
JDK6
2 配置部署solr
2.1 启动tomcat
2.2 将solr/server/webapps/solr.war 拷贝到tomcat的webapps下。tomat会自动解压发布。