- 浏览: 577367 次
- 性别:
- 来自: 北京
-
最新评论
-
w592376568:
博主:添加后修改索引后,如何实现实时搜索啊??
Lucene5学习之LuceneUtils工具类简单封装 -
mohaoyang:
同意12楼的说法,close方法,单例的意义如何,每次clos ...
Lucene5学习之LuceneUtils工具类简单封装 -
kingxianstar:
8837One_day 写道你好作者,所有的配置文件都配置了, ...
跟益达学Solr5之增量索引MySQL数据库表数据 -
yingyong01:
...
跟益达学Solr5之拼音分词[改进版] -
8837One_day:
你好作者,所有的配置文件都配置了,在数据库中也添加新的一条数据 ...
跟益达学Solr5之增量索引MySQL数据库表数据
文章列表
OK,直接开门见山,不绕弯子啦!基于上篇博客,我们知道了在Solr中配置分词器有两种方式,一种是直接配置分词器类,比如:
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>
一种是配置TokenizerFactory类,由于Solr API中并没有 ...
在Solr中该如何使用IK分词器呢,这是小伙伴们问的频率比较高的一个问题,今晚特此更新此篇博客。其实之前我在其他博客里已经使用了IK分词器,只是我没做详细说明。
在schema.xml配置中其实有很多关于分词 ...
2015年6月7日,Solr已经更新到5.2.0,所以这里我以5.2.0版本为例,你使用Solr5.x都是类似的区别不大。开始之前,首先你需要去Solr官网去下载Solr5源码,如图: taz包其实是可以使用Winrar解压的,解压后如图: 我是解压到F:\javazipfile目录下,官方默认提供的源码包并不是一个标准的Eclipse Java Project,需要使用ivy进行构建,通过ivy的构建可以将下载下来的源码包转换成一个标准的Java Project,然后我们就能把Java Project import到我们的Eclipse中去了,然后你就能在Eclipse ...
Facet属于Solr的高级查询部分,之所以在还没有讲解普通Query之前,就开始更新Facet查询,是因为看到很多小伙伴都在为Facet而困扰,其实根本原因还是对Facet不理解。Facet英文单词本意是方面的意思,但在solr中Facet一般翻译 ...
异常信息如下:
Plugin execution not covered by lifecycle configuration: org.codehaus.mojo:aspectj-maven-plugin:1.3.1:compile (execution: default, phase: compile)
Eclipse中提示如图: 解决办法: 点击back后退,先安装ajdt插件,如图: ...
假定你有这样一堆JSON数据,
[
{"id":"1", "name":"Red Lobster", "city":"San Francisco, CA", "type":"Sit-down Chain", "state":"California", "tags":["sea food", "sit down&quo ...
Solr5中如何增量索引MySQL数据库表中的数据,这个问题之前有某个童鞋问过我,今天午休时间就腾空更新篇博客,希望能帮助到你们。
为了测试方便,我首先从京东网站弄了点测试数据,如图: 这里要声明下,我不是在给京东商城打广告哈,仅仅是随便找个网站弄点测试数据,这部分工作全是我无聊手动插入MySQL数据库中的,如图: 建表SQL以及测试数据,我待会儿会上传到底下的附件里。然后你需要在solrconfig.xml配置文件中启用全量导入和增量导入请求处理器,如图: 然后分别配置你的data-config.xml和delta-data-config.xml配置文件, ...
我们的文件有时候不在本地,可能是在网络上,这时候我们该如何对其进行索引呢?当然你可以先通过爬虫把它抓取下来保存到本地硬盘,然后通过上篇博客介绍的方式对其进行索引,其实Solr内置了URLDataSource,支持直接获取远程资源进行索引的,下面就详细介绍该如何配置实现。废话不多说,我直接贴相应的配置文件: solrconfig.xml配置文件基本没什么变化,依赖的jar请从上篇博客里获取, 关键点是dataSource必须是urlDataSource类型才能加载远程资源文件,url表示一个远程资源文件的访问URL。 最后你需要在schema.xml配置文件中定义一个text域, ...
上篇我们学习了如何从PDF文件中提取文本进行索引,今天我们来学习如何对一个文件夹下所有文本文件进行索引。废话不多说,我直接贴相关配置:
首先依然是在solrconfig.xml配置文件中配置dataimport请求处理器,并指定data-config.xml配置文件加载路径:
<requestHandler name="/dataimport" class="solr.DataImportHandler">
<lst name="defaults">
& ...
开始此篇之前,我假定你已经学会了如何在Tomcat下部署Solr5啦。即启动Tomcat后你能看到Solr5的Web UI界面。OK,下面直接进入正题。
首先你需要在你的core根目录下新建一个lib目录来存放依赖的jar包,当然你也 ...
schema.xml是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即Norms,是否存储项向量等等。
schema.xml配置文件的根元素就是schema,有个name属性,name属性值可以随便配,根元素没什么好说的,schema元素下主要有两个标签元素即field和fieldType,field表示域,用来定义域,fieldType用来定义域类型。
field元素有很多属性可以配置,我一一做个解释:
name: 表示域的名称,是强制必须有的属性
type: 域类型的名称,与fieldTy ...
solrconfig.xml配置文件中包含了很多solr自身配置相关的参数,solrconfig.xml配置文件示例可以从solr的解压目录下找到,如图: 用文本编辑软件打开solrconfig.xml配置,你将会看到以下配置内容:
<?xml version="1.0" encoding="UTF-8" ?>
<!--
Licensed to the Apache Software Foundation (ASF) under one or more
contributor license agree ...
学习Solr之前,我想对于初学Solr的小伙伴们来说, Solr的core概念是最令人头疼的,到底该怎么理解Solr中的core呢?以下是我从Solr的官方文档中摘下来的一段文字说明:
In Solr, the term core is used to refer to a single index and associated transaction log and configuration files (including schema.xml and solrconfig.xml, among others). Your Solr installation can have mul ...
最近有小伙伴跟我抱怨说:益达,最近博客更新的有点慢呐。其实不是我变懒了,我是不想因为数量而降低了博客的质量,我需要抱着对你们负责的态度来写每一篇博客,绝不能含糊啊,所以,还望大家多多包涵呐。
今天群里一朋友问我Solr如何对数据库表里的数据进行索引,为此,今晚特地更新此篇博客,这里我以Solr当前最新版本5.1.0,数据库MySQL为例进行讲解说明。
首先我们需要准备一张测试表,如图: 测试表创建好了之后,我们需要让表里插入几条测试数据,如图: 然后需要把E:\solr-5.1.0\dist目录下的solr-dataimporthandler-5.1.0.jar
最近忙着面试以及生活琐事把时间都霸占了,博客拖了4天没更新了,让各位久等了,望多多包涵!不过还好,工作已经敲定了,终于可以安心的学习Solr并分享我学习的点点滴滴啦!
上回我们在Jetty下部署了,不过我想小伙伴们使用Tomcat还是要多点,所以这回我们就来试试把Solr5部署到Tomcat下,这里以Win7 64bit Tomcat7.0.55为例,linux环境下同理,没太大区别:
首先你要去Solr官网下载Solr5.x的zip压缩包,至于怎么下载我这里就不赘述了,如果你不知道如何下载,请先参阅《跟益达学Solr5之使用Jetty部 ...