最新文章列表

Lucene 中的Tokenizer, TokenFilter学习

  lucene中的TokenStream,TokenFilter之间关系   TokenStream是一个能够在被调用后产生语汇单元序列的类,其中有两个类型:Tokenizer和TokenFilter,两者的不 ...
brandNewUser 评论(0) 有3586人浏览 2016-06-15 10:03

本地通过源码方式启动solr

  首先,下载solr5.5.0源码,http://apache.fayea.com/lucene/solr/5.5.0/solr-5.5.0-src.tgz   解压完成后,分为几个目录,然而solr是通过ant编译的,我们想将其转换为maven方式,发现其中存在dev-tools/maven中,其中对应的说明:   Copy the Maven POM templates f ...
brandNewUser 评论(0) 有2438人浏览 2016-06-14 11:41

[转]lucene中Field.Index,Field.Store详解

  lucene在doc.add(new Field("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED));Field有两个属性可选:存储和索引。 通过存储属性你可以控制是否对这个Field进行存储; 通过索引属性你可以控制是否对该Field进行索引。 事实上对这两个属性的正确组合很重要 ...
CurrentJ 评论(0) 有840人浏览 2016-06-06 20:01

solr5.x快速入门

  转载请声明出处,谢谢。翻译也很辛苦      solr学习交流扣扣群340954928      快速开始   Solr为程序员开发复杂,高性能与先进的搜索应用程序功能,如分类(安排搜索结果列数值项关键术语)。
韩悠悠 评论(1) 有3766人浏览 2016-06-06 19:39

Lucene+Solr+ElasticSearch查询匹配优化

当我们在处理搜索业务时候,需求往往是灵活多变的,有时候我们需要精确匹配,有时候我们又需要全文检索,而有时候,我们又想匹配度高而且还能全文检索,这似乎是精确匹配和模糊匹配一个妥协的策略,没错这就是搜索引擎出现的目的,以往的数据库是没法解决这种问题的,数据库只能回答有,没有,存在,不存在,并不能在有和没有之间做一个完美的妥协,比如说能把最匹配最相关的结果放在topN,仅靠like模糊查询是解决不了这种 ...
qindongliang1922 评论(0) 有2933人浏览 2016-06-01 19:37

Lucene根据字段进行自定义搜索扩展

最近需要对公司的产品搜索功能做一步改动,搜索到的结果首先按照是否有库存进行排序,然后再按照销量。由于库存量也是一个整数,如果直接按照库存量进行倒序排序的话,是不符合要求的,Lucene也没有支持我们这种特殊的业务需求,但是可以通过扩展的方式进行改写。   参考文档:http://blog.csdn.net/cctcc/article/details/45672247   publi ...
brandNewUser 评论(0) 有1295人浏览 2016-05-13 09:16

Solr Suggest组件的使用

使用suggest的原因,最主要就是相比于search速度快,In general, we need the autosuggest feature to satisfy two main requirements:   ■ It must be fast; there are few things that are more annoying than a clunky type- a ...
brandNewUser 评论(0) 有4337人浏览 2016-05-12 18:57

如何实现Solr自定义评分查询

(一)背景介绍 大多数时候我们使用lucene/solr/elasticsearch自带的评分查询都是没问题的,当然这也仅仅限于简单的业务或者对搜索排名 不敏感的场景中,假设业务方要求有若干业务因子要干扰到排名,同时还不能放弃框架本身的文本相似度评分,那么应该怎么做呢? 这种场景尤其是在电商类的一些垂直搜索中体现比较明显,比如,新商品加分,口碑好的加分,图片清晰的加分,商品介绍详细的加分,大 ...
qindongliang1922 评论(2) 有4860人浏览 2016-05-12 17:49

浅谈Lucene中的DocValues

前言: 在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,这对于广大的solr和elasticsearch用户,无疑来说是一个福音,这玩意的出现通过牺牲一 ...
qindongliang1922 评论(2) 有7578人浏览 2016-05-10 19:12

Lucene5 Facet DrillDownQuery DrillSideways 学习

Facet 是用来统计你的查询结果在某个事先索引的字段下的信息。 比如你索引了一些本地文件,然后某个查询返回了1000个文件结果,其中包含100个txt,200个pdf,300个word,400个html。 这时就可以有这些Facet信息. txt - 100 pdf - 200 word - 300 html - 400 这个内容可以显示在搜索的页面上。 1. 给Facet信息创建index ...
gaoshuaidage 评论(0) 有483人浏览 2016-05-08 15:33

最近博客热门TAG

Apache(33931) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics