最新文章列表

Elasticsearch 合理内存分配

Elasticsearch默认安装后设置的内存是1GB,对于任何一个业务部署来说,这个都太小了。如果你正在使用这些默认堆内存配置,你的集群配置可能有点问题 ...
weitao1026 评论(0) 有561人浏览 2016-11-08 12:08

基于lucene的内嵌式kv存储

应用背景 诸多业务场景下,都有使用kv型式存储数据供快速查询的需求。正常的做法有使用HashMap存入内存,或者存入外部的nosql KV数据库/缓存。 使用HashMap做KV存储,速度快,但是如果数据量达到百万及至千万级时,HashMap必将占用大量的java堆内存,给应用带来极大的内存回收压力。 外部kv存储,以堆外(offHeap)存储的方式让我们的应用免于内存回收之忧,但其查询 ...
quentinXXZ 评论(1) 有2516人浏览 2016-10-24 21:53

如何使用neo4j存储树形无限级菜单

对于树形菜单,想必大家都不陌生,这种业务数据,由于量小,关系复杂,所以在关系型数据库中,存储的格式一般都如下所是: id,name,pid 01,bigdata,0 ...
qindongliang1922 评论(1) 有2367人浏览 2016-10-13 10:27

lucene分组查询中问题总结

最近需求中需要使用lucene的分组查询,现有API使用GroupingSearch查询,代码如下: GroupingSearch groupingSearch = new GroupingSearch("compId"); groupingSearch.setGroupSort(new Sort(SortField.FIELD_SCORE)); groupin ...
lvyanglin 评论(0) 有1135人浏览 2016-09-29 23:18

ElasticSearch+Solr几个案例笔记

(一) 最大能索引字符串的长度 关于能索引最大的字符串长度,其实在Elasticsearch和Solr中都是由底层的Lucene决定的 (1)不分词+索引的字符串最大长度 ...
qindongliang1922 评论(0) 有1945人浏览 2016-09-22 18:46

lucene 增加匹配权重

在用 自由侠_jeep 作为关键字搜索时 索引中有2个文档 1 jeep自由侠(进口) 2 jeep自由侠 由于jeep与自由侠出现频率相同 所以两个文档分数相同 于是我针对所有进口车系 增加判断 String sname = s.getZhName(); if (!sname.contains("进口")){     sname = s ...
天堂飘过 评论(0) 有1045人浏览 2016-09-06 11:16

Lucene烈火狂奔(第二话)

Lucene涅槃重生(第二话)
u012285319 评论(0) 有469人浏览 2016-08-18 01:16

lucene spatial 6.1搜索附近的饭店

1.maven用依赖如下 <properties> <lib.lucene.version>6.1.0</lib.lucene.version> </properties> <dependency> <groupId>com.fasterxml. ...
xpenxpen 评论(0) 有2292人浏览 2016-08-15 15:56

Lucene查询语法详解[转]挺有用的所以转了,希望对大家有帮助

Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Query Parser提供的强大的查询语法解析来构造你想要的查询器。本文章详细的介绍了Lucene的查询语法。通过Java语法分析器把一个查询字符串解析成 Lucene的查询器。在你选择使用Query Parser前,请考虑以下事项:如果你打算在程序中拼接查询语法串然后再利用Query Parser转换,那么强烈建议你利用 ...
wj.geyuan 评论(0) 有465人浏览 2016-08-06 17:02

ansj_Seg5.0.1版本与lucene的集成以及ansj_seg 5.0.1使用

首先之前的ansj2.X版本需要导入两个包ansj_seg-2.0.8-min..jar、nlp-lang-0.2.jar。 现在只需要导入一个包就OK了 简单方便了ansj_seg-5.0.1-all-in-one.jar 好了不说了。直接贴与lucene的代码 其实就这么一句话,就OK了。 public static Analyzer analyzer = new AnsjAnalyzer ...
wj.geyuan 评论(0) 有2439人浏览 2016-08-04 11:04

Lucene-5.5.2 Field域创建时,分词与不分词的理解

首页,大家可以先看下这个文章引用【http://iamyida.iteye.com/blog/2194345】 我以前是用的是lucene 3.X版本,后来某些原因要更新到lucene 5.x版本,所以选择了5.5.2版本,在升级的过程中查阅了资料。其中就是在LUCENE4 版本及以前都是使用 doc.add(new Field(groupName, dwgContent, Field.Stor ...
wj.geyuan 评论(0) 有1751人浏览 2016-07-21 18:07

SolrCloud之Sharding路由介绍

在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是: (1)大数据量下更高的性能 (2)更好扩展性 (3)更高的可靠性 (4)更简单易用 什么时候应该使用SolrCloud(Shard)呢? (1)更大的数据量 (2)更大的索引体积 (3)想并行索引和查询 (4)想自定义数据分区 SolrCloud路由的分类 A:显式路由(Composi ...
qindongliang1922 评论(0) 有3440人浏览 2016-07-19 16:07

SolrCloud6.1.0之SQL查询测试

Solr发展飞快,现在最新的版本已经6.1.0了,下面来回顾下Solr6.x之后的一些新的特点: (1)并行SQL特性支持,编译成Streaming 表达式,可以在solrcloud集 ...
qindongliang1922 评论(2) 有2382人浏览 2016-07-12 11:21

lucene在本地文件建索引和搜索

    添加如下的maven依赖: <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId> <version>6.1.0</version> </dep ...
dreamoftch 评论(0) 有1232人浏览 2016-06-30 16:56

Lucene/Solr/ElasticSearch搜索问题案例分析

最近收集的两个搜索的case,如下: 案例一: 使用 A关键词:“中国诚通控股公司”搜索,不能搜到 B结果“中国诚通控股集团有限公司” 从关键词 ...
qindongliang1922 评论(0) 有1849人浏览 2016-06-23 18:08

最近博客热门TAG

Apache(33931) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics