本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- Xeden
- luxurioust
- lzyfn123
- zhanjia
- forestqqqq
- johnsmith9th
- nychen2000
- ajinn
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- mwhgJava
- silverend
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
最新文章列表
Elasticsearch 创建客户端(二)
原文链接:http://blog.csdn.net/geloin/article/details/8476508
3. org.elasticsearch.client.ClusterAdminClient接口
ClusterAdminClient提供了对针对集群的action和operation的管理接口。它有以下方法:
1) health(ClusterHealthRe ...
Elasticsearch 创建客户端(一)
原文链接:http://blog.csdn.net/geloin/article/details/8448691
在elasticsearch源代码中,进入到org.elasticsearch.client,你会发现下图所示的类:
我们从最外层开始。
1 org.elasticsearch.client.AdminClient接口
AdminClient下有两个方法:1) c ...
分布式搜索Elasticsearch源码分析之二------索引过程源码概要分析
原文链接:http://www.searchtech.pro/articles/2013/02/15/1360941961206.html
elasticsearch的索引逻辑简单分析,这里只是理清主要的脉络,一些细节方面以后的文章或会阐述。
假如通过java api来调用es的索引接口,先是构造成一个json串(es里表示为XContent,是对要处理的内容进行抽象), ...
Elasticsearch源码分析之一——使用Guice进行依赖注入与模块化系统
原文链接:http://www.searchtech.pro/articles/2013/02/15/1360942810308.html
elasticsearch使用google开源的依赖注入框架guice,这个项目号称比spring快100倍,具体性能没有测试过,不过由于其代码比较简洁,比spring快很有可能,是不是快那么多就不知道了。先介绍下guice的基本使用方法。
...
Elasticsearch 数据建模 - 处理关联关系(2)
原文链接:http://blog.csdn.net/dm_vincent/article/details/47710591
字段折叠(Field Collapsing)
一个常见的需求是通过对某个特定的字段分组来展现搜索结果。我们或许希望通过对用户名分组来返回最相关的博文。对用户名分组意味着我们需要使用到terms聚合。为了对用户的全名进行分组,name字段需要有not_ ...
Elasticsearch 数据建模 - 处理关联关系(1)
原文链接:http://blog.csdn.net/dm_vincent/article/details/47710367
数据建模(Modeling Your Data)
ES是一头不同寻常的野兽,尤其是当你来自SQL的世界时。它拥有很多优势:性能,可扩展性,准实时的搜索,以及对大数据的分析能力。并且,它很容易上手!只需要下载就能够开始使用它了。
但是它也不是魔法。为 ...
Elasticsearch 过滤查询以及聚合(Filtering Queries and Aggregations)
原文链接:http://blog.csdn.net/dm_vincent/article/details/42757519
本章翻译自Elasticsearch官方指南的Filtering Queries and Aggregations一章。
过滤查询以及聚合
A natural extension to aggregation scoping is filte ...
Elasticsearch 聚合作用域(Scoping Aggregations)
原文链接:http://blog.csdn.net/dm_vincent/article/details/42695339
聚合作用域(Scoping Aggregations)
到现在给出的聚合例子中,你可能已经发现了在搜索请求中我们省略了query子句。整个请求只是一个简单的聚合。
聚合可以和搜索请求一起运行,但是你需要理解一个新概念:作用域(Scope)。默认情况下, ...
Elasticsearch 聚合 - 时间数据处理(Looking at Time)
原文链接:http://blog.csdn.net/dm_vincent/article/details/42594043
本章翻译自Elasticsearch官方指南的Looking at Time一章。
时间数据处理(Looking at Time)
如果在ES中,搜索是最常见的行为,那么创建日期柱状图(Date Histogram)肯定是第二常见的。为什么要 ...
Elasticsearch 聚合的测试数据
原文链接: http://blog.csdn.net/dm_vincent/article/details/42407823
本章翻译自Elasticsearch官方指南的Aggregation Test-Drive一章。
聚合的测试数据(Aggregation Test-Drive)
我们将学习各种聚合以及它们的语法,但是最好的学习方法还是通过例子。一旦你了解了 ...
Elasticsearch 聚合中的重要概念 - Buckets(桶)及Metrics(指标)
原文链接:http://blog.csdn.net/dm_vincent/article/details/42387161
本章翻译自Elasticsearch官方指南的Aggregations-High-level Concepts一章。
高层概念(High-Level Concepts)
和查询DSL一样,聚合(Aggregations)也拥有一种可组合(Co ...
Elasticsearch 控制相关度 (六) - function_score查询中的filter,functions及random_score参数
原文链接:http://blog.csdn.net/dm_vincent/article/details/42201789
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
根据过滤子集来提升(Boosting F ...
Elasticsearch 控制相关度 (五) - function_score查询及field_value_factor,boost_mode,max_
原文链接:http://blog.csdn.net/dm_vincent/article/details/42201721
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
function_score查询
function_sco ...
Elasticsearch 控制相关度 (四) - 忽略TF/IDF
原文链接:http://blog.csdn.net/dm_vincent/article/details/42157577
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
忽略TF/IDF
有时我们不需 ...
Elasticsearch 控制相关度 (三) - 通过查询结构调整相关度以及boosting查询
原文链接:http://blog.csdn.net/dm_vincent/article/details/42134905
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。
通过查询结构调整相关度
ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询:
...
Elasticsearch 部分匹配 (四) - 索引期间优化ngrams及索引期间的即时搜索
原文链接:http://blog.csdn.net/dm_vincent/article/details/42076191
本章翻译自Elasticsearch官方指南的Partial Matching一章。
索引期间的优化(Index-time Optimizations)
目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(Index ...
Elasticsearch 部分匹配 (三) - 查询期间的即时搜索
原文链接:http://blog.csdn.net/dm_vincent/article/details/42059387
本章翻译自Elasticsearch官方指南的Partial Matching一章。
查询期间的即时搜索(Query-time Search-as-you-type)
现在让我们来看看前缀匹配能够如何帮助全文搜索。用户已经习惯于在完成输入之前就 ...
Elasticsearch 部分匹配 (一) - 前缀查询
原文链接:http://blog.csdn.net/dm_vincent/article/details/42001851
部分匹配(Partial Matching)
敏锐的读者可能已经发现到目前为止,介绍的查询都是在整个词条层面进行操作的。匹配的最小单元必须是一个词条。你只能找到存在于倒排索引(Inverted Index)中的词条。
但是如果你想匹配词条的一部分,而不是整个词条呢 ...
Elasticsearch 邻近匹配 (三) - 性能,关联单词查询以及Shingles
原文链接:http://blog.csdn.net/dm_vincent/article/details/41978363
提高性能
短语和邻近度查询比简单的match查询在性能上更昂贵。match查询只是查看词条是否存在于倒排索引(Inverted Index)中,而match_phrase查询则需要计算和比较多个可能重复词条(Multiple possibly repeated)的位 ...
Elasticsearch 邻近匹配 (二) - 多值字段,邻近程度与相关度
原文链接:http://blog.csdn.net/dm_vincent/article/details/41956229
多值字段(Multivalue Fields)
在多值字段上使用短语匹配会产生古怪的行为:
PUT /my_index/groups/1
{
"names": [ "John Abraham", " ...