最新文章列表

Elasticsearch 创建客户端(二)

原文链接:http://blog.csdn.net/geloin/article/details/8476508     3. org.elasticsearch.client.ClusterAdminClient接口 ClusterAdminClient提供了对针对集群的action和operation的管理接口。它有以下方法: 1) health(ClusterHealthRe ...
study121007 评论(0) 有685人浏览 2016-05-03 06:40

Elasticsearch 创建客户端(一)

原文链接:http://blog.csdn.net/geloin/article/details/8448691   在elasticsearch源代码中,进入到org.elasticsearch.client,你会发现下图所示的类:   我们从最外层开始。 1 org.elasticsearch.client.AdminClient接口 AdminClient下有两个方法:1) c ...
study121007 评论(0) 有1711人浏览 2016-05-03 06:24

分布式搜索Elasticsearch源码分析之二------索引过程源码概要分析

原文链接:http://www.searchtech.pro/articles/2013/02/15/1360941961206.html     elasticsearch的索引逻辑简单分析,这里只是理清主要的脉络,一些细节方面以后的文章或会阐述。   假如通过java api来调用es的索引接口,先是构造成一个json串(es里表示为XContent,是对要处理的内容进行抽象), ...
study121007 评论(0) 有943人浏览 2016-05-03 06:13

Elasticsearch源码分析之一——使用Guice进行依赖注入与模块化系统

原文链接:http://www.searchtech.pro/articles/2013/02/15/1360942810308.html   elasticsearch使用google开源的依赖注入框架guice,这个项目号称比spring快100倍,具体性能没有测试过,不过由于其代码比较简洁,比spring快很有可能,是不是快那么多就不知道了。先介绍下guice的基本使用方法。 ...
study121007 评论(0) 有1164人浏览 2016-05-03 05:48

Elasticsearch 数据建模 - 处理关联关系(2)

原文链接:http://blog.csdn.net/dm_vincent/article/details/47710591     字段折叠(Field Collapsing) 一个常见的需求是通过对某个特定的字段分组来展现搜索结果。我们或许希望通过对用户名分组来返回最相关的博文。对用户名分组意味着我们需要使用到terms聚合。为了对用户的全名进行分组,name字段需要有not_ ...
study121007 评论(0) 有1142人浏览 2016-04-30 10:06

Elasticsearch 数据建模 - 处理关联关系(1)

原文链接:http://blog.csdn.net/dm_vincent/article/details/47710367     数据建模(Modeling Your Data) ES是一头不同寻常的野兽,尤其是当你来自SQL的世界时。它拥有很多优势:性能,可扩展性,准实时的搜索,以及对大数据的分析能力。并且,它很容易上手!只需要下载就能够开始使用它了。 但是它也不是魔法。为 ...
study121007 评论(0) 有875人浏览 2016-04-30 09:52

Elasticsearch 过滤查询以及聚合(Filtering Queries and Aggregations)

原文链接:http://blog.csdn.net/dm_vincent/article/details/42757519   本章翻译自Elasticsearch官方指南的Filtering Queries and Aggregations一章。     过滤查询以及聚合   A natural extension to aggregation scoping is filte ...
study121007 评论(0) 有1090人浏览 2016-04-30 09:46

Elasticsearch 聚合作用域(Scoping Aggregations)

原文链接:http://blog.csdn.net/dm_vincent/article/details/42695339     聚合作用域(Scoping Aggregations) 到现在给出的聚合例子中,你可能已经发现了在搜索请求中我们省略了query子句。整个请求只是一个简单的聚合。 聚合可以和搜索请求一起运行,但是你需要理解一个新概念:作用域(Scope)。默认情况下, ...
study121007 评论(0) 有1082人浏览 2016-04-30 08:29

Elasticsearch 聚合 - 时间数据处理(Looking at Time)

原文链接:http://blog.csdn.net/dm_vincent/article/details/42594043   本章翻译自Elasticsearch官方指南的Looking at Time一章。     时间数据处理(Looking at Time)   如果在ES中,搜索是最常见的行为,那么创建日期柱状图(Date Histogram)肯定是第二常见的。为什么要 ...
study121007 评论(0) 有8479人浏览 2016-04-30 08:17

Elasticsearch 聚合的测试数据

原文链接: http://blog.csdn.net/dm_vincent/article/details/42407823   本章翻译自Elasticsearch官方指南的Aggregation Test-Drive一章。     聚合的测试数据(Aggregation Test-Drive)   我们将学习各种聚合以及它们的语法,但是最好的学习方法还是通过例子。一旦你了解了 ...
study121007 评论(0) 有898人浏览 2016-04-29 07:36

Elasticsearch 聚合中的重要概念 - Buckets(桶)及Metrics(指标)

原文链接:http://blog.csdn.net/dm_vincent/article/details/42387161   本章翻译自Elasticsearch官方指南的Aggregations-High-level Concepts一章。     高层概念(High-Level Concepts)   和查询DSL一样,聚合(Aggregations)也拥有一种可组合(Co ...
study121007 评论(0) 有1580人浏览 2016-04-29 07:22

Elasticsearch 控制相关度 (六) - function_score查询中的filter,functions及random_score参数

原文链接:http://blog.csdn.net/dm_vincent/article/details/42201789   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     根据过滤子集来提升(Boosting F ...
study121007 评论(0) 有1574人浏览 2016-04-29 07:06

Elasticsearch 控制相关度 (五) - function_score查询及field_value_factor,boost_mode,max_

原文链接:http://blog.csdn.net/dm_vincent/article/details/42201721   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     function_score查询   function_sco ...
study121007 评论(0) 有1021人浏览 2016-04-29 06:10

Elasticsearch 控制相关度 (四) - 忽略TF/IDF

原文链接:http://blog.csdn.net/dm_vincent/article/details/42157577   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     忽略TF/IDF   有时我们不需 ...
study121007 评论(0) 有681人浏览 2016-04-28 10:00

Elasticsearch 控制相关度 (三) - 通过查询结构调整相关度以及boosting查询

原文链接:http://blog.csdn.net/dm_vincent/article/details/42134905   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     通过查询结构调整相关度   ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询: ...
study121007 评论(0) 有519人浏览 2016-04-28 09:53

Elasticsearch 部分匹配 (四) - 索引期间优化ngrams及索引期间的即时搜索

原文链接:http://blog.csdn.net/dm_vincent/article/details/42076191   本章翻译自Elasticsearch官方指南的Partial Matching一章。     索引期间的优化(Index-time Optimizations)   目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(Index ...
study121007 评论(0) 有818人浏览 2016-04-28 08:17

Elasticsearch 部分匹配 (三) - 查询期间的即时搜索

原文链接:http://blog.csdn.net/dm_vincent/article/details/42059387   本章翻译自Elasticsearch官方指南的Partial Matching一章。     查询期间的即时搜索(Query-time Search-as-you-type)   现在让我们来看看前缀匹配能够如何帮助全文搜索。用户已经习惯于在完成输入之前就 ...
study121007 评论(0) 有1187人浏览 2016-04-27 10:22

Elasticsearch 部分匹配 (一) - 前缀查询

原文链接:http://blog.csdn.net/dm_vincent/article/details/42001851   部分匹配(Partial Matching) 敏锐的读者可能已经发现到目前为止,介绍的查询都是在整个词条层面进行操作的。匹配的最小单元必须是一个词条。你只能找到存在于倒排索引(Inverted Index)中的词条。 但是如果你想匹配词条的一部分,而不是整个词条呢 ...
study121007 评论(0) 有1375人浏览 2016-04-26 14:23

Elasticsearch 邻近匹配 (三) - 性能,关联单词查询以及Shingles

原文链接:http://blog.csdn.net/dm_vincent/article/details/41978363   提高性能 短语和邻近度查询比简单的match查询在性能上更昂贵。match查询只是查看词条是否存在于倒排索引(Inverted Index)中,而match_phrase查询则需要计算和比较多个可能重复词条(Multiple possibly repeated)的位 ...
study121007 评论(0) 有723人浏览 2016-04-26 14:12

Elasticsearch 邻近匹配 (二) - 多值字段,邻近程度与相关度

原文链接:http://blog.csdn.net/dm_vincent/article/details/41956229   多值字段(Multivalue Fields) 在多值字段上使用短语匹配会产生古怪的行为: PUT /my_index/groups/1 { "names": [ "John Abraham", " ...
study121007 评论(0) 有1012人浏览 2016-04-26 08:40

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics