`
文章列表
原文链接:http://blog.csdn.net/dm_vincent/article/details/42695339     聚合作用域(Scoping Aggregations) 到现在给出的聚合例子中,你可能已经发现了在搜索请求中我们省略了query子句。整个请求只是一个简单的聚合。 聚合可以和搜索请求一起运行,但是你需要理解一个新概念:作用域(Scope)。默认情况下,聚合和查询使用相同的作用域。换句话说,聚合作于匹配了查询的文档集。 让我们看看之前的一个聚合例子: GET /cars/transactions/_search?search_type=cou ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42594043   本章翻译自Elasticsearch官方指南的Looking at Time一章。     时间数据处理(Looking at Time)   如果在ES中,搜索是最常见的行为,那么创建日期柱状图(Date Histogram)肯定是第二常见的。为什么要使用日期柱状图呢? 想象在你的数据中有一个时间戳。数据是什么不重要-Apache日志事件,股票交易日期,棒球比赛时间-任何拥有时间戳的数据都能通过日期柱状图受益。当你有时间戳时,你经常会想创建基于时 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42539391   创建条形图(Building Bar Charts) 聚合的一个令人激动的性质是它能够很容易地被转换为图表和图形。在本章中,我们会使用前面的样本数据集来创建出各种分析案例。我 ...
原文链接: http://blog.csdn.net/dm_vincent/article/details/42407823   本章翻译自Elasticsearch官方指南的Aggregation Test-Drive一章。     聚合的测试数据(Aggregation Test-Drive)   我们将学习各种聚合以及它们的语法,但是最好的学习方法还是通过例子。一旦你了解了如何思考聚合以及如何对它们进行合适的嵌套,那么语法本身是不难的。 让我们从一个例子开始。我们会建立一个也许对汽车交易商有所用处的聚合。数据是关于汽车交易的:汽车型号,制造商,销售价格,销售时间以及一 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42387161   本章翻译自Elasticsearch官方指南的Aggregations-High-level Concepts一章。     高层概念(High-Level Concepts)   和查询DSL一样,聚合(Aggregations)也拥有一种可组合(Composable)的语法:独立的功能单元可以被混合在一起来满足你的需求。这意味着需要学习的基本概念虽然不多,但是它们的组合方式是几近无穷的。 为了掌握聚合,你只需要了解两个主要概念: Bucket ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42201789   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     根据过滤子集来提升(Boosting Filtered Subsets)   回到在忽略TF/IDF(Ignoring TF/IDF)中处理的那个问题,我们需要 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42201721   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     function_score查询   function_score查询是处理分值计算过程的终极工具。它让你能够对所有匹配了主查询的 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42157577   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     忽略TF/IDF   有时我们不需要TF/IDF。我们想知道的只是一个特定的单词是否出现在了字段中。比如我们正 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42134905   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     通过查询结构调整相关度   ES提供的查询DSL是相当灵活的。你可以通过将单独的查询子句在查询层次中上下移动来让它更重要/更不重要。比如,下面的查询: quick OR brown OR red OR fox
原文链接:http://blog.csdn.net/dm_vincent/article/details/42113401   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     Lucene中的Practical Scoring Function   对于多词条查询(Multiterm Queries),Lucene使用的是布尔模型(Boolean Model),TF/IDF以及向量空间模型(Vec
原文链接:http://blog.csdn.net/dm_vincent/article/details/42099063   本章翻译自Elasticsearch官方指南的Controlling Relevance一章。     控制相关度(Controlling Relevance)   对于仅处理结构化数据(比如日期,数值和字符枚举值)的数据库,它们只需要检查一份文档(在关系数据库中是一行)是否匹配查询即可。   尽管布尔类型的YES|NO匹配也是全文搜索的一个必要组成,它们本身是不够的。我们还需要知道每份文档和查询之间的相关程度。全文搜索引擎不仅要找到匹配的文档,还 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42076191   本章翻译自Elasticsearch官方指南的Partial Matching一章。     索引期间的优化(Index-time Optimizations)   目前我们讨论的所有方案都是在查询期间的。它们不需要任何特殊的映射或者索引模式(Indexing Patterns);它们只是简单地工作在已经存在于索引中的数据之上。 查询期间的灵活性是有代价的:搜索性能。有时,将这些代价放到查询之外的地方是有价值的。在一个实时的Web应用中,一个额外的 ...
最近刚看完了《重构-改善既有代码的设计》([美] Martin Fowler)这本书,里面介绍了很多的重构手法, 挺实用的,看的时候简单的记录了一下,不是很详细,还是分享一下吧。      1)提炼函数(Extract Method)   使用场景 1、函数过长 2、全部或某一段代码块重复性太强,copy的过多 好处 1、颗粒度小,整体被复用的机会大,即不需要再多次重复内部逻辑 2、规范一个好的命名(命名长度可以很长,但一定要更好的解释此段的语义),      可以更加清晰此块代码的实际作用 实际运用 1、不需 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42059387   本章翻译自Elasticsearch官方指南的Partial Matching一章。     查询期间的即时搜索(Query-time Search-as-you-type)   现在让我们来看看前缀匹配能够如何帮助全文搜索。用户已经习惯于在完成输入之前就看到搜索结果了 - 这被称为即时搜索(Instant Search, 或者Search-as-you-type)。这不仅让用户能够在更短的时间内看到搜索结果,也能够引导他们得到真实存在于我们的索引中的 ...
原文链接:http://blog.csdn.net/dm_vincent/article/details/42024799   通配符和正则表达式查询   wildcard查询和prefix查询类似,也是一个基于词条的低级别查询。但是它能够让你指定一个模式(Pattern),而不是一个前缀(Prefix)。它使用标准的shell通配符:?用来匹配任意字符,*用来匹配零个或者多个字符。 以下查询能够匹配包含W1F 7HW和W2F 8HW的文档: GET /my_index/address/_search { "query": { ...
Global site tag (gtag.js) - Google Analytics