elasticsearch的查询有两部分组成:query and filter。
两者的主要区别在于:filter是不计算相关性的,同时可以cache。因此,filter速度要快于query。
先记录一下es提供的各种query。
以下内容只为当做读书笔记,更多详细细节请参见http://www.elasticsearch.org/guide/
第一部分:query
在需要full-text-search和需要计算相关性的情况下,用query。而filter满足不了需求。
(1)match query and multi-match query //and match-all query and minimum should match query
match queries没有“query parsing”的过程,field不支持通配符,前缀等高级特性,只是参照指定的文本进行analysis,执行query,因此失败几率极小,适合search-box。
analyzed类型的query,故可指定analyzer
operator可指定or/and
zero-terms-query可指定none/all
cutoff-frequency可指定absolute值或者relative值
match-phase query可指定slot值,参见后续的search-in-depth
match-phase-prefix query可指定max_expansion
(2)multi-match query
分别执行为单个field的match的查询。因此最终_score值的计算规则各异。
fields可指定执行需要查询的字段,field可以支持通配符等高级特性(match query是不支持的),field可支持(^)指定各个field的boost权重
types可指定以下值,区分不同的查询行为:
best _fields:_score决定于得分最高的match-clause。field-centric
most_fields:所有match-clause都会考虑在内。field-centric
cross-fields:把fileds当做一个big-fields。term-centric
phase and phase-prefix:每个field执行相应的query,combine the score
以上都有具体的应用场景和详细的计算规则,具体请参见后续的search-in-depth。
(3)bool query
一种复合查询,把其余类型的查询包裹进来。支持以下三种逻辑关系。
must: AND
must_not:NOT
should:OR
(4)boosting query
一种复合查询,分为positive子查询和negitive子查询,两者的查询结构都会返回。
positive子查询的score保持不变,negetive子查询的值将会根据negative_boost的值做相应程度的降低。
(5)common term query
一种略高级的查询,充分考虑了stop-word的低优先级,提高了查询精确性。
将terms分为了两种:more-importent(low-frequency) and less important(high-frequency)。less-important比如stop-words,eg:the and。
分组标准由cutoff_frequence决定。两组query构成bool query。must应用于low_frequence,should应用high_frequence。
每一组内部都可以指定operator和mini_should_match。
如果group后只有一组,则默认退化为单组的子查询。
query执行中首先match到more-import这一组的doc,然后在这个基础上去match less-import,并且计算只计算match到的score。保证了效率,也充分考虑了relevance。
(6)constant score query
不计算相关性的query。沿用index过程中指定的score,。
(7)dismax query
对子查询的结果做union,score沿用子查询score的最大值。这种查询广泛应用于muti-field的查询。具体可以参见后续更新search-in-depth
(8)filtered query
combine another query with any fillter。
如果不指定query,默认为match_all。当应用多个fitler的时候,可以指定strategy属性,expert-level。
(9)fuzzy query and fuzzy like this query and fuzzy like this field query
fuzzy query :主要根据fuzziniess和prefix_length进行匹配distance查询。根据type不同distance计算不一样。
numeric类型的distance类似于区间,string类型则依据Levenshtein distance,即从一个stringA变换到另一个stringB,需要变换的最小字母数。
如果指定为AUTO,则根据term的length有以下规则:
0-1:完全一致
1-4:1
>4:2
推荐指定prefix_length,表明这个范围的字符需要精准匹配,如果不指定prefix_lengh和fuzziniess参数,该查询负担较重。
(10)function score query
定义function去改变doc的score
(11)geoshape query
基于地理位置的查询
(12)has child query and has parent query and top children query
默认跟filter一样,query是包裹了一个constant_score的filter。也有相关score的支持。
has_child:匹配child字段,返回匹配到的对应的parent的结果。
has_parent:匹配parent字段,返回匹配到对应child的结果。
top_children query:has_child query的一种,也是查询child字段,不过增加可控制参数,通过factor,incremental_factor以及query的size来确定子查询的次数,直到满足
size为止,因此,可能需要多轮迭代子查询,所以total_hits有可能是不准确的。
(13)ids query
查询指定id。
(14)indices query
在多个索引之中查询,允许提供一个indics参数指定将要查询的索引及相关的查询,同时指定no_match_query在indecs之外的索引中查询,返回结果。
(15)more like this and more like this field query
根据指定的like_text,经过analysis生成若干个基于term的should查询合并成一个bool查询。
min_term_freq/max_term_freq/max_term_num:限制interesting term。
percentage_terms_to_match:限制should查询应该满足的term比例。
more like this query 可指定多个field字段,more like this field query 则在一个field上查询。
(16)nested query
内嵌类型的查询,指定完整的path。
(17)prefix query
前缀查询。
(18)query string query and simple query string query
基于lucence查询语法的查询,指定字段/term/boost等。
simple query string query 跟 query string类似,这是会自动放弃invalid的部分,不会抛出异常。
默认的field是_all。
(19)range query and regrex query and wildcard query
range query:区间查询,日期/string/num。
regrex query:正则查询。
wildcard query:通配符查询。
(20)span-*query
(21)term query and terms query
基于term的查询。
(22)template query
注册一个查询模板,指定模板查询。
--------------------------
后续计划更新:
(1)一些特殊查询的比较。比如fuzzy 跟 more_like等。
(2)search-in-depth
相关推荐
Elasticsearch查询客户端是用于与ES服务器通信的软件,它们提供了多种语言的API,允许开发者以编程方式执行索引、搜索、更新和删除等操作。常见的Elasticsearch客户端包括: - **Jest**:一个轻量级的Java REST...
在本项目中,“对Elasticsearch-PHP进行查询语句封装 可实现链式调用 方便 es查询”,主要涉及到的知识点有: 1. **Elasticsearch查询语句**:Elasticsearch支持丰富的查询语法,如match查询、term查询、range查询...
JAVA使用ElasticSearch查询in和not in的实现方式 Elasticsearch是一个基于Lucene的搜索服务器,提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。它是用Java开发的,并作为Apache许可条款下的开放...
elasticsearch的客户端比较出名的就是elasticsearch head 和Kibana了, 但是elasticsearch head已经停止更新,且样式老旧,功能不全; 而Kibana虽功能全面,但是启动麻烦,大部分功能用不上,很不灵活,所以采用vite...
### ElasticSearch 查询语句详解 #### 一、概述 ElasticSearch 是一款基于 Lucene 的分布式搜索和分析引擎,适用于全文检索、结构化检索及分析等场景。它提供了丰富的 API 接口,允许用户通过简单的 RESTful 方式...
【Elasticsearch查询API】是Elasticsearch中用于检索数据的核心功能,允许用户通过各种查询语句和过滤条件从索引中获取相关文档。本文将详细介绍Elasticsearch接口API的使用,特别是全文检索、查询匹配以及常用的...
"es2unix"就是这样一个工具,它将Elasticsearch的查询结果转换为Unix可读格式,使得我们可以利用Unix命令如grep、awk和sed等进行进一步的数据处理。 **es2unix工具介绍** es2unix是一个专门针对Elasticsearch的...
标签 "ES查询" 暗示了本主题关注的重点在于如何通过Elasticsearch进行数据检索。Elasticsearch查询语言是基于JSON的,这使得它非常灵活,可以适应多种查询场景。在实践中,根据业务需求编写合适的查询语句,优化查询...
该项目为基于Typescript的Elasticsearch可视化工具——ES查询客户端的设计源码,总计包含425个文件,涵盖151个TypeScript文件、86个Vue组件文件、72个CSS样式文件、30个PNG图像文件、17个JSON配置文件、13个tsx文件...
在本项目中,我们主要探讨如何使用SpringBoot与Elasticsearch(ES)集成,以便查询存储在ES中的日志内容。Elasticsearch是一种强大的、分布式、实时的搜索和分析引擎,常用于处理大量数据,特别是在日志管理和分析...
而Elasticsearch(ES)则是一款强大的全文搜索引擎,常用于大数据分析和实时搜索。本篇文章将详细介绍如何将Mybatis的Mapper方式与Elasticsearch的DSL(Domain Specific Language)查询相结合,以及如何通过CGlib...
根据提供的文件信息,以下是关于亿级规模的Elasticsearch(ES)查询优化的知识点: 一、背景介绍 在大数据背景下,Elasticsearch作为一款分布式的开源搜索引擎,在处理亿级规模数据的场景中经常被使用。如文档中...
本文将围绕标题和描述中提到的"高频代码"、"日期处理"、"数据库查询"、"ES查询"以及"自己的文件"这五个关键点,深入探讨相关知识点,并结合标签中的"数据库"、"elasticsearch"、"源码软件"、"database"和"大数据",...
**谷歌浏览器Elasticsearch查询数据扩展组件** 这个扩展组件是为谷歌浏览器(Google Chrome)设计的,目的是方便用户直接在浏览器中对Elasticsearch实例进行数据查询和管理,而无需通过复杂的命令行或专门的客户端...
Elasticsearch 查询语句
Elasticsearch(简称ES)是一个基于Apache Lucene构建的开源、分布式、RESTful风格的搜索和数据分析引擎。它允许你以前所未有的速度和规模,即时地存储、搜索和分析大量数据。Elasticsearch通常用于全文搜索、结构化...
这种方式使得复杂的ES查询可以被简洁地用SQL表达,简化了开发过程。 “支持JDBC驱动”意味着该工具包提供了一个Java Database Connectivity (JDBC) 驱动,使得用户可以通过标准的JDBC接口来连接和查询Elasticsearch...
**Elasticsearch 管道查询语言 ES|QL 深入解析** Elasticsearch 查询语言(ES|QL)是 Elasticsearch 为用户提供的一种强大而直观的查询工具,它结合了管道(pipe)概念,允许用户对存储在 Elasticsearch 中的数据...
Elasticsearch查询语言基础 高级搜索技巧与过滤 集群管理与优化 数据映射与类型 分布式搜索与分析 Elasticsearch安全机制 监控与日志分析 数据导入与导出策略 Elasticsearch与Kibana可视化 性能调优与故障排查 ...