在ES里面所有的聚合实例都由AggregationBuilders类提供静态方法构造,我们先看下常用有哪些方法使用:
(1)统计某个字段的数量
ValueCountBuilder vcb= AggregationBuilders.count("count_uid").field("uid");
(2)去重统计某个字段的数量(有少量误差)
CardinalityBuilder cb= AggregationBuilders.cardinality("distinct_count_uid").field("uid");
(3)聚合过滤
FilterAggregationBuilder fab= AggregationBuilders.filter("uid_filter").filter(QueryBuilders.queryStringQuery("uid:001"));
(4)按某个字段分组
TermsBuilder tb= AggregationBuilders.terms("group_name").field("name");
(5)求和
SumBuilder sumBuilder= AggregationBuilders.sum("sum_price").field("price");
(6)求平均
AvgBuilder ab= AggregationBuilders.avg("avg_price").field("price");
(7)求最大值
MaxBuilder mb= AggregationBuilders.max("max_price").field("price");
(8)求最小值
MinBuilder min= AggregationBuilders.min("min_price").field("price");
(9)按日期间隔分组
DateHistogramBuilder dhb= AggregationBuilders.dateHistogram("dh").field("date");
(10)获取聚合里面的结果
TopHitsBuilder thb= AggregationBuilders.topHits("top_result");
(11)嵌套的聚合
NestedBuilder nb= AggregationBuilders.nested("negsted_path").path("quests");
(12)反转嵌套
AggregationBuilders.reverseNested("res_negsted").path("kps ");
上面这些基本就是常用的聚合查询了,在嵌套(nested)下面的子聚合查询就是嵌套查询了,除了嵌套查询,其他的聚合查询也可以无限级添加子查询
举一个二级分组的例子:
SearchRequestBuilder search = client.prepareSearch("index").setTypes("type");
TermsBuilder one= AggregationBuilders.terms("group_name").field("name");
TermsBuilder two= AggregationBuilders.terms("group_age").field("age");
one.subAggregation(two)
search.addAggregation(one);
Terms terms= search.get().getAggregations().get("group_name");
for(Terms.Bucket name_buk:terms.getBuckets()){
//一级分组的内容
Terms terms_age= name_buk.getAggregations().get("group_age");
for(Terms.Bucket age_buk:terms_age.getBuckets()){
//二级分组的内容
System.out.println(name_buk.getKey()+" "+age_buk.getKey()+" "+age_buk.getDocCount());
}
}
注意上面的例子 ,二级子查询可以添加多种类型,比如第一级按照名字分组,第二级可以添加一个max或者min的子聚合查询。
下面看一个嵌套聚合的例子:
- //嵌套查询root节点
NestedBuilder nestedBuilder= AggregationBuilders.nested("negsted").path("quests");
//嵌套查询的子查询中分组count
TermsBuilder tb= AggregationBuilders.terms("group_name").field("quests.name");
//添加子查询到root节点里面
nestedBuilder.subAggregation(tb);
//获取一级嵌套
Nested ntd= search.get().getAggregations().get("negsted");
//打印一级嵌套的结果
System.out.println(ntd.getDocCount());
//从一级嵌套查询的结果中获取二级嵌套查询结果
Terms term= ntd.getAggregations().get("group_name");
//获取嵌套下面的结果
for(Terms.Bucket tbket:term.getBuckets()){
System.out.println(tbket.getKey()+" "+tbket.getDocCount());
}
嵌套的查询功能非常丰富,此外还有更强大Pipeline Aggregations聚合可以对上层的嵌套结果继续做操作,例如sql里面的having功能也可以实现,本篇简单的介绍了es的聚合查询的种类和简单使用,感兴趣的朋友可以通过官网详细学习下。
有什么问题可以扫码关注微信公众号:我是攻城师(woshigcs),在后台留言咨询。 技术债不能欠,健康债更不能欠, 求道之路,与君同行。
分享到:
相关推荐
在Elasticsearch中,我们可以通过注解来指定哪些字段是可被搜索的,哪些是聚合用的,或者有特殊分析需求的。 `GoodsRepository.java`可能是Elasticsearch的仓储接口,它继承自Elasticsearch的`Elasticsearch...
在IT行业中,尤其是在大数据处理和搜索引擎领域,Elasticsearch(简称ES)是一个极其重要的工具。它是一个基于Lucene的开源全文搜索引擎,具有分布式、实时、高可扩展性以及灵活的数据模型等特点。PHP作为广泛使用的...
对于数据分析,Elasticsearch的聚合功能非常强大。你可以计算账户的平均余额、按状态分组统计账户数量,甚至进行时间序列分析,如查看账户余额随时间的变化趋势。 总之,"accounts.json"是Elasticsearch学习和实践...
2. **查询(Query)**:Elasticsearch支持丰富的查询语法,如匹配查询、范围查询、布尔查询等。`GET /my_index/_search`可执行查询。 3. **更新(Update)**:文档更新通常涉及先获取再替换。`GET /my_index/_doc/1`...
1. **实时性要求高的查询应直接走DB**:Elasticsearch不是实时数据库,对于绝对实时的需求,可能需要数据库支持。 2. **避免深分页查询**:由于倒排索引的限制,深分页查询效率低下,应尽量避免。 3. **FieldData与...
- **应用场景**:通过具体例子说明Transforms如何在实际工作中提升Elasticsearch的数据分析能力。 #### 6. 使用ElasticStack进行地理空间数据分析 - **地理空间数据处理**:探讨如何利用ElasticStack(Elastic...
4. **搜索查询**:Elasticsearch支持复杂的搜索查询,包括全文搜索、过滤、聚合等。`SearchResponse`对象包含了查询结果。例如,可以使用`SearchRequestBuilder`构建查询,然后调用`execute()`方法执行。 5. **...
2. **聚合查询**:除了基本的搜索功能外,Elasticsearch还支持聚合查询,这使得用户能够对数据进行统计分析,例如计算平均值、最大值或者最小值等。 3. **近实时搜索**:当数据发生变化时,Elasticsearch能够几乎...
Elasticsearch的查询功能强大,Java客户端提供了丰富的API来构建复杂的查询和聚合。以下是一个简单的匹配查询示例: ```java SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder(); ...
- **解决方案**:书中提供了实用的工具和技术,比如使用Solr或Elasticsearch提供的诊断功能来检查索引质量和查询性能。 - **最佳实践**:分享了一些经过验证的最佳实践,帮助读者快速定位并解决问题。 4. **驾驭...
### 深入解析:如何在 Elasticsearch 中执行布尔查询 在大数据时代,高效的数据管理和分析变得至关重要。Elasticsearch 作为一款基于 Lucene 构建的开源、分布式、RESTful 风格的搜索和分析引擎,凭借其卓越的性能...
在Elasticsearch 8.10版本中,改进了查询并行度,特别是在处理大量分片的kNN向量搜索场景下。此外,8.11版本增加了对稀疏向量数据类型的支持,这用于存储具有稀疏特征和权重的数据,通常由文本扩展或稀疏向量模型...
在深入探讨`accounts.json`这个样例数据之前,我们先来了解一下Elasticsearch(简称ES)的基础知识。Elasticsearch是一款强大的开源搜索引擎,基于Lucene构建,提供了分布式、实时、可扩展的数据搜索和分析能力。它...
在Java开发中,Elasticsearch是一个非常流行的分布式搜索引擎和数据分析平台。它提供了丰富的API,使得开发者可以方便地进行数据的增、删、改、查操作。在这个名为"JAVA API对Elasticsearch的增删改查"的主题中,...
这些只是Elasticsearch查询能力的冰山一角,实际上,它还包括了过滤、聚合、脚本字段、自定义评分函数等多种复杂功能,能够满足各种复杂的数据搜索和分析需求。通过熟练掌握这些查询语句,你将能够更有效地从海量...
- **ES vs Solr:** 对比分析 Elasticsearch 与 Apache Solr 的异同点。 - **Elasticsearch River JDBC:** 描述如何使用 JDBC 连接器将关系型数据库中的数据流式导入 Elasticsearch。 #### 结论 Elasticsearch 作为...
这样的例子展示了Elasticsearch在文本数据处理上的广泛应用,尤其是在信息检索和自然语言处理领域。 最后,`accounts.json`文件可能包含用户账户信息,如用户名、电子邮件、密码(通常加密存储)和其他元数据。在...
Elasticsearch 5.0版本引入了许多新特性,如增强的聚合功能、更高效的搜索性能、更丰富的API等。在本项目中,Koa2 RestApi的主要作用是作为Elasticsearch的客户端,允许用户通过HTTP请求进行索引、查询、更新、删除...
除了基本的查询之外,Elasticsearch 还支持对数据进行聚合统计,这对于数据分析来说非常重要。 **示例命令**: ```bash curl -XGET localhost:9200/baselinelog/bllog/_search?pretty -d'{"query":{"filtered":{...
这个例子展示了如何使用Jest客户端创建一个包含标题的文档,并将其索引到名为"my_index"的Elasticsearch索引中。 总结来说,Elasticsearch的RESTful API是其强大功能的核心,而Jest作为Java客户端,为开发者提供了...