搜索API
GET /bank/_search?q=*&sort=account_number:asc&pretty
rest方式搜索bank索引下的所有数据,并且按照account_number 上升方式返回
类似下面的搜索方式
GET /bank/_search
body为:
{
"query": { "match_all": {} },
"sort": [
{ "account_number": "asc" }
]
}
初步学习搜索语言
下面的搜索全部文档,按照balance降序排列,并返回11到20的文档,from的位置开始,size个文档
GET /bank/_search
{
"query": { "match_all": {} },
"sort": { "balance": { "order": "desc" } }
"from": 10,
"size": 10
}
执行搜索
当不需要所有字段都返回的时候可以使用如下方式_source,定义了只返回两个字段
GET /bank/_search
{
"query": { "match_all": {} },
"_source": ["account_number", "balance"]
}
如果我们希望根据某个条件进行搜索可以使用match字段:
如下搜索account_number 为 20的文档
GET /bank/_search
{
"query": { "match": { "account_number": 20 } }
}
如下搜索address包含“mill”的文档
GET /bank/_search
{
"query": { "match": { "address": "mill" } }
}
如下搜索address包含“mill”或者包含“lane”的文档
GET /bank/_search
{
"query": { "match": { "address": "mill lane" } }
}
如下搜索address包含短语“mill lane”的文档
GET /bank/_search
{
"query": { "match_phrase": { "address": "mill lane" } }
}
bool 搜索可以组合小的搜索到一个大搜索中
如下搜索address包含mill和lane的文档
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": { "address": "mill" } },
{ "match": { "address": "lane" } }
]
}
}
}
(must代表必须满足的意思)
相反,如下搜索address包含mill或者lane的文档
GET /bank/_search
{
"query": {
"bool": {
"should": [
{ "match": { "address": "mill" } },
{ "match": { "address": "lane" } }
]
}
}
}
(should代表任何一个条件满足即可)
如下搜索address既不包括mill又不包括lane的文档
GET /bank/_search
{
"query": {
"bool": {
"must_not": [
{ "match": { "address": "mill" } },
{ "match": { "address": "lane" } }
]
}
}
}
(must_not 代表排除的意思)
以上的三种类型可以合并使用
如下搜索age为40且state不是ID的文档
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": { "age": "40" } }
],
"must_not": [
{ "match": { "state": "ID" } }
]
}
}
}
执行过滤
filter执行过滤(其实就是对非string的进行区间搜索过滤)
如果搜索20000<=blance && blance<=30000的文档
GET /bank/_search
{
"query": {
"bool": {
"must": { "match_all": {} },
"filter": {
"range": {
"balance": {
"gte": 20000,
"lte": 30000
}
}
}
}
}
}
执行聚合
如下根据字段state聚合查找每种类型的数量(默认按照降序排列,返回前10条记录类似sql:SELECT state, COUNT(*) FROM bank GROUP BY state ORDER BY COUNT(*) DESC)
GET /bank/_search
{
"size": 0,
"aggs": {
"group_by_state": {
"terms": {
"field": "state"
}
}
}
}
(注意:设置size为0是因为我们不想看到hit的信息)
如下在上面的基础上,我们想要知道blance的平均值
GET /bank/_search
{
"size": 0,
"aggs": {
"group_by_state": {
"terms": {
"field": "state"
},
"aggs": {
"average_balance": {
"avg": {
"field": "balance"
}
}
}
}
}
}
在上面的基础上,我们希望按照平均值降序排列
GET /bank/_search
{
"size": 0,
"aggs": {
"group_by_state": {
"terms": {
"field": "state",
"order": {
"average_balance": "desc"
}
},
"aggs": {
"average_balance": {
"avg": {
"field": "balance"
}
}
}
}
}
}
如下我们先根据年龄,然后根据性别,然后求出balance的平均值
GET /bank/_search
{
"size": 0,
"aggs": {
"group_by_age": {
"range": {
"field": "age",
"ranges": [
{
"from": 20,
"to": 30
},
{
"from": 30,
"to": 40
},
{
"from": 40,
"to": 50
}
]
},
"aggs": {
"group_by_gender": {
"terms": {
"field": "gender.keyword"
},
"aggs": {
"average_balance": {
"avg": {
"field": "balance"
}
}
}
}
}
}
}
}
分享到:
相关推荐
这些工具提供了直观的界面和丰富的算法库,便于用户进行数据探索和模型构建。 六、数据挖掘的应用场景 数据挖掘广泛应用于市场营销(客户细分、预测购买行为)、金融风控(信用评估、欺诈检测)、医疗健康(疾病...
### Qlik Sense 教程:基础入门中文版详解 #### 一、Qlik Sense 概述 **Qlik Sense** 是一款强大的商务智能(BI)工具,它可以帮助用户轻松地探索和分析数据,并以直观的方式展示结果。Qlik Sense 的核心优势在于...
该文档《1.PowerBI从入门到精通-面向使用者(官方原版)》是针对想要学习并精通PowerBI使用的个人或团队的官方指南。 首先,文档对“PowerBI使用者”的概念进行了定义,即那些接收并使用同事创建的仪表板、报表和...
在本项目中,我们主要关注的是“天池-零基础入门数据挖掘-心跳信号分类预测-EDA分析全过程-代码.rar”这一主题。这个压缩包文件包含的是一次数据挖掘实践,特别针对心跳信号的分类预测,它涉及到数据分析的初步探索...
这个数据集是Coursera上"Python编程的数据分析入门"课程中使用的一个实例,它帮助初学者实践如何用Python进行数据清洗、探索和分析。 数据文件`census.csv`是一个常见的CSV(Comma Separated Values)文件,这种...
1. **数据仓库基础** 数据仓库是为企业决策提供支持的系统,它集成了来自不同源的数据,经过清洗、转换后存储在结构化的环境中,以供分析和报告。与常规在线事务处理(OLTP)系统不同,数据仓库主要关注历史数据的...
### IEEE5节点图及其数据详解 #### 一、概述 在电力系统仿真与分析领域,IEEE(电气与电子工程师学会)标准提供了一系列用于教学、研究和工程实践的标准测试案例。其中,“IEEE5节点图及其数据”是电力系统分析...
1. Pynq-Z1与Pynq-Z2概述 - Pynq-Z1和Pynq-Z2都是Xilinx为了简化Zynq SoC的开发而设计的板卡。它们都配备了Zynq-7000 All Programmable SoC,但存在一些硬件差异,如内存大小、接口数量等。 - Pynq框架是Xilinx...
PowerBI作为一款强大的商业智能工具,它允许用户通过可视化方式来分析和呈现数据,从而使得...此外,PowerBI的社区和资源中心为开发人员提供了宝贵的学习资源和交流平台,为他们在数据可视化方面的探索提供了有力支持。
- 探索不同组件之间的交互方式,如数据共享、更新策略等。 #### 第七部分:MFC常用类 - **VS2010/MFC编程入门之四十二至四十六(MFC常用类系列)** - 分析MFC中常用的类,如`CString`、`CTime`、`CFile`等。 - ...
1. **FFmpeg命令行工具**:这是最直接与用户交互的部分,通过在终端输入命令,执行各种多媒体处理任务。 2. **libavcodec**:这是一个包含多种编码和解码器的库,支持多种常见的音视频格式。 3. **libavformat**:...
数据分析师的入门详解资料
【PYNQ-Z2入门指导手册_v2.01】是针对PYNQ-Z2开发板的一款详尽的使用教程,旨在帮助用户快速掌握...这份手册不仅提供了一套完整的PYNQ-Z2入门流程,还为初学者提供了动手实践的机会,是学习和探索PYNQ技术的理想起点。
本系列课程的第二部分主要聚焦于ASP.NET 2.0的入门与探索,旨在帮助初学者快速掌握这一技术,并逐步提升技能。 首先,让我们来探讨ASP.NET 2.0的核心概念和特性。ASP.NET 2.0引入了大量改进,例如控件事件模型、...
python数据挖掘入门与实践 第三章测试数据,书中提到的下载方法已经下不到数据了,重新探索了下,找到的,亲测可用!!
- 数据分析:统计分析、探索性数据分析(EDA)等。 - 数据可视化:通过图表展示数据特征和关系,帮助理解复杂数据集。 4. **数学建模案例实践**: - 使用线性回归模型预测销售数据。 - 应用逻辑回归进行二分类...
R语言是一种广泛应用于统计分析、数据可视化和预测建模的编程语言和环境。它以其强大的数据分析功能和开源特性,受到了全球科研人员和数据...同时,不断探索和学习新的R包和方法,可以提升你在数据分析领域的专业技能。
本指南将帮助初学者理解 Redis 的基本概念、安装与配置、数据类型以及常用命令,从而快速入门 Redis。 1. **Redis 简介** - Redis 源自意大利程序员 Salvatore Sanfilippo,最初是为了提高网站性能而设计的。 - ...
《S7-1200入门:探索西门子小型PLC的魅力》 在工业自动化领域,西门子S7-1200系列PLC(可编程逻辑控制器)是广泛应用的一款控制器,尤其适合中小型系统。本文将深入探讨S7-1200的基本概念、功能特性以及如何进行...