`
fenshen6046
  • 浏览: 52114 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

1入门--5探索数据

es 
阅读更多
搜索API
GET /bank/_search?q=*&sort=account_number:asc&pretty
rest方式搜索bank索引下的所有数据,并且按照account_number 上升方式返回
类似下面的搜索方式
GET /bank/_search
body为:
{
  "query": { "match_all": {} },
  "sort": [
    { "account_number": "asc" }
  ]
}
初步学习搜索语言
下面的搜索全部文档,按照balance降序排列,并返回11到20的文档,from的位置开始,size个文档
GET /bank/_search
{
  "query": { "match_all": {} },
  "sort": { "balance": { "order": "desc" } }
  "from": 10,
  "size": 10
}
执行搜索
当不需要所有字段都返回的时候可以使用如下方式_source,定义了只返回两个字段
GET /bank/_search
{
  "query": { "match_all": {} },
  "_source": ["account_number", "balance"]
}

如果我们希望根据某个条件进行搜索可以使用match字段:
如下搜索account_number 为 20的文档
GET /bank/_search
{
  "query": { "match": { "account_number": 20 } }
}
如下搜索address包含“mill”的文档
GET /bank/_search
{
  "query": { "match": { "address": "mill" } }
}
如下搜索address包含“mill”或者包含“lane”的文档
GET /bank/_search
{
  "query": { "match": { "address": "mill lane" } }
}
如下搜索address包含短语“mill lane”的文档
GET /bank/_search
{
  "query": { "match_phrase": { "address": "mill lane" } }
}

bool 搜索可以组合小的搜索到一个大搜索中
如下搜索address包含mill和lane的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
(must代表必须满足的意思)

相反,如下搜索address包含mill或者lane的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "should": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
(should代表任何一个条件满足即可)

如下搜索address既不包括mill又不包括lane的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must_not": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
(must_not 代表排除的意思)

以上的三种类型可以合并使用
如下搜索age为40且state不是ID的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}
执行过滤
filter执行过滤(其实就是对非string的进行区间搜索过滤)
如果搜索20000<=blance && blance<=30000的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must": { "match_all": {} },
      "filter": {
        "range": {
          "balance": {
            "gte": 20000,
            "lte": 30000
          }
        }
      }
    }
  }
}

执行聚合
如下根据字段state聚合查找每种类型的数量(默认按照降序排列,返回前10条记录类似sql:SELECT state, COUNT(*) FROM bank GROUP BY state ORDER BY COUNT(*) DESC)
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state"
      }
    }
  }
}
(注意:设置size为0是因为我们不想看到hit的信息)

如下在上面的基础上,我们想要知道blance的平均值
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state"
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}
在上面的基础上,我们希望按照平均值降序排列
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state",
        "order": {
          "average_balance": "desc"
        }
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}

如下我们先根据年龄,然后根据性别,然后求出balance的平均值
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_age": {
      "range": {
        "field": "age",
        "ranges": [
          {
            "from": 20,
            "to": 30
          },
          {
            "from": 30,
            "to": 40
          },
          {
            "from": 40,
            "to": 50
          }
        ]
      },
      "aggs": {
        "group_by_gender": {
          "terms": {
            "field": "gender.keyword"
          },
          "aggs": {
            "average_balance": {
              "avg": {
                "field": "balance"
              }
            }
          }
        }
      }
    }
  }
}
分享到:
评论

相关推荐

    数据挖掘入门----数据挖掘入门

    这些工具提供了直观的界面和丰富的算法库,便于用户进行数据探索和模型构建。 六、数据挖掘的应用场景 数据挖掘广泛应用于市场营销(客户细分、预测购买行为)、金融风控(信用评估、欺诈检测)、医疗健康(疾病...

    Qlik-Sense-教程-基础入门-中文

    ### Qlik Sense 教程:基础入门中文版详解 #### 一、Qlik Sense 概述 **Qlik Sense** 是一款强大的商务智能(BI)工具,它可以帮助用户轻松地探索和分析数据,并以直观的方式展示结果。Qlik Sense 的核心优势在于...

    1.PowerBI从入门到精通-面向使用者(官方原版).pdf

    该文档《1.PowerBI从入门到精通-面向使用者(官方原版)》是针对想要学习并精通PowerBI使用的个人或团队的官方指南。 首先,文档对“PowerBI使用者”的概念进行了定义,即那些接收并使用同事创建的仪表板、报表和...

    天池-零基础入门数据挖掘-心跳信号分类预测-EDA分析全过程-代码.rar

    在本项目中,我们主要关注的是“天池-零基础入门数据挖掘-心跳信号分类预测-EDA分析全过程-代码.rar”这一主题。这个压缩包文件包含的是一次数据挖掘实践,特别针对心跳信号的分类预测,它涉及到数据分析的初步探索...

    数据分析入门所使用的美国人口普查数据及数据说明

    这个数据集是Coursera上"Python编程的数据分析入门"课程中使用的一个实例,它帮助初学者实践如何用Python进行数据清洗、探索和分析。 数据文件`census.csv`是一个常见的CSV(Comma Separated Values)文件,这种...

    DB2数据仓库入门

    1. **数据仓库基础** 数据仓库是为企业决策提供支持的系统,它集成了来自不同源的数据,经过清洗、转换后存储在结构化的环境中,以供分析和报告。与常规在线事务处理(OLTP)系统不同,数据仓库主要关注历史数据的...

    IEEE5节点图及其数据

    ### IEEE5节点图及其数据详解 #### 一、概述 在电力系统仿真与分析领域,IEEE(电气与电子工程师学会)标准提供了一系列用于教学、研究和工程实践的标准测试案例。其中,“IEEE5节点图及其数据”是电力系统分析...

    Pynq_Z1_Z2(zynq7000系列)入门资料

    1. Pynq-Z1与Pynq-Z2概述 - Pynq-Z1和Pynq-Z2都是Xilinx为了简化Zynq SoC的开发而设计的板卡。它们都配备了Zynq-7000 All Programmable SoC,但存在一些硬件差异,如内存大小、接口数量等。 - Pynq框架是Xilinx...

    4.PowerBI从入门到精通-面向开发人员(官方原版).pdf

    PowerBI作为一款强大的商业智能工具,它允许用户通过可视化方式来分析和呈现数据,从而使得...此外,PowerBI的社区和资源中心为开发人员提供了宝贵的学习资源和交流平台,为他们在数据可视化方面的探索提供了有力支持。

    VS2010之MFC入门到精通教程(1-55全)

    - 探索不同组件之间的交互方式,如数据共享、更新策略等。 #### 第七部分:MFC常用类 - **VS2010/MFC编程入门之四十二至四十六(MFC常用类系列)** - 分析MFC中常用的类,如`CString`、`CTime`、`CFile`等。 - ...

    FFMPEG入门基础资料pdf

    1. **FFmpeg命令行工具**:这是最直接与用户交互的部分,通过在终端输入命令,执行各种多媒体处理任务。 2. **libavcodec**:这是一个包含多种编码和解码器的库,支持多种常见的音视频格式。 3. **libavformat**:...

    4-1探索型数据分析:绘制统计图形展示数据分布.html

    数据分析师的入门详解资料

    PYNQ-Z2入门指导手册_v2.01

    【PYNQ-Z2入门指导手册_v2.01】是针对PYNQ-Z2开发板的一款详尽的使用教程,旨在帮助用户快速掌握...这份手册不仅提供了一套完整的PYNQ-Z2入门流程,还为初学者提供了动手实践的机会,是学习和探索PYNQ技术的理想起点。

    ASP.NET 2.0入门与提高系列课程(2):ASP.NET 2.0入门与探索

    本系列课程的第二部分主要聚焦于ASP.NET 2.0的入门与探索,旨在帮助初学者快速掌握这一技术,并逐步提升技能。 首先,让我们来探讨ASP.NET 2.0的核心概念和特性。ASP.NET 2.0引入了大量改进,例如控件事件模型、...

    python数据挖掘入门与实践 第三章 NBA测试数据

    python数据挖掘入门与实践 第三章测试数据,书中提到的下载方法已经下不到数据了,重新探索了下,找到的,亲测可用!!

    数学建模PythonPython语言快速入门程序及数据

    - 数据分析:统计分析、探索性数据分析(EDA)等。 - 数据可视化:通过图表展示数据特征和关系,帮助理解复杂数据集。 4. **数学建模案例实践**: - 使用线性回归模型预测销售数据。 - 应用逻辑回归进行二分类...

    R语言入门_R语言_R语言入门教程_

    R语言是一种广泛应用于统计分析、数据可视化和预测建模的编程语言和环境。它以其强大的数据分析功能和开源特性,受到了全球科研人员和数据...同时,不断探索和学习新的R包和方法,可以提升你在数据分析领域的专业技能。

    Redis 入门指南.pdf

    本指南将帮助初学者理解 Redis 的基本概念、安装与配置、数据类型以及常用命令,从而快速入门 Redis。 1. **Redis 简介** - Redis 源自意大利程序员 Salvatore Sanfilippo,最初是为了提高网站性能而设计的。 - ...

    S7-1200入门_s71200_1200PLC_S7-1200_yesfst_s7-1200数据库_

    《S7-1200入门:探索西门子小型PLC的魅力》 在工业自动化领域,西门子S7-1200系列PLC(可编程逻辑控制器)是广泛应用的一款控制器,尤其适合中小型系统。本文将深入探讨S7-1200的基本概念、功能特性以及如何进行...

Global site tag (gtag.js) - Google Analytics