`
fenshen6046
  • 浏览: 52978 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

1入门--5探索数据

es 
阅读更多
搜索API
GET /bank/_search?q=*&sort=account_number:asc&pretty
rest方式搜索bank索引下的所有数据,并且按照account_number 上升方式返回
类似下面的搜索方式
GET /bank/_search
body为:
{
  "query": { "match_all": {} },
  "sort": [
    { "account_number": "asc" }
  ]
}
初步学习搜索语言
下面的搜索全部文档,按照balance降序排列,并返回11到20的文档,from的位置开始,size个文档
GET /bank/_search
{
  "query": { "match_all": {} },
  "sort": { "balance": { "order": "desc" } }
  "from": 10,
  "size": 10
}
执行搜索
当不需要所有字段都返回的时候可以使用如下方式_source,定义了只返回两个字段
GET /bank/_search
{
  "query": { "match_all": {} },
  "_source": ["account_number", "balance"]
}

如果我们希望根据某个条件进行搜索可以使用match字段:
如下搜索account_number 为 20的文档
GET /bank/_search
{
  "query": { "match": { "account_number": 20 } }
}
如下搜索address包含“mill”的文档
GET /bank/_search
{
  "query": { "match": { "address": "mill" } }
}
如下搜索address包含“mill”或者包含“lane”的文档
GET /bank/_search
{
  "query": { "match": { "address": "mill lane" } }
}
如下搜索address包含短语“mill lane”的文档
GET /bank/_search
{
  "query": { "match_phrase": { "address": "mill lane" } }
}

bool 搜索可以组合小的搜索到一个大搜索中
如下搜索address包含mill和lane的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
(must代表必须满足的意思)

相反,如下搜索address包含mill或者lane的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "should": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
(should代表任何一个条件满足即可)

如下搜索address既不包括mill又不包括lane的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must_not": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
(must_not 代表排除的意思)

以上的三种类型可以合并使用
如下搜索age为40且state不是ID的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}
执行过滤
filter执行过滤(其实就是对非string的进行区间搜索过滤)
如果搜索20000<=blance && blance<=30000的文档
GET /bank/_search
{
  "query": {
    "bool": {
      "must": { "match_all": {} },
      "filter": {
        "range": {
          "balance": {
            "gte": 20000,
            "lte": 30000
          }
        }
      }
    }
  }
}

执行聚合
如下根据字段state聚合查找每种类型的数量(默认按照降序排列,返回前10条记录类似sql:SELECT state, COUNT(*) FROM bank GROUP BY state ORDER BY COUNT(*) DESC)
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state"
      }
    }
  }
}
(注意:设置size为0是因为我们不想看到hit的信息)

如下在上面的基础上,我们想要知道blance的平均值
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state"
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}
在上面的基础上,我们希望按照平均值降序排列
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state",
        "order": {
          "average_balance": "desc"
        }
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}

如下我们先根据年龄,然后根据性别,然后求出balance的平均值
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_age": {
      "range": {
        "field": "age",
        "ranges": [
          {
            "from": 20,
            "to": 30
          },
          {
            "from": 30,
            "to": 40
          },
          {
            "from": 40,
            "to": 50
          }
        ]
      },
      "aggs": {
        "group_by_gender": {
          "terms": {
            "field": "gender.keyword"
          },
          "aggs": {
            "average_balance": {
              "avg": {
                "field": "balance"
              }
            }
          }
        }
      }
    }
  }
}
分享到:
评论

相关推荐

    数据挖掘入门----数据挖掘入门

    这些工具提供了直观的界面和丰富的算法库,便于用户进行数据探索和模型构建。 六、数据挖掘的应用场景 数据挖掘广泛应用于市场营销(客户细分、预测购买行为)、金融风控(信用评估、欺诈检测)、医疗健康(疾病...

    SAS基础统计入门--SAS入门篇

    - **探索数据**:通过图形界面探索数据的分布特性。 - **单变量分析**:评估单个变量的统计性质。 - **多变量分析**:研究多个变量之间的相关性和主成分。 - **建模分析**:使用方差分析和回归分析等方法建立...

    Qlik-Sense-教程-基础入门-中文

    ### Qlik Sense 教程:基础入门中文版详解 #### 一、Qlik Sense 概述 **Qlik Sense** 是一款强大的商务智能(BI)工具,它可以帮助用户轻松地探索和分析数据,并以直观的方式展示结果。Qlik Sense 的核心优势在于...

    python 数据挖掘入门与实践 代码下载

    Python数据挖掘是一个热门的领域,尤其对于初学者来说,它提供了强大的工具和易于理解的语法,使得探索和分析数据变得更加简单。"Python 数据挖掘入门与实践"无疑是一本旨在引导读者进入这个领域的优秀教程。配套的...

    天池-零基础入门数据挖掘-心跳信号分类预测-EDA分析全过程-代码.rar

    在本项目中,我们主要关注的是“天池-零基础入门数据挖掘-心跳信号分类预测-EDA分析全过程-代码.rar”这一主题。这个压缩包文件包含的是一次数据挖掘实践,特别针对心跳信号的分类预测,它涉及到数据分析的初步探索...

    1.PowerBI从入门到精通-面向使用者(官方原版).pdf

    该文档《1.PowerBI从入门到精通-面向使用者(官方原版)》是针对想要学习并精通PowerBI使用的个人或团队的官方指南。 首先,文档对“PowerBI使用者”的概念进行了定义,即那些接收并使用同事创建的仪表板、报表和...

    数据分析入门所使用的美国人口普查数据及数据说明

    这个数据集是Coursera上"Python编程的数据分析入门"课程中使用的一个实例,它帮助初学者实践如何用Python进行数据清洗、探索和分析。 数据文件`census.csv`是一个常见的CSV(Comma Separated Values)文件,这种...

    VS2010之MFC入门到精通教程(1-55全)

    - 探索不同组件之间的交互方式,如数据共享、更新策略等。 #### 第七部分:MFC常用类 - **VS2010/MFC编程入门之四十二至四十六(MFC常用类系列)** - 分析MFC中常用的类,如`CString`、`CTime`、`CFile`等。 - ...

    DB2数据仓库入门

    1. **数据仓库基础** 数据仓库是为企业决策提供支持的系统,它集成了来自不同源的数据,经过清洗、转换后存储在结构化的环境中,以供分析和报告。与常规在线事务处理(OLTP)系统不同,数据仓库主要关注历史数据的...

    python编程-从入门到实践(配套资源)-sitka-weather-07-2014 population

    《python编程-从入门到实践》这本书,作为初学者的指南针,提供了深入浅出的介绍,帮助读者掌握python的基本语法、数据结构、函数编程等基础知识,并通过实际的案例学习将理论知识转化为实践经验。 书中配套资源的...

    Python数据分析:活用Pandas库-数据集 pandas-for-everyone-master

    具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和Series对象,使用matplotlib、seaborn和Pandas提供的绘图方法为探索性数据分析作图,连接与合并数据集,处理缺失数据,清理数据,...

    4.PowerBI从入门到精通-面向开发人员(官方原版).pdf

    PowerBI作为一款强大的商业智能工具,它允许用户通过可视化方式来分析和呈现数据,从而使得...此外,PowerBI的社区和资源中心为开发人员提供了宝贵的学习资源和交流平台,为他们在数据可视化方面的探索提供了有力支持。

    IEEE5节点图及其数据

    ### IEEE5节点图及其数据详解 #### 一、概述 在电力系统仿真与分析领域,IEEE(电气与电子工程师学会)标准提供了一系列用于教学、研究和工程实践的标准测试案例。其中,“IEEE5节点图及其数据”是电力系统分析...

    Pynq_Z1_Z2(zynq7000系列)入门资料

    1. Pynq-Z1与Pynq-Z2概述 - Pynq-Z1和Pynq-Z2都是Xilinx为了简化Zynq SoC的开发而设计的板卡。它们都配备了Zynq-7000 All Programmable SoC,但存在一些硬件差异,如内存大小、接口数量等。 - Pynq框架是Xilinx...

    4-1探索型数据分析:绘制统计图形展示数据分布.html

    数据分析师的入门详解资料

    PowerPivot 入门手册_giantu54_PowerPivot_

    - PowerPivot中的数据透视表允许用户以交互方式探索和分析数据,通过拖放字段进行多维度分析。 - 切片器作为可视化工具,可帮助用户筛选和聚焦数据透视表的特定部分,增强分析的灵活性和深度。 5. **共享与协作**...

    PYNQ-Z2入门指导手册_v2.01

    【PYNQ-Z2入门指导手册_v2.01】是针对PYNQ-Z2开发板的一款详尽的使用教程,旨在帮助用户快速掌握...这份手册不仅提供了一套完整的PYNQ-Z2入门流程,还为初学者提供了动手实践的机会,是学习和探索PYNQ技术的理想起点。

    ASP.NET 2.0入门与提高系列课程(2):ASP.NET 2.0入门与探索

    本系列课程的第二部分主要聚焦于ASP.NET 2.0的入门与探索,旨在帮助初学者快速掌握这一技术,并逐步提升技能。 首先,让我们来探讨ASP.NET 2.0的核心概念和特性。ASP.NET 2.0引入了大量改进,例如控件事件模型、...

    FFMPEG入门基础资料pdf

    1. **FFmpeg命令行工具**:这是最直接与用户交互的部分,通过在终端输入命令,执行各种多媒体处理任务。 2. **libavcodec**:这是一个包含多种编码和解码器的库,支持多种常见的音视频格式。 3. **libavformat**:...

    数学建模PythonPython语言快速入门程序及数据

    - 数据分析:统计分析、探索性数据分析(EDA)等。 - 数据可视化:通过图表展示数据特征和关系,帮助理解复杂数据集。 4. **数学建模案例实践**: - 使用线性回归模型预测销售数据。 - 应用逻辑回归进行二分类...

Global site tag (gtag.js) - Google Analytics