Elaticsearch 有非常好的查询性能,以及非常强大的查询语法。在一定场合下可以替代RDBMS做为OLAP的用途。但是其官方查询语法并不是SQL,而是一种Elasticsearch独创的DSL。主要是两个方面的DSL:
-
Query DSL(https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl.html) 相当于SQL里的 WHERE 部分,实现各种各样的过滤文档的方式
-
Aggregation DSL (https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations.html) 相当于SQL里的 GROUP BY 部分,实现文档按条件聚合并求一些指标(metric),比如求和求平均这些
这两个DSL说实话是不好学习和理解的,而且即便掌握了写起来也是比较繁琐的,但是功能却非常强大。本系列文章是为了两个目的:
-
通过类比SQL的概念,实验并学习Elasticsearch聚合DSL的语法和语义
-
用 python 实现一个翻译器,能够使用 SQL 来完成 Elasticsearch 聚合DSL一样的功能。这个小脚本可以在日常工作中做为一件方便的利器
基础Elasticsearch知识(比如什么是文档,什么是索引)这里就不赘述了。我们的重点是学习其查询和聚合的语法。在本章中,我们先来准备好样本数据。选择的样本数据是全美的股票列表(http://www.nasdaq.com/screening/company-list.aspx)。选择这份数据的原因是因为其维度比较丰富(ipo年份,版块,交易所等),而且有数字字段用于聚合(最近报价,总市值)。数据下载为csv格式(https://github.com/taowen/es-monitor/tree/master/sample),并且有一个导入脚本(https://github.com/taowen/es-monitor/blob/master/sample/symbol.py)
下面是导入Elasticsearch的mapping(相当于关系型数据库的表结构定义):
{
"symbol": {
"properties": {
"sector": {
"index": "not_analyzed",
"type": "string"
},
"market_cap": {
"index": "not_analyzed",
"type": "long"
},
"name": {
"index": "analyzed",
"type": "string"
},
"ipo_year": {
"index": "not_analyzed",
"type": "integer"
},
"exchange": {
"index": "not_analyzed",
"type": "string"
},
"symbol": {
"index": "not_analyzed",
"type": "string"
},
"last_sale": {
"index": "not_analyzed",
"type": "long"
},
"industry": {
"index": "not_analyzed",
"type": "string"
}
},
"_source": {
"enabled": true
},
"_all": {
"enabled": false
}
}
}
对于把 Elasticsearch 当作数据库来使用,默认以下几个设置
-
把所有字段设置为 not_analyzed
-
_source 打开,这样就不用零散地存储每个字段了,大部分情况下这样更高效
-
_all 关闭,因为检索都是基于 k=v 这样字段已知的查询的
执行python import-symbol.py
导入完成数据之后,执行
GET http://127.0.0.1:9200/symbol/_count
返回
{"count":6714,"_shards":{"total":3,"successful":3,"failed":0}}
可以看到文档已经被导入索引了。除了导入一个股票的列表,我们还可以把历史的股价给导入到数据库中。这个数据比较大,放在了网盘上下载(https://yunpan.cn/cxRN6gLX7f9md 访问密码 571c)(http://pan.baidu.com/s/1nufbLMx 访问密码 bes2)。执行python import-quote.py
导入
"quote": {
"_all": {
"enabled": false
},
"_source": {
"enabled": true
},
"properties": {
"date": {
"format": "strict_date_optional_time||epoch_millis",
"type": "date"
},
"volume": {
"type": "long"
},
"symbol": {
"index": "not_analyzed",
"type": "string"
},
"high": {
"type": "long"
},
"low": {
"type": "long"
},
"adj_close": {
"type": "long"
},
"close": {
"type": "long"
},
"open": {
"type": "long"
}
}
}
从 mapping 的角度,和表结构定义是非常类似的。除了_source,_all和analyzed这几个概念,基本上没有什么差异。Elasticsearch做为数据库最大的区别是 index/mapping 的关系,以及 index 通配这些。
原文地址:https://segmentfault.com/a/1190000004433446
相关推荐
springboot167基于springboot的医院后台管理系统的设计与实现,含有完整的源码和报告文档
XGigE IP GigE Vision Streaming Protocol VHDL源码 有基于AC701 FPGA板卡的完整的参考工程
fluent重叠网格动网格,振荡翼型加摆动后缘小翼算例文件,udf文件,视频教程 流体力学,航空航天,船舶海洋,土木工程,能源动力专业必备
springboot174基于springboot的疾病防控综合系统的设计与实现,含有完整的源码和报告文档
SIGIR'22-减少虚假新闻检测中的实体偏差-论文复制_ ENDEF_glj
Vue3 是 Vue.js 框架的最新版本,它带来了许多重要的更新和改进,旨在提升开发效率、性能和可维护性。在这个名为“vue3-demo2”的项目中,我们可以探索 Vue3 的核心特性以及如何在实际应用中使用它们。
计算 Freeman 链代码以及边界的第一个差值和形状编号MATLAB代码.rar
dsp28335电机控制板zi料(软件代码) 1.永磁同步电机有传感器三闭环foc控制代码 2.永磁同步电机无传感器双闭环foc控制代码 3.无刷直流电机有传感器方波控制代码 4.异步电机V F变频调速控制代码 控制板和驱动版硬件电子资料+软件程序CCS6.0环境下运行
以下是校园二手书交易系统的功能描述,旨在促进学生之间的二手书交易,提高资源利用率和降低学习成本。 校园二手书交易系统功能描述 1. 用户角色 学生/买家 学生/卖家 管理员 2. 功能描述 学生/买家功能 用户注册与登录 支持使用邮箱、手机号或社交媒体账号注册和登录。 提供个人资料管理功能,包括用户名、联系方式等。 浏览与搜索 浏览二手书列表,可以按类别(教材、文学、参考书等)、价格区间、书名等进行筛选。 提供关键词搜索功能,快速找到需要的书籍。 书籍详情查看 查看书籍的详细信息,包括书名、作者、出版社、ISBN、成色、价格及卖家信息。 显示书籍的图片,以便更好地了解书籍状态。 在线购买 向卖家发送购买请求,支持订单确认和支付流程。 提供多种支付方式,如支付宝、微信支付等,方便快捷。 评价与反馈 对完成交易的卖家进行评价,提供反馈以帮助其他用户选择。 举报不良行为或虚假信息,维护交易环境的安全性。 收藏与关注 收藏感兴趣的书籍,便于后续查找。 关注卖家,接收其新上架书籍的通知。 学生/卖家功能 书籍发布 提供简单易用的书籍发布界面,填写书籍信息(如书名、作者、价格、成色
Java小程序项目源码,该项目包含完整的前后端代码、数据库脚本和相关工具,简单部署即可运行。功能完善、界面美观、操作简单,具有很高的实际应用价值,非常适合作为Java毕业设计或Java课程设计使用。 所有项目均经过严格调试,确保可运行!下载后即可快速部署和使用。 1 适用场景: 毕业设计 期末大作业 课程设计 2 项目特点: 代码完整:详细代码注释,适合新手学习和使用 功能强大:涵盖常见的核心功能,满足大部分课程设计需求 部署简单:有基础的人,只需按照教程操作,轻松完成本地或服务器部署 高质量代码:经过严格测试,确保无错误,稳定运行 3 技术栈和工具 前端:小程序 后端框架:SSM/SpringBoot 开发环境:IntelliJ IDEA 数据库:MySQL(建议使用 5.7 版本,更稳定) 数据库可视化工具:Navicat 部署环境:Tomcat(推荐 7.x 或 8.x 版本),Maven
微信小程序-大树洞2.0 - 基于 WePY_szushudong
安徽打算几点刚把手机官方还是
网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面,个人大四毕业设计项目、经导师指导并认可通过的高分设计项目,评审分99分,代码完整确保可以运行,小白也可以亲自搞定,主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。 网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测的网课专注度检测系统源码+模型+pyqt5界面网课专注度监测预警系统基于yolov5目标检测
comsol亚波长超声聚焦 仿真 生物超声、高强度聚焦能器 超声能器 超声传感器 MEMS PMUT PVDF压电能量收集器 1-3复合压电陶瓷 1-2复合压电陶瓷设计 超声匹配层研究 等等
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
springboot186人格障碍诊断系统,含有完整的源码和报告文档
WooCommerce微信小程序_从oocommerce到微信微信
python 一个基于基于python的人脸识别签到系统.zip 一个基于基于python的人脸识别签到系统.zip
springboot184基于springboot的校园网上店铺的设计与实现,含有完整的源码和报告文档
基于特征的视网膜图像配准Matlab代码.rar