什么是Druid
Druid 是一个开源的,能在海量时序数据上 (万亿级别数据量, 1000 TB级别数据)上面提供实时分析查询的OLAP数据仓库,Druid提供了廉价的实时数据插入和任意数据探索的能力。
Druid的主要功能
为分析而生 - Druid是为了解决在OLAP工作流中进行探索分析而生的. 它提供了大量的filters, aggregators和 query 类型,并且提供了一个用户添加新功能的框架. 用户可以利用Druid的集群实现例如topN和直方图等功能。
(注: 传统数据库, 查询几千万的数据, 就会出问题, 查不出来)
(注: druid就是一个能力超强的数据库, 执行例如SQL: select aColumn, bColumn sum(cColumn) from tableName where aColumn like 'xxx' and bColumn = 5 group by aColumn, bColumn having sum(cColumn) > 5 order by aColumn.)
(注: druid对SQL支持有限,现在是实验版本。YeahMobi 重新开发适配了SQL, 屏蔽了下层平台, SQL 语句可以路由到这三个平台 druid, impala, hive)
高交互式 - Druid的低延时数据插入允许数据在生成之后的毫秒范围之内就可以被用户查询到。Druid通过读取和扫描需要的数据来优化查询的延时。
高可用性 - Druid可以被用来实现需要持续提供服务的SaaS应用。即使是在系统升级的过程中,你的数据仍然可以被查询。而且Druid 集群的扩容或者缩减不会带来数据的丢失。
(注: 已经在生产环境之中验证: 添加字段, 集群扩容, 集群缩减)
可扩展性 - 现有的Druid系统可以很轻松的处理每天数十亿条记录和TB级别的数据。Druid本身是被设计来解决PB级别数据的。
为什么要用Druid?
Druid的初衷是为了解决在使用Hadoop进行查询时所遇见的高延时问题来提高交互性查询。尤其是当你对数据进行汇总之后并在你汇总之后的数据上面进行查询时效果更好。将你汇总之后的数据插入Druid,随着你的数据量在不断增长,你仍然可以对Druid的查询能力非常有信心。当前的Druid安装实例已经可以很好的处理以每小时数TB实时递增的数据量。
(注: 在我们的实践中 druid 查询统计100亿数据, 在5秒内响应。 查询1个月的数据, 基本可以在毫秒内完成。 比hadoop的常用的T+1 Map Reduce 高效多了.
你可以在拥有Hadoop的同时创建一个Druid系统。Druid提供了以一种互动式切片、切块方式来访问数据的能力,它在查询的灵活性和存储格式直接寻找平衡从而来提供更好的查询速度。
caravel对druid有良好的支持,可以很方便的实现可视化。
什么情况下需要Druid?
当你需要在大数据集上面进行快速的,交互式的查询时,通过支持索引,查询效率比较高
当你需要进行特殊的数据分析,而不只是简单的键值对存储时
当你拥有大量的数据时 (每天新增数百亿的记录、每天新增数十TB的数据)
当你想要分析实时产生的数据时,在复杂sql应用场景下保证性能
当你需要一个24x7x365无时无刻不可用的数据存储时
Druid的缺点
不支持join
不支持数据更新,只适合大量数据追加的应用
Druid用索引来提高带过滤查询的速度,索引结构会增加存储负担(使修改更难), 但是显著的增加速度
架构概述
druid在一定程度上是受搜索框架的启发, 通过建立不变数据视图和使用便于filter和aggregation的高度优化的格式来提高性能. Druid 集群有一系列不同类型的节点组成, 每种节点将一小部分事情做到极致。
Druid vs…
Druid-vs-Impala-or-Shark
Druid-vs-Redshift
Druid-vs-Vertica
Druid-vs-Cassandra
Druid-vs-Hadoop
Druid-vs-Spark
Druid-vs-Elasticsearch
数据框架世界一直在巨大的混乱的变化之中, 这个网页希望帮助潜在的用户评估和确定druid适合用户解决遇到的问题。 如果有错误请通过邮件列表或者其他渠道反馈.
相关推荐
Druid是阿里巴巴开源的一个强大、灵活且高性能的Java数据库连接池组件。它提供了监控、SQL解析、执行性能统计等多种功能,广泛应用于各种Java企业级项目中。Druid-1.2.8版本源码的分析可以帮助我们深入理解其内部...
【阿里Druid简介】 Druid是阿里巴巴开源的一个数据库连接池组件,它不仅是一个优秀的数据库连接池,还包含SQL解析、监控、扩展性等多方面的功能。Druid在性能上表现优秀,提供了强大的监控和扩展机制,是许多Java...
Apache Druid 是一个高性能、实时分析数据库,主要用于大数据的在线分析处理。它以其强大的查询性能、低延迟和可扩展性在大数据领域中广受好评。在深入理解Druid之前,我们首先需要了解它作为连接池的角色,以及...
Druid是阿里巴巴开源的一个高效、强大的数据库连接池组件,它的全称是Dynamic Routing Data Source,即动态路由数据源。在Java Web开发中,数据库连接池扮演着至关重要的角色,它负责管理数据库连接,提高数据库操作...
赠送jar包:druid-1.1.9.jar; 赠送原API文档:druid-1.1.9-javadoc.jar; 赠送源代码:druid-1.1.9-sources.jar; 赠送Maven依赖信息文件:druid-1.1.9.pom; 包含翻译后的API文档:druid-1.1.9-javadoc-API文档-...
### 如何去除Druid监控中的阿里广告 #### 一、问题背景 在使用Java集成阿里云的Druid数据源进行数据库连接池管理时,我们可能会遇到一个比较烦人的问题:Druid控制台页面下方默认会显示一条来自阿里的横幅广告。...
赠送jar包:druid-1.1.10.jar; 赠送原API文档:druid-1.1.10-javadoc.jar; 赠送源代码:druid-1.1.10-sources.jar; 赠送Maven依赖信息文件:druid-1.1.10.pom; 包含翻译后的API文档:druid-1.1.10-javadoc-API...
赠送jar包:druid-1.2.8.jar; 赠送原API文档:druid-1.2.8-javadoc.jar; 赠送源代码:druid-1.2.8-sources.jar; 赠送Maven依赖信息文件:druid-1.2.8.pom; 包含翻译后的API文档:druid-1.2.8-javadoc-API文档-...
赠送jar包:druid-1.1.16.jar; 赠送原API文档:druid-1.1.16-javadoc.jar; 赠送源代码:druid-1.1.16-sources.jar; 赠送Maven依赖信息文件:druid-1.1.16.pom; 包含翻译后的API文档:druid-1.1.16-javadoc-API...
大数据Druid集群实时分析搭建 Druid是大数据实时分析平台,能够处理大量数据的实时查询和分析。以下是大数据Druid集群实时分析搭建的详细步骤和知识点: 环境准备 * 3台ECS服务器,each with 4 cores, 8G memory,...
Druid是阿里巴巴开源的一个数据库连接池组件,它在Java开发中被广泛使用,为应用程序提供高效、灵活、稳定的数据库连接管理。这个"druid-1.2.5.rar"压缩包包含的是Druid的1.2.5版本,该版本可能包含了源代码、jar包...
赠送jar包:druid-1.2.8.jar; 赠送原API文档:druid-1.2.8-javadoc.jar; 赠送源代码:druid-1.2.8-sources.jar; 赠送Maven依赖信息文件:druid-1.2.8.pom; 包含翻译后的API文档:druid-1.2.8-javadoc-API文档-...
在Spring Boot应用中,Druid和JPA是两种常见的数据库操作工具。Druid是一个功能强大的数据库连接池,而JPA(Java Persistence API)是Java平台上的一个标准,用于对象关系映射(ORM)。本篇文章将深入探讨如何在...
赠送jar包:druid-1.0.14.jar; 赠送原API文档:druid-1.0.14-javadoc.jar; 赠送源代码:druid-1.0.14-sources.jar; 包含翻译后的API文档:druid-1.0.14-javadoc-API文档-中文(简体)版.zip 对应Maven信息:...
标题所指的知识点为“Druid 源码分析 逐层详解”,意味着我们需要深入分析Druid这一开源数据处理工具的源码,并从不同的层面揭示其内部实现机制。 首先,我们来看Druid的构架设计。Druid采用了分层的架构,每个层次...
**Druid监控系统安装与配置详解** Druid是一款高性能、多功能的数据库连接池,它集成了数据源管理、SQL解析、执行计划展示、监控、扩展点等众多功能。在复杂和高并发的环境中,对数据库连接池进行实时监控至关重要...
Druid是阿里巴巴开源组织提供的一款强大的Java数据库连接池组件,全称为Dynamic Resourec Unicode Druid,其版本号为1.1.10。Druid的主要功能包括数据库连接池管理、SQL解析与执行监控、数据源健康检查以及日志监控...
Druid连接池是阿里巴巴开源的一款高性能数据库连接池组件,版本1.1.10在众多项目中广泛使用并受到良好的反馈。这个组件的核心目标是提供监控、扩展性和性能优化的数据库连接管理服务。以下是对Druid连接池1.1.10版的...
Druid是阿里巴巴开源的一款高效、强大的数据库连接池组件,它在Java编程中广泛应用于大数据量、高并发的Web应用中。Druid不仅提供了基础的数据库连接池功能,还集成了监控、SQL解析、参数绑定等多个高级特性,为开发...