OpenTSDB是一个架构在Hbase系统之上的实时监控信息收集和展示平台。
它在海量数据的压力下,仍然保证了存储的效率,那么它背后有什么值得借鉴的地方呢?
1)使用AsyncHbase而非HBase自带的HTable。使用线程安全、非阻塞、异步、多线程并发的HBase API,在高并发和高吞吐时,可以获得更好的效果。建议在使用AsyncHBase时,在CPU core有保证的前提下,可以设置16或者24。
2)采用固定长度的Rowkey,让Rowkey包含尽可能多的检索信息。这一点的话,OpenTSDB存储的数据要包含大量的metrics和tag信息,这些信息的长度是变长的,因此,在实现上设置了一个表格uid-tsdb存储这些信息,作为一个全局唯一的编号,并把编号与TimeStamp合并作为Rowkey。
3)每一行要存储尽可能多的信息,这一点在OpenTSDB被发挥到了极致。例如,把某个时间段的分散采集的数据合并在一起,按照一个Row来提交给hbase。这种方案,会减少整个表格Rowkey的个数,从而提高检索Row的速度,但是该方法并没有节省存储空间。
在这个基础上,OpenTSDB又推动了一步,让一个column记录多条内容,从而降低存储空间的浪费。
4)按照时间的Boundary来存储,仍采用无状态的存储方案,从而提供系统的容错能力。
附录:OpenTSDB中一个KeyValue的存储结构如下:
From Binospace, post OpenTSDB的设计之道
文章的脚注信息由WordPress的wp-posturl插件自动生成
相关推荐
OpenTSDB 2.3 中文文档 OpenTSDB 2.3 中文文档 OpenTSDB 2.3 中文文档
OpenTSDB是一个分布式时序数据库,它被设计用于高效存储和检索时间序列数据,如系统指标、应用性能监控数据等。OpenTSDB支持多种写入数据的方式,包括TelnetPut、CLI Import、TCollector以及本文重点介绍的HTTP API...
OpenTSDB 依赖 Apache HBase 作为底层的数据存储,HBase 是一个分布式、版本化的 NoSQL 数据库,运行在 Hadoop 文件系统(HDFS)之上。这种架构使得 OpenTSDB 具有高度可扩展性,能够处理海量数据,同时保证数据的...
OpenTSDB是一个开源的时间序列数据库(Time Series Database,TSDB),专为大规模监控系统设计,具有高度可扩展性和高性能。这个系统最初由雅虎开发,并在2012年开源,现在是Hadoop生态系统的一部分。OpenTSDB的核心...
openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB openTSDB
#### 架构设计 - **Flume**与**Kafka**连接:Flume负责收集风电设备产生的原始数据,并将其发送到Kafka中。 - **Kafka**与**Flink**连接:Kafka作为中间数据存储层,Flink订阅Kafka中的数据流进行实时处理。 - **...
OpenTSDB(全称为Open Time Series Database)是一个开源、分布式的时序数据库,设计用于大规模监控系统中存储和检索时间序列数据。它基于HBase构建,具有高度可扩展性和高吞吐量,能够处理大量的实时指标数据。在...
OpenTSDB(Time Series Database)是一种高性能的时间序列数据库,专门设计用于处理大量的时间戳数据。它可以利用HBase作为后端存储层,为用户提供秒级的数据收集能力,支持永久存储数据,便于进行容量规划。 **1.2...
OpenTSDB是一个时列数据库。时间序列是一段特定metric随时间变化的一系列数字数据点。每个时间序列都包含一个metric加上与该metric相关的一个或多个tags(我们将覆盖一些标记)。metric是您希望随时间跟踪的任何特定...
OpenTSDB是一种分布式、可扩展的时间序列数据库,其设计目的是为了处理大量来自各种监控系统的数据,例如网络设备、操作系统或应用程序的监控数据。它基于HBase构建,能够高效地存储和检索大量时间序列数据,并且...
OpenTSDB是一个专为处理大量时间序列数据而设计的开源数据库软件,尤其适合分布式系统的实时监控。它构建于Hadoop和HBase之上,具备分布式、可伸缩的特性,能实现毫秒级的时间精度数据存储,并支持高并发的读写操作...
OpenTSDB是一个开源的时间序列数据库(Time Series Database,TSDB),它构建在HBase之上,专为大规模收集、存储、查询和分析时间序列数据而设计。这个“opentsdb-2.4.0.tar.gz”文件是Linux版本的OpenTSDB安装包,...
OpenTSDB(Open Time Series Database)是一个分布式的、可扩展的时序数据库,专为收集、存储、查询和展示大量时间序列数据而设计。它最初由StumbleUpon开发,现在是开源社区的一个活跃项目。OpenTSDB基于HBase构建...
OpenTSDB是一个分布式、可扩展的时序数据库,运行在Hadoop之上,用于存储和处理大规模的时序数据。安装OpenTSDB包括: - 下载OpenTSDB源码或者二进制包。 - 解压并进入OpenTSDB目录。 - 配置OpenTSDB,包括tsd.core ...
附件是Opentsdb docker-compose 部署脚本
此页面列出了一些常见的OpenTSDB问题以及提高性能的步骤。 高速缓存 此时,OpenTSDB没有内置缓存(除了内置GUI,将缓存PNG图像文件60秒)。因此,我们依赖于底层数据库的缓存。在HBase(最常见的OpenTSDB后端)中...
opentsdb,用于测试hbase性能,官方地址下载不了。包1,需要同时下载另一个
opentsdb踩坑记录: 1. Int 类型溢出问题 2. tagv超出了最大值 3.不要在compaction时重启OpenTSDB服务 4. 分配UID时行锁问题,导致分配性能很低
opentsdb,用于测试hbase性能,官方地址下载不了。包2,需要同时下载另一个
您或许想直接进入openTSDB并开始将数据写入你的TSD,但要要真正使用OpenTSDB的强大功能优势和灵活性,您可能需要暂停(先停下来)并思考您的命名模式(方式)。完成下面的操作后,您就可以继续通过Telnet或HTTP API...