`
骑猪逛街666
  • 浏览: 144154 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

高性能时序数据库 HiTSDB 启动公测_为物联网而生的数据库!

 
阅读更多

阅读原文请点击

摘要: 2017云栖大会·上海峰会上,阿里云发布了面向物联网场景的高性能时间序列数据库 (High-Performance Time Series Database , 简称 HiTSDB) 。HiTSDB 可支持每秒1000万时序数据点写入;具备PB级别的数据存储能力,提供高效压缩算法,整体存储成本降低90%;提供时序数据插值计算,降精度计算,时间纬度聚合计算,空间纬度聚合计算的能力。

查看首发详情,全面了解 HiTSDB

HiTSDB 是一种高性能、低成本、稳定可靠的在线时序数据库服务;提供高效读写,高压缩比存储、时序数据插值及聚合计算。是物联网(IoT)设备监控系统 ,企业能源管理系统(EMS),生产安全监控系统,电力检测系统等行业领域的专业数据库。

HiTSDB 打造物联网智慧园区

HiTSDB 已经在阿里巴巴内部孵化多年,在阿里巴巴集团已经支持了20多个核心业务场景,比如阿里智慧园区的物联网(IoT)建设。

智慧园区主要解决办公园区的设备的管理和智能控制。设备管理主要是将设备接入到统一的设备管理平台,同时对所有设备的运行情况进行监控,及时发现故障设备,了解整体的设备运行情况以便于做出相应的决策。

而智能控制就是系统能够根据设备的运行状态,通过某些规则的设定自动的进行各种调控,比如:当某个办公区域的人数大于20人时,可以自动开启亮灯,小于20人是可以自动关灯,或者当某一区域的一氧化碳的水平高于预警值,则自动启动报警开关,对于园区的安全管理也非常必要。

对于技术而言,设备的监控和智能控制的规则的匹配,本质是数据的收集和监控分析。

园区的设备种类繁多,包括摄像头、电灯、空调、空气检测,这些设备上都有非常多的传感器,这些传感器每一时刻都在实时的产生数据,这些数据随着时间的推进,会在时间轴上产生一些列的数据,就是我们说的时序数据,比如温度、湿度、用电量等。要实现设备的监控管理,其实就是将这时序数据进行实时的采集存储和分析展现,而 HiTSDB 就是时序数据领域的专业数据库。

HiTSDB 集群可支持每秒 1000 万的时序数据点写入

HiTSDB 具备关系数据库及NoSQL 数据库所不具备的写入能力。

智慧园区以及其他的IoT场景,设备的规模通常是万级别至百万级别,每个设备都实时产生数据,需要将实时数据快速的写入到数据库中,那么每秒就要写入上百万甚至上千万的实时数据。

百万甚至千万级别的实时数据写入对于数据库并发写入的压力非常巨大,使用关系型数据库完全不可行。 因为 InnoDB 的写入性能是很有限的,实际测试在24台机器上,存储使用SSD硬盘,一秒钟只能持续写入只有两万左右,主要原因在于B树索引。InnoDB 的索引是一个B树,这个B树的更新有很大的开销。虽然我们可以通过一些办法优化,但时序数通常是一个多维数据,通常是 ADhoc 的查询,为了优化所有排列组合查询,需要建很多多列的索引,这些索引每次在写的时候每个都需要更新,所以就会导致很多的IO。

而 HiTSDB 针对时序数据库的进行写入优化,基于时间序列的时间线数据结构进行存储写入,实际业务使用场景中最高支持到每秒 1000 万的时序数据点写入。基于阿里云 4C8G规格的 ECS,单台平均达到10万/秒的数据写入,峰值达15万/秒。

HiTSDB 具备领先的时序数据分析技术优势

在数据查询方面,HiTSDB 也具备领先的技术优势。在时序数据领域“插值(interpolation)”,“降精度(DownSimple)”以及“聚合计算(Aggregation)”是常见的业务需求。举个例子, 智慧园区的业务系统需要查看一个楼宇的某盏灯的耗电量情况,那么就需要把这盏灯的耗电量数据从数据库中查询并展示出来,如果由于采集的故障导致某个时刻用电量数据缺失,那么需要通过特定算法来近似的估算出这个数据,这个计算补全数据的过程就是“插值”。而当需要查看这盏灯一年的耗电趋势情况时,通常只需要计算出每一天的耗电量,进行查看,而不需要把每一个时刻采集的数据全部输出出来,这个将原始精度转化为业务需求精度的过程就是“降精度”。而如果要统计某一个楼层或者楼宇的用耗电量整体趋势数据时,就需要将所有统计范围内的灯具的耗电量数据做“合并统计”,这个类似的统计过程就是Aggregation。

时序数据降精度是在时间序列维度上做的。对于关系数据库来说,首先要把时间序列维度拿出来,然后在中间插值,而实际上 SQL 是按点来操作的。所以如果要做降精度的话,需要用一个值查询把整条时间序列上的数据查询出来,插好值之后才能做时间序列之间的聚合,那么服务和 SQL 服务器之间的吞吐量非常大,相当于 SQL 只是一个数据通道需要把所有值都拉出来运算一遍,这个查询性能会非常慢,并且每一次计算都需要重新拉取数据,相对 HiTSDB,这个性就能差了几百倍。

HiTSDB 支持线性插值,可以尽量弥补数据异常缺失造成的统计失败。HiTSDB 支持 Max ,Min ,AVG 等各种降精度的计算函数,同时也可以通过“预降精度”的方式,将业务精度的数据在入库的过程中计算完成,提升查询的效率。HiTSDB 在的空间聚合 Aggregator 支持也非常全面,支持 ADhoc 查询,HiTSDB 通过引入倒排索引和数据分片提升检索时间序列的效率,通过并行计算架构,整体计算性能提升非常明显。

HiTSDB 兼容 OpenTSDB 协议,写入性能提升20倍,压缩效率提升10倍。

HiTSDB 兼容 OpenTSDB 访问协议。OpenTSDB 是时序数据库领域相对活跃的技术产品,HiTSDB 通过技术优化后相对于 OpenTSDB 写入性能提升20倍以上。HiTSDB 压缩效率相比较 OpenTSDB 提升10倍左右,通常原始时序数据的大小在 200-300 Byte,OpenTSDB 单数据点消耗约20 Byte,HiTSDB 单数据点消耗约 2Byte,通过 HiTSDB 可以节约90%以上的数据库存储成本。

HiTSDB 所具备的高效数据写入和高压缩比的特性,以及阿里长期业务实践的所提供的稳定性保证,结合阿里云上丰富的产品生态,可以帮助 IoT 企业快速构建自己的智慧物联网监控分析系统,也可以帮助传统的石油化工及制造企业插上物联网的翅膀,打造属于企业自己的智慧系统。

阅读原文请点击

分享到:
评论

相关推荐

    阿里 为物联网而生-高性能时间序列数据库

    阿里云栖大会中介绍的阿里高性能时间序列数据库HiTSDB,是专门为物联网(IoT)设计的数据库解决方案,它针对物联网应用中的大规模、高频率数据处理需求进行了优化。时间序列数据库是一种专门处理时间序列数据的数据库...

    为物联网而生高性能时间序列数据库.pdf

    阿里巴巴数据库产品专家 艾乐强 在2018云栖大会·武汉峰会中做了题为《为物联网而生-高性能时间序列数据库》的分享,就物联网数据特征和数据库困境、HiTSDB 核心能力介绍、物联网平台方案和架构设计、时序数据库应用...

    物联网数据库如何设计?iot数据库和传统数据库有什么区别?

    本文中主要介绍了传统数据库没有物联网的速度基因,时序数据库的数据存储设计,时序数据库编程语言之争,时序数据库整合趋势明显等相关内容。本文来自csdn,由火龙果软件Anna编辑、推荐。而且“增删改查”是传统...

    深度解读!时序数据库HiTSDB:分布式流式聚合引擎

    HiTSDB时序数据库引擎在服务于阿里巴巴集团内的客户时,根据集团业务特性做了很多针对性的优化。然而在HiTSDB云产品的打磨过程中逐渐发现,很多针对性的优化很难在公有云上针对特定用户去实施。于此同时,在公有云...

    基于JSON的NoSql时序数据库,TDS - 物联网数据服务

    物联网时序数据库; Web SCADA平台 ; 物联网数据中台; 物联网软网关。 TDS面向物联网场景设计,使用一个 "位号"(tag) 来存储来自于某一个设备或者是某一个传感器的时序数据。可以将一个 "位号" 理解为关系型...

    基于JSON的NoSql时序数据库;最轻便的物联网组态软件;Web SCADA平台 ; 物联网数据中台; 物联网软网关

    物联网时序数据库; Web SCADA平台 ; 物联网数据中台; 物联网软网关。TDS面向物联网场景设计,使用一个 "位号"(tag) 来存储来自于某一个设备或者是某一个传感器的时序数据。可以将一个 "位号" 理解为关系型数据库...

    时序数据库技术和架构演进.pdf

    时序数据库因其高效的数据写入速度、强大的查询能力以及对大规模数据的支持而被广泛应用于物联网(IoT)、工业自动化、金融交易等多个领域。 ### 二、时序数据库的关键特性 1. **高效的数据写入能力**:时序数据库...

    工业大数据-时序数据库的现状与未来.pdf

    工业大数据的发展推动了时序数据库的需求,时序数据库需要能够提供高性能、可扩展性、高可靠性和实时性的服务。Tbase是一个基于时序数据库的解决方案,能够满足工业大数据的需求,提供高性能、可扩展性、高可靠性和...

    时序数据库 InfluxDB

    专门为时间序列数据编写的自定义高性能数据存储。TSM 引擎允许高速摄取和数据压缩 完全用 Go 编写。它编译成一个没有外部依赖性的二进制文件。 简单、高性能的写入和查询 HTTP API。 插件支持其他数据摄取协议,例如...

    时序数据库.rar

    在NoSql的框架下,时序数据库提供了一种灵活且高性能的方式来处理时序数据。例如,某些时序数据库产品如InfluxDB、OpenTSDB和Cassandra等,它们支持多种数据模型和API,允许开发者根据具体业务需求选择合适的解决...

    时序数据库和LSM1

    时序数据库是一种专门针对时间序列数据进行高效存储和查询的数据库系统。在物联网(IoT)、监控系统、金融交易、工业自动化等领域中,时序数据的处理需求日益增长,因为这些场景通常涉及大量连续、实时的数据记录和...

    HBase专场:HBase在时序数据库中的应用(悠你).pdf

    时序数据是指在时间维度上分布的一系列数值数据,其典型特征是数据量大、持续不断增长、随时间推移而老化、通常包含多维度标签,并且对于最新数据具有较高的价值。 时序数据的特点包括: 1. 数据源数量巨大:涉及的...

    TDS - 基于JSON的NoSql时序数据库的物联网数据服务

    标题中的"TDS"代表Time Series Database(时序数据库),它是一种专门用于处理时间序列数据的数据库系统。在物联网(IOT)领域,由于设备不断产生关于时间戳的测量值,如温度、湿度、压力等,时序数据库成为存储和...

    拥抱物联网的新一代时序时空数据库.pdf

    时序数据库,作为一种专门为处理时间序列数据而设计的数据库管理系统,近年来在各个行业中扮演着越来越重要的角色。2019年,随着物联网的发展,时序数据库的需求激增,尤其是在电力、交通、石油石化、物流、环境监测...

    基于C语言的高性能分布式时序数据库TDengine设计源码

    该项目是TDengine的高性能分布式时序数据库设计源码,主要使用C语言开发,同时包含C、Python、Java、Shell、JavaScript、HTML、Lua、Go、C++、CSS、C#、MATLAB、Rust等多种语言。项目共包含3423个文件,其中包括630...

    基于HiTSDB的物联网平台架构.pptx

    HiTSDB,全称为High-Performance Time Series Database,是一款专为解决物联网(IoT)场景下时序数据存储与处理问题而设计的高性能数据库系统。本文将深入探讨HiTSDB的核心能力以及如何构建基于HiTSDB的物联网平台架构...

    CeresDB 是一款高性能、分布式、Schema-less 的云原生时序数据库,能够同时处理时序型以及分析型负载

    CeresDB是一款专为应对高性能、分布式环境设计的云原生时序数据库,其核心特性在于其Schema-less架构,能够灵活适应不断变化的数据模式,并且能够同时高效地处理时序型数据和分析型数据,这在数据库领域具有显著的...

    时序数据库.docx 数据顺序追加

    总的来说,时序数据库在不断演进,满足日益增长的高性能、低延迟和大规模数据处理需求,为实时监控、预测分析和智能决策提供了强大的支持。随着技术的发展,时序数据库将继续在物联网、金融科技和其他领域发挥关键...

Global site tag (gtag.js) - Google Analytics