`
猫耳呀
  • 浏览: 165765 次
社区版块
存档分类
最新评论

车纷享:基于阿里云HBase构建车联网平台实践

阅读更多
摘要: 1. 业务介绍 车纷享是国内首家进行汽车共享开发和运营的公司。旗下共享汽车平台采用新能源汽车作为运营工具以B2C+C2C汽车共享作为商业运营模式采用车联网技术作为运营管理技术目前已与国内多个城市建立合作。

1. 业务介绍

车纷享是国内首家进行汽车共享开发和运营的公司。旗下共享汽车平台采用新能源汽车作为运营工具,以B2C+C2C汽车共享作为商业运营模式,采用车联网技术作为运营管理技术,目前已与国内多个城市建立合作。

公司打造会员制的分时自助租赁平台“车纷享”与“众车纷享”,以及纯电动新能源汽车分时租赁平台“彩虹车”,向会员提供以分钟加里程为计费单位的自助租车服务。通过公司自助租车系统,用户可以进行车辆预定、费用支付、自助取车、还车及自动结算等,无需人工干预,非常简单,真正实现了家门口或公司门口的自助租车,便捷、时尚、经济。 公司汽车共享(分时自助、智能租车)系统为自主研发,具有完全自主知识产权,能够根据需求进行改进和定制,是国内第一个成功商业运营的汽车共享系统,处于国内领先。

2. 选型

对于车纷享这种初创公司来说,技术选型首要考虑的是:轻运维,业务快速落地。自建机房以及运维团队意味着前期较大的投入以及高昂的运维成本,随着业务规模的扩张,资源水平扩展以及垂直扩展也是未来无法避免的痛点。

技术团队进行了多次内部讨论,同时对类似行业公司的解决方案进行了详细调研,新方案必须满足我们以下的基本需求:

(1)支持大量IoT数据的不间断写入,至少能存放百T以内的数据,随着数据规模的增长,能够方便的进行垂直和水平扩展。

(2)支持基于时间戳的历史数据查询,响应时间至少达到秒级,后期根据业务需要,支持对一些关键字段进行索引,以满足某些查询场景

(3)与目前的大数据生态产品(MapReduce,Spark,Hive)能友好兼容,支持离线和准实时OLAP

(4)优先选择有雄厚实力的商业公司支持的云平台,最大限度减少运维成本。

最终我们技术团队选择的是阿里云平台,阿里是国内大数据领域技术最雄厚的公司,比如HBase,阿里拥有2 HBase PMC、3 Committer、数十位内核贡献者,贡献200+ Patch,同时阿里云平台提供了多种方便易上手的数据产品工具。

3. 车纷享数据中心

车纷享的数据来自于车载终端上传的数据报文,首先经过系统平台的网关,然后借助规则引擎对数据报文进行解析拆分成有意义的数据项,以数据记录的方式放入消息队列,消息队列采用了阿里的MQ,消息队列的消费程序,会将消费到的数据分别存入Redis以及HBase,其中Redis是用来提供车辆实时状态的查询,HBase提供车辆历史数据的查询,为了对历史数据进行灾备处理,使用了阿里云的OSS存储,将备份数据日志文件按照时间分区存储至OSS。


3.1 项目背景

车联网符合并发量大,数据上传频率高,写多读少的高吞吐型业务场景,对查询要求也接近准实时;原有的关系数据库已经不能满足我们的业务需要,尤其数亿量级下的分页查询和车辆历史轨迹查询的场景下,关系数据库的读取相应延迟已经达到了数分钟级,完全不能满足客户的需要。阿里云HBase为我们提供了HBase+Phoenix的组合方案。

HBase是基于磁盘的NoSql数据库,因为采用了LSM的数据结构,随机写效率较高,特别适合车联网的数据上传特点,在基于Rowkey方面的查询延时接近准实时。但是因为原生HBase的查询方式比较底层,没有SQL查询接口,对于使用者要求较高,而且没有二级索引,如果不是基于Rowkey查询,查询效率会急剧下降,为了减少客户的使用难度,阿里云HBase团队在HBase集群里集成了Phoenix的交互引擎,

Phoenix的架构

    Phoenix主要给HBase增加了SQL查询以及二级索引支持,大大降低了我们的二次开发难度,也进一步丰富了我们对多种查询场景的支持。
3.2 性能指标

1、系统情况

目前测试集群上有6台服务器,都是16Core 32G的配置

2、查询测试

历史数据表(保密需要,字段适当裁剪):

create table if not exists 车辆历史数据表 (
车辆标识 varchar not null,
上传时间 bigint not null,
行驶里程 float,
发动机温度 float,
车速 float,
发动机转速 float,
油耗 float,
续航里程 float,
电量 float,
充电状态 integer,
卫星数量 integer,
卫星信号强度 integer,
卫星信号 integer,
网络信号强度 integer,
经度 double,
纬度 double,
方向角度 float,
循环模式 integer,
风扇模式 integer,
省电模式 integer,
开关门状态 integer,
发动机状态 integer,
钥匙状态 integer,
灯光状态 integer,
门锁状态 integer,
网络状态 varchar,
档位 integer
CONSTRAINT my_pk PRIMARY KEY (车辆标识,上传时间 ROW_TIMESTAMP))
COMPRESSION=’SNAPPY’,DATA_BLOCK_ENCODING=’FAST_DIFF’,SALT_BUCKETS=20;

3、建立索引表

create index 车辆历史状态索引表 on 车辆历史状态表(车辆标识,上传时间,行驶里程,车速,电量) include (发动机温度,发送机转速,油耗,卫星数量,卫星信号强度,……)

  车辆状态历史表中目前有记录12亿条左右,Region有52个


通过HBase+Phoenix,丰富了我们的历史查询手段,原先的车辆1个月轨迹历史数据回放查询需要5-10分钟,现在2秒内就能返回所需数据。上面的数据都是我们实际的业务场景数据测试的结果,提升了150倍,大大超出我们的期望。


4、集群状况

目前接入的车辆大约为3万辆,其中比较重要的考察指标就是OPS(operation per second 每秒操作次数),主要针对车辆数据的实时不间断写入,目前HBase集群中,平均在1.5K OPS,峰值可以到达2K OPS,目前的集群配置可以支撑最大约400K的OPS,至少可以满足未来2年左右的业务增长需要。阿里云HBase同时支持资源节点水平,垂直扩展和滚动重启,基本可以做到用户无感知下完成升级,这种能力对适应业务的敏捷变化非常有帮助。


3.3 数据处理


场景实例

以网约车管理平台为例,主要数据来源为车况数据和订单数据,进入Kafka后,拉出两个分支,分别存储进HBase数据库和进入Spark Streaming流式计算引擎,主要用来为运营部门优化网点,车辆分流,监控部门的风控管理和商业BI相关的离线分析提供数据支撑。


3.4 使用感受

现在车纷享的车联网数据平台已迁入阿里云HBase团队已经半年多了,平均日写入数据几十G,到现在还没出现数据服务器的严重故障问题,总体比较稳定,大大降低了我司的运营管理成本。阿里云HBase团队也给我们的开发团队提供了有力的技术支撑,碰到技术问题,我们可以非常及时得到响应,帮助我们排除了业务开发中的许多问题。再次证明我们的当初选择是正确的。

同时也希望阿里云HBase团队未来可以在产品易用性上更上一层楼。展望未来,随着业务的扩展,我们的数据会有一个指数级的增长。


希望新的一年继续和阿里云加大合作,同时将运营中的问题反馈到阿里云技术社区,协助阿里云技术团队将数据产品做得越来越好。

原文链接:https://yq.aliyun.com/articles/563203?spm=a2c41.11181499.0.0
分享到:
评论

相关推荐

    实验三:熟悉常用的HBase操作

    Hadoop版本至少需要2.7.1或更高,这是HBase运行的基础,因为HBase构建在Hadoop的HDFS之上,用于存储数据。HBase版本至少为1.1.2,它提供了一套强大的数据管理特性。JDK版本至少1.7,这是运行HBase和相关Java程序的...

    阿里云Hbase PPT

    阿里云HBase是阿里巴巴集团旗下的一款基于Hadoop的开源NoSQL数据库,主要针对大规模数据的实时读写和存储场景,为大数据处理提供高可靠性、高性能、可伸缩和高适应性的在线分布式数据库服务。下面将结合提供的文件...

    HBase专场:阿里云HBase产品体系架构及特性解析(封神).pdf

    HBase on OSS利用阿里云对象存储服务(OSS)作为底层存储,提供了无限的存储空间,可以满足TB、PB级的存储需求。在写吞吐方面,HBase能够高效率地处理数据写入操作,不受固态硬盘(SSD)随机写入放大问题的影响。...

    2.阿里云HBase X-Pack数据存储检索分析平台.pdf

    阿里云*** X-Pack数据存储检索分析平台是基于阿里云大数据技术实现的一个高效、安全、具有广泛适用场景的数据存储与分析解决方案。平台整合了Apache HBase、Phoenix、Spark和Solr等多种技术,支持数据的存储、检索、...

    实验三:熟悉常用的HBase操作.docx.zip

    HBase是一个分布式、版本化的NoSQL数据库,它构建在Hadoop文件系统(HDFS)之上,用于处理大规模数据存储。实验文档可能包含对HBase的基本概念介绍,以及如何进行数据的插入、查询、更新和删除等操作。 【描述解析...

    藏经阁-阿里巴巴研发效能实践日 从持续交付到业务创新.pdf

    阿里云HBase X-Pack是一款基于Apache HBase、Phoenix、Spark的分布式数据存储和检索分析平台,旨在解决大规模数据处理的需求。该平台提供了海量数据的一站式存储、检索与分析能力,广泛应用于风控、推荐、检索、画像...

    数字中国行——阿里云HBase全新X-Pack让NoSQL数据库再上新台阶.pdf

    标题《数字中国行——阿里云HBase全新X-Pack让NoSQL数据库再上新台阶》和描述表明本文档是关于阿里云发布的HBase X-Pack增强包,旨在进一步提升NoSQL数据库HBase的能力,进而推动数字中国在技术上的发展。HBase作为...

    指导手册06:HBase安装部署 hbase配置文件

    指导手册06:HBase安装部署 hbase配置文件

    阿里云 专有云企业版 V3.8.0 云数据库 HBase 用户指南 20190621.pdf

    阿里云专有云企业版V3.8.0的云数据库HBase用户指南是一份详细介绍如何使用阿里云HBase服务的文档。HBase是基于Apache HBase构建的分布式列存储数据库,特别适合处理大规模结构化数据。以下是针对该指南的一些关键...

    ⼤数据时代数据库-云HBase架构&⽣态&实践_阿里云.zip

    1. 分布式存储:云HBase基于Hadoop的HDFS(Hadoop Distributed File System)进行数据存储,确保了数据的高可用性和容错性。它通过Region Server将数据分散到多台服务器上,实现了水平扩展。 2. 表和Region:HBase...

    最佳实践:Flink 流式导入 HBase.pdf

    《最佳实践:Flink流式导入HBase》 在大数据处理领域,Apache Flink和Apache HBase是两个不可或缺的重要组件。Flink作为一个强大的流处理框架,以其低延迟、高吞吐量以及支持状态管理和事件时间窗口等特性,在实时...

    藏经阁-阿里云HBase备份恢复的原理以及实践-15.pdf

    【阿里云HBase备份恢复的原理以及实践】 阿里云HBase是一种分布式、高性能的NoSQL数据库,基于Apache HBase并提供了全面的企业级服务。在审计行业中,HBase因其优秀的性能和低成本而被广泛选用。本篇文章主要介绍了...

    基于HBase的车联网传感数据管理系统设计.pdf

    总体来说,基于HBase的车联网传感数据管理系统设计能够有效解决车联网数据的存储和查询需求,提高数据处理效率,降低存储成本。随着车联网技术的持续发展,此类系统将会在未来的智能交通系统中扮演重要角色。

    阿里云 专有云企业版 V3.8.2 云数据库HBase版 开发指南 20200416.pdf

    阿里云专有云企业版V3.8.2的云数据库HBase版开发指南主要针对的是阿里云的HBase服务,这是一个分布式、高吞吐量、面向列的NoSQL数据库,特别适合处理大规模数据。HBase是构建在Hadoop之上的,提供了实时的数据访问和...

    阿里云 专有云企业版 V3.7.1 云数据库 HBase 技术白皮书 20190124.pdf

    阿里云专有云企业版V3.7.1的云数据库HBase技术白皮书是针对阿里云HBase服务的一份详细技术文档,旨在提供关于该服务的核心特性和使用指导。HBase是一款基于Apache HBase的分布式列式存储系统,特别适合处理大规模...

    HOS:一种基于HBase的分布式存储系统设计与实现.pdf

    本篇论文介绍了一种名为HOS的分布式存储系统的设计与实现,该系统基于HBase构建。随着大数据时代的到来,数据量的增长速度前所未有,为了有效存储和管理这些数据,迫切需要创新的存储方案。HBase作为一个分布式、列...

    基于springboot集成hbase过程解析

    * spring-data-hadoop-hbase:提供了HBase的依赖项,版本号为2.5.0.RELEASE。 * hbase-client:提供了HBase的客户端依赖项,版本号为1.1.2。 * spring-data-hadoop:提供了Hadoop的依赖项,版本号为2.5.0.RELEASE。 ...

    阿里云 专有云企业版 V3.8.1 云数据库HBase版 产品简介 20190910

    阿里云专有云企业版 V3.8.1 云数据库HBase版是基于 Apache HBase 开发的云数据库产品,提供了高性能、可扩展、可靠的 NoSQL 数据库解决方案。本产品简介将对云数据库HBase版的产品概况、产品优势、产品架构、应用...

Global site tag (gtag.js) - Google Analytics