摘要: 云数据库HBase版经过4个月的公测,正式商业化上线了,本文介绍了云数据库HBase的前世今生(结尾有彩蛋)。
随着近些年互联网行业的飞速发展,很多业务的数据量都在急剧的增大,传统的RDBMS数据库逐渐撑不住,逐渐出现读写分离策略、分库分表策略。从数据结构上看,非结构化数据的量在不断剧增。总之,从架构搭建、程序调用到后期运维上,数据库的复杂度变的越来越高,且很多中小型的公司,数据规模都达到了数TB、数PB的级别,对数据的吞吐要求也达到了百万QPS,甚至是千万级别。
HBase的起源
在这样的大背景下,HBase出现了,它是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。 HBase是运行在Hadoop上的NoSQL数据库,能够融合key/value存储模式带来实时查询的能力,以及通过MapReduce进行离线处理或者批处理的能力。Hbase能够让用户在大量的数据中查询记录,也可以从中获得综合分析报告。当下较大的一些互联网公司如google、facebook、alibaba在较早就开始探索基于HBase的数据库解决方案。
阿里巴巴集团从2011年开始步入HBase的发展、建设之路,是国内最早应用、研究、发展并回馈开源HBase的团队,也诞生了HBase社区在国内的第一位Committer,成为HBase在中国发展的积极布道者。过去的几年时间,阿里累积向社区回馈了上百个Patch, 在诸多核心模块的功能、稳定性、性能作出积极重大的贡献,成为推动HBase的迅速发展的重要力量之一。
HBase的上云趋势
HBase本身虽然优秀,但是它本身比较复杂,涉及到分布式、数据存储、响应延迟、索引等一系列的知识,虽然它的API比较简单,但是各种组合情况下,畅玩好HBase还是需要一定的功力,在后期的运维上也需要投入大量的精力,并且自建的情况下,各项费用累加导致性价比不高,在这样的背景下,上云逐渐成为了一种趋势。
云数据库HBase的产品优势
本次阿里云重磅推出的云数据库HBase版,其内核是基于开源社区1.1版本之上的深度改造,阿里在较早版本上做的很多优化策略也会渐渐迁移到此版本中。云数据库HBase在正式商业化前,已经在阿里集团内部服务了超过6年,积累了大量的性能、运维等的经验,目前云数据库HBase提供了以下产品优势:
便利运维:
15分内完成部署,全指标监控预警,在线扩容节点、磁盘及修改配置,集群自动更新升级,专家在线坐诊
高性能:
性能提升30%以上,个别scan等性能提升100%+
高可靠性:
多副本机制,副本丢失提前感知检测恢复,提供9个9个数据可靠性
高安全:
提供白名单隔离,支持VPC
低成本:
同比自建成本,云数据库HBase便宜至少20%,后续进行本地盘、云盘、OSS分级别存储后,成本将进一步下降。
云数据库HBase的技术架构
基础资源层:
底层使用了ECS及本地磁盘的架构,保证在低成本的同时又具备高性能
基础软件层:
使用了Ali-JDK及Ali-Linux,背后是源码级团队维护
HBase内核层:
与阿里集团一致的版本,阿里内部所有的性能优化、功能增强在公共云的客户都可以享受到。这些包括但不限于:提升读写性能、增强稳定性、降低磁盘等
运维平台方面:
包括监控报警、配置管理、健康诊断等,易于运维的功能。
云数据库HBase的使用场景
云数据库HBase作为大数据时代的存储,基本解决以下三大类的场景:
平台类:
存放是平台的产品,即其它软件的存储,比如目前很就行的Kylin,阿里内部的日志同步工具TT,图组件Titan等。此类存放的往往平台的数据,有时候往往是无业务含义的,可作为平台的底层存储使用。
用户行为类:
此类主要是面向各个业务系统。这里的用户不仅仅指的人,也包括物,比如物联网。在阿里主要还是人产生的数据,比如:淘宝收藏夹、交易数据、旺旺聊天记录等等。这里使用比较直接,数据直接存放HBase,再读取。难度是需要支持千万级别的并发写访问及读取,需要解决服务质量的问题。
报表类的需求:
比如报表、大屏等,如阿里巴巴的天猫双十一大屏。
云数据库HBase商业化上线福利
作为一款优秀的产品,在正式商业化前,阿里云已经进行了为期4个月的免费公测,共有1307家企业在云上建立了集群进行测试。为感谢公测期间各方提出的产品改进建议及对产品发展的贡献,阿里云决定加大力度将技术红利回馈所有用户,本次云数据库HBase商业化上线初期(8月10号-10月31号),所有产品规格将以**包年68折发售**,公测用户还将免费享受专家服务。
产品选购请戳此处
原文链接:http://click.aliyun.com/m/28316/
相关推荐
阿里云专有云企业版V3.8.1云数据库HBase版技术白皮书 阿里云专有云企业版V3.8.1云数据库HBase版技术白皮书是阿里云发布的一份关于云数据库HBase版的技术白皮书。该白皮书详细介绍了云数据库HBase版的技术架构、应用...
腾讯云数据库HBase在兼容HBase协议的基础上,通过提供自动化部署、集群管理和监控、弹性扩展、高可用性以及数据可靠性保证等特性,简化了用户在使用HBase时的复杂配置和运维工作。 产品优势方面,腾讯云数据库HBase...
阿里云专有云企业版V3.9.0的云数据库HBase版开发指南,是针对阿里云HBase服务的一款详尽的技术文档,旨在帮助开发者和用户更好地理解和使用这款分布式NoSQL数据库。HBase是基于Apache HBase构建的,特别适合处理大...
阿里云专有云企业版V3.6.1的云数据库HBase版是阿里云推出的一款基于Apache HBase的分布式NoSQL数据库服务。这款产品专为处理大规模、高并发、实时查询的应用场景设计,适用于互联网大数据、物联网(IoT)、日志分析、...
阿里云专有云企业版V3.12.0的云数据库HBase版开发指南,是针对企业级用户的详尽参考资料,旨在帮助开发者和管理员更好地理解和利用阿里云的HBase数据库服务。此版本的文档发布于2020年7月2日,包含了最新的功能和...
【阿里云专有云企业版 V3.8.2 云数据库HBase版 技术白皮书】详细解析 云数据库HBase版是阿里云为企业级用户打造的一款基于Apache HBase的分布式列式数据库服务。它具备高可用性、高性能、线性扩展和大数据存储能力...
阿里云专有云企业版V3.9.0的云数据库HBase版技术白皮书主要介绍了这款基于HBase的分布式数据库服务的核心特性和应用场景。HBase是一款针对大规模数据存储和实时查询设计的NoSQL数据库,特别适用于处理海量半结构化和...
阿里云专有云企业版V3.9.0的云数据库HBase版是一款为企业级用户设计的高可用、高性能、大规模分布式存储系统,基于Apache HBase进行优化,旨在满足大数据场景下的实时在线分析需求。这款产品是专为处理海量结构化和...
阿里云专有云企业版V3.8.2云数据库HBase版的安全白皮书主要聚焦于云数据库HBase在安全方面的设计与保障措施。HBase作为一种分布式、高性能的列式存储系统,常用于处理大规模数据,其安全性对于企业用户来说至关重要...
阿里云专有云企业版V3.6.2的云数据库HBase版运维指南主要针对的是企业级用户,提供了一套详细的管理和维护阿里云HBase服务的指导。HBase是一种分布式、面向列的NoSQL数据库,特别适合处理大规模数据。在运维过程中,...
阿里云专有云企业版V3.8.0的云数据库HBase运维指南是一份针对企业用户的重要参考资料,旨在帮助用户高效、安全地管理和维护HBase数据库实例。这份文档适用于那些在阿里云专有云环境下运行HBase数据库的用户,提供了...
阿里云专有云企业版V3.8.0的云数据库HBase用户指南是一份详细介绍如何使用阿里云HBase服务的文档。HBase是基于Apache HBase构建的分布式列存储数据库,特别适合处理大规模结构化数据。以下是针对该指南的一些关键...
阿里云专有云企业版V3.7.1的云数据库HBase技术白皮书是针对阿里云HBase服务的一份详细技术文档,旨在提供关于该服务的核心特性和使用指导。HBase是一款基于Apache HBase的分布式列式存储系统,特别适合处理大规模...
阿里云专有云企业版V3.7.0的云数据库HBase是一款基于Apache HBase的分布式NoSQL数据库服务,专为企业级应用设计。这款产品提供了高可用性、高性能、大规模存储和处理能力,适用于海量结构化和半结构化数据的场景。 ...
阿里云专有云企业版V3.7.1云数据库HBase运维指南是针对使用阿里云HBase服务的企业用户的一份详尽文档,旨在帮助用户更好地管理和维护他们的HBase数据库实例。这份文档适用于2019年1月24日的产品版本,包含了法律声明...
腾讯云-云数据库对Hbase的独家介绍,介绍腾讯云HBase的使用。 腾讯云-云数据库对Hbase的独家介绍,介绍腾讯云HBase的使用。 腾讯云-云数据库对Hbase的独家介绍,介绍腾讯云HBase的使用。
云数据库HBase作为一款为大数据而生的非关系型数据库,目前广泛应用于互联网企业中,存储着大量用户和业务数据。随着业务的发展,企业对数据的安全性、稳定性提出了更高的要求,因此在HBase的基础上进行了企业级的...
【分布式数据库HBase安装配置与实践】 HBase是一款基于Google Bigtable理念设计的开源NoSQL数据库,它构建在Hadoop之上,适用于处理大规模数据。在本文档中,我们将详细介绍如何在Linux环境中安装、配置和实践HBase...
"分布式数据库HBase" HBase 是一个分布式的、面向列的开源数据库,源于 Google 的一篇论文《BigTable:一个结构化数据的分布式存储系统》。HBase 以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇...
便于学习nosql,hbase的PPT,学习好材料。