`
liangyan9966
  • 浏览: 41010 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储

阅读更多
前言
时间回到2011年,Hadoop作为新生事物,在阿里巴巴已经玩得风生水起,上千台规模的”云梯”是当时国内名声显赫的计算平台。

这一年,Hadoop的好兄弟HBase由毕玄大师带入淘宝,开启了它的阿里之旅。从最初的淘宝历史交易记录,到去年的支付宝消费记录存储在线历史存储统一;从蚂蚁安全风控的多年存储演进,到HBase、TT、Galaxy的大数据激情迭代;HBase在阿里经历过年轻的苦涩,释放过青春的活力,也付出过成长的代价。几代人的不懈努力下,五年陈的HBase开始表现出更成熟、更完善、更丰富的一面,成为公司内部被广泛使用的存储产品之一。

经过阿里集团内部的锤炼,集团将这个技术红利输送给广大阿里云客户。现已推出云数据库HBase产品,支持海量的PB级的大数据存储,适用于高吞吐的随机读写的场景。

本篇会系统性的阐述HBase的定位、建设思路,其中相关内容可能并未深入展开,后续会有专项介绍,请大家随时关注阿里技术相关文章。

概述
HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase最初是以Hadoop子项目的形式进行开发建设,直到2010年5月才正式成为Apache的顶级项目独立发展。伴随着互联网时代数据的澎湃增长,HBase作为基础存储系统得到了快速发展与应用,大批知名商业公司(Facebook、Yahoo、阿里等)不自主地加入到了HBase生态建设队伍,成为Apache最活跃的社区之一。

HBase的能力特点,可以简单概括为下表,基于这些能力,其被广泛应用于海量结构化数据在线访问、大数据实时计算、大对象存储等领域。

全文连接http://click.aliyun.com/m/23744/
分享到:
评论

相关推荐

    藏经阁-大数据时代的存储 ——HBase的实践与探索.pdf

    大数据时代的存储 - HBase 的实践与探索 大数据时代的存储面临着巨大的挑战,包括数据的高速增长、实时性要求、数据的多样性和快速增长等。为了解决这些挑战,需要一种高效、可靠、可扩展的存储系统,HBase 正是...

    藏经阁-大数据时代数据库-云HBase架构生态及实践.pdf

    "大数据时代数据库-云HBase架构生态及实践" 在大数据时代,数据库面临着巨大的挑战,如何解决这些挑战成为数据库架构师和开发者需要解决的问题。本文将从云HBase架构生态及实践角度,讨论大数据时代数据库的挑战和...

    大数据实验三-HBase编程实践

    HBase为结构化数据提供了一个高性能、可伸缩的存储解决方案。它支持海量数据的随机读写操作,并且能够处理PB级别的数据量。HBase的核心设计原则之一是提供高吞吐量的数据访问能力,使其特别适合于实时数据查询场景。...

    大数据开发之Hbase基本使用及存储设计实战教程(视频+笔记+代码)

    │ Day15[Hbase 基本使用及存储设计].pdf │ ├─02_视频 │ Day1501_Hbase的介绍及其发展.mp4 │ Day1502_Hbase中的特殊概念.mp4 │ Day1503_Hbase与MYSQL的存储比较.mp4 │ Day1504_Hbase部署环境准备.mp4 │ Day...

    大数据技术基础实验报告-HBase安装配置和应用实践.doc

    【大数据技术基础实验报告-HBase安装配置和应用实践】 这篇实验报告主要涵盖了HBase的安装、配置以及基本应用,这是大数据技术中一个重要的组件,它是一个分布式的、面向列的数据库,尤其适合处理大规模的数据。 1...

    大数据Hbase 的学习笔记

    自己在大数据培训班学习整理的笔记,比较详细,适合新手学习,我感觉还是挺有帮助的,希望可以帮助到你

    大数据技术分享 Hadoop技术分享 阿里HBase在搜索领域的设计与实践 共28页.pdf

    总结来说,阿里HBase在搜索领域的设计与实践展示了如何利用大数据技术处理大规模搜索任务。通过结合Hadoop的分布式存储与HBase的高性能NoSQL特性,可以构建出强大且灵活的搜索引擎,满足高并发、实时性的需求。这一...

    大数据概论:大数据与大数据时代ppt.pptx

    此外,还有Spark、Flink等实时处理框架,以及NoSQL数据库如HBase、Cassandra用于存储大规模非结构化数据。 四、大数据的应用 大数据在各个行业都有广泛的应用。在商业智能中,大数据分析帮助企业理解市场趋势、...

    HBase大数据.zip

    《HBase大数据》压缩包包含了对HBase这一分布式大数据存储系统的深入探讨,是学习和理解HBase的重要资源。HBase,作为Apache软件基金会的一个顶级项目,是构建在Hadoop文件系统(HDFS)之上的非关系型数据库,专门...

    (完整)数据中台之结构化大数据存储设计.docx

    6. **结构化大数据存储**:如HBase、阿里云Tablestore,支持高吞吐写入和大规模数据存储,适合在线查询和历史数据归档。 7. **批量计算**:如Hadoop MapReduce、Spark,进行大规模离线数据分析。 8. **流计算**:...

    大数据时代云数据库HBase架构.pptx

    在大数据时代,云数据库HBase因其强大的架构创新和技术特性,成为了应对海量非结构化数据挑战的重要解决方案。HBase是一种分布式的、基于列族的NoSQL数据库,它在大规模数据存储和高并发处理方面展现出了卓越的能力...

    大数据时代存储解决方案.ppt

    大数据时代存储解决方案主要聚焦在如何应对大数据带来的技术挑战和变革,以及如何构建适应不同行业的应用场景。随着数据量的剧增,传统的存储和处理方式已经无法满足需求,这催生了大数据技术的发展。 首先,大数据...

    云计算下非结构化大数据存储系统设计.pdf

    本文将介绍一种基于HBase的非结构化大数据存储系统的设计方案,以期达到优化存储、降低成本和提高效率的目的。 首先,云计算下的非结构化大数据存储系统面临的主要问题在于其复杂性和高昂的成本。传统的存储系统...

    使用HBase构建大数据生态.pdf

    CTBase设计动机在于,大多数客户需求是结构化数据存储,需要HBase的二级索引功能,期望新应用能带来HBase二级开发的新需求,同时简单跨表连接查询很常见,一些客户场景也需要全文索引。 CTBase的特点包括: 1. 集群...

Global site tag (gtag.js) - Google Analytics