- 浏览: 87936 次
- 性别:
- 来自: 广州
文章分类
- 全部博客 (110)
- myeclipse JVM 虚拟机内存设置 (1)
- 查询含有clob字段表的sql语句 (1)
- 项目个人价值体现 (1)
- Java多线程并发编程 (1)
- spring (4)
- 启悟 (1)
- hadoop (27)
- mysql数据库乱码问题 (1)
- linux (6)
- 架构与设计 (1)
- java (6)
- mysql (2)
- 分页编程 (1)
- 励志 (2)
- 技术要求 (0)
- guava (1)
- 分布式开发(SOA) (4)
- 微服务架构 + API 网关 (5)
- 消息中间件 (4)
- Dubbo (8)
- 面谈 (0)
- 高并发架构 (1)
- maven (1)
- MongoDB (1)
- hbase (2)
最新评论
Hbase课程大纲
学习内容:
Hbase系统搭建与部署,Hbase shell操作;
客户端API操作,包括put、get、delete方法以及批量处理操作与客户端缓存,HTable类与Bytes类的使用;
比较过滤器、专用过滤器、附加过滤器、自定义过滤器的使用
计数器的使用,协处理器(coprocessor类、regionobserver类、masterobserver类、endpoint)的使用
HTablePool类的使用
实战:搭建Hbase集群;使用Hbase shell进行表的操作;利用Hbase API编写客户端工具操作Hbase集群
收获内容:
熟练掌握Hbase集群的搭建,能够利用Hbase shell对数据进行操作与查询;
熟练使用客户端API,了解过滤器、计数器、协处理器以及HTablePool的使用
第二周:客户端API的管理功能、MapReduce系统集成
学习内容:
利用HbaseAdmin类进行Hbase表的管理,包括表、属性、列的操作;
MapReduce集成,编写Mapreduce程序实现对HBase表的select,多表join,聚合操作,sort等功能
实战:通过利用Mapreduce实现数据的查询、聚合、连接等操作
收获内容:
掌握基于Hbase的Mapreduce程序编写,实现对表的操作
第三周:HBase系统架构原理
主要介绍:
Hbase中数据的查找与传输,数据结构B+树、LSM树介绍;
数据存储格式HFile格式、KeyValue格式;
WAL机制,HLog类、HLogKey类、WALEdit类、LogSyncer类、回放与持久性;
region、-root-表的查找;
LogEdit的生命周期与内部机制;
Coprocessor实现;
二级索引HIndex原理
实战:自定义Coprocessor的实现;HIndex的使用
收获内容:
了解WAL机制
Coprocessor的内部实现
二级索引HIndex的实现原理
第四周:HBase高级用法
主要介绍:
Hbase表的行键设计,高表与宽表、部分键扫描、分页、时间序列、时间顺序关系;
高级模式;
辅助索引;
搜索集成;
事务;
BloomFilter布隆过滤器;
隐式版本控制与自定义版本控制
实战:Hbase表的行健设计
收获内容:
Hbase的高级用法,Hbase行健设计的一般方法与各自的特点
第五周:HBase系统集成与案例实战
主要介绍:
利用hbase、Solr和Solr-IndexBuilder,设计与实现一个在线Hbase数据存储与实时查询系统,构建基于Hbase的SQL查询系统
实战:设计与开发一套数据存储与实时查询系统
收获内容:
从系统设计、开发、集成的角度,掌握Hbase的各项操作与性能优化方案,构建自己的实时查询系统
学习内容:
Hbase系统搭建与部署,Hbase shell操作;
客户端API操作,包括put、get、delete方法以及批量处理操作与客户端缓存,HTable类与Bytes类的使用;
比较过滤器、专用过滤器、附加过滤器、自定义过滤器的使用
计数器的使用,协处理器(coprocessor类、regionobserver类、masterobserver类、endpoint)的使用
HTablePool类的使用
实战:搭建Hbase集群;使用Hbase shell进行表的操作;利用Hbase API编写客户端工具操作Hbase集群
收获内容:
熟练掌握Hbase集群的搭建,能够利用Hbase shell对数据进行操作与查询;
熟练使用客户端API,了解过滤器、计数器、协处理器以及HTablePool的使用
第二周:客户端API的管理功能、MapReduce系统集成
学习内容:
利用HbaseAdmin类进行Hbase表的管理,包括表、属性、列的操作;
MapReduce集成,编写Mapreduce程序实现对HBase表的select,多表join,聚合操作,sort等功能
实战:通过利用Mapreduce实现数据的查询、聚合、连接等操作
收获内容:
掌握基于Hbase的Mapreduce程序编写,实现对表的操作
第三周:HBase系统架构原理
主要介绍:
Hbase中数据的查找与传输,数据结构B+树、LSM树介绍;
数据存储格式HFile格式、KeyValue格式;
WAL机制,HLog类、HLogKey类、WALEdit类、LogSyncer类、回放与持久性;
region、-root-表的查找;
LogEdit的生命周期与内部机制;
Coprocessor实现;
二级索引HIndex原理
实战:自定义Coprocessor的实现;HIndex的使用
收获内容:
了解WAL机制
Coprocessor的内部实现
二级索引HIndex的实现原理
第四周:HBase高级用法
主要介绍:
Hbase表的行键设计,高表与宽表、部分键扫描、分页、时间序列、时间顺序关系;
高级模式;
辅助索引;
搜索集成;
事务;
BloomFilter布隆过滤器;
隐式版本控制与自定义版本控制
实战:Hbase表的行健设计
收获内容:
Hbase的高级用法,Hbase行健设计的一般方法与各自的特点
第五周:HBase系统集成与案例实战
主要介绍:
利用hbase、Solr和Solr-IndexBuilder,设计与实现一个在线Hbase数据存储与实时查询系统,构建基于Hbase的SQL查询系统
实战:设计与开发一套数据存储与实时查询系统
收获内容:
从系统设计、开发、集成的角度,掌握Hbase的各项操作与性能优化方案,构建自己的实时查询系统
发表评论
-
MapReduce程序开发(good)
2016-09-06 18:25 278http://blog.csdn.net/qq10108856 ... -
ZooKeeper典型应用场景一览
2016-07-08 16:17 412ZooKeeper典型应用场景一览 摘自:http://www ... -
Apache HBase 2015年发展回顾与未来展望
2016-02-05 10:00 431摘自: http://mp.weixin.qq.com/s? ... -
搜索技术博客-淘宝
2015-12-10 18:33 471搜索技术博客-淘宝: http://www.searcht ... -
大数据性能调优之HBase的RowKey设计
2015-11-12 13:47 383摘自;http://www.open-open.com ... -
HBase处理中文字符串
2015-11-12 13:44 721摘自:http://blog.csdn.net/piratel ... -
详细的讲解yarn和mapreduce的内存配置
2015-11-03 17:00 388摘自: http://docs.hortonworks.co ... -
Hadoop YARN常见问题以及解决方案 任务合理调度分配
2015-11-03 14:46 1160摘自: http://dongxicheng.org/map ... -
Windows下使用Hadoop2.6.0-eclipse-plugin插件
2015-10-29 15:43 372Windows下使用Hadoop2.6.0-eclipse-p ... -
HBase优化案例分析:Facebook Messages系统问题与解决方案
2015-10-21 18:58 447摘自:http://www.infoq.com/cn/arti ... -
HBase总结(十二)Java API 与HBase交互实例
2015-10-21 18:57 422import java.io.IOException; im ... -
NoSQL选型及HBase案例详解(hbase结合情景案例分析)
2015-10-21 18:55 519摘自:http://www.thebigdata.cn/Jie ... -
基于HBase的海量微博数据高效存储解析
2015-10-20 17:15 795通过分析HBase的特点, ... -
Hadoop 2.0+YARN启动脚本分析与实战经验
2015-10-16 23:38 597start-all.sh脚本现在已经废弃,推荐使用start- ... -
windows7+eclipse+hadoop2.5.2环境配置
2015-10-11 23:45 367http://www.dataguru.cn/thread-4 ... -
YARN ResourceManager调度器的分析
2015-10-11 23:39 350摘自:http://blogread.cn/it/articl ... -
Hadoop 新 MapReduce 框架 Yarn 详解
2015-10-11 23:08 526摘自:http://www.open-open.c ... -
yarn 启动时,nodemanager 成功,但是resourcemanager失败解决
2015-10-11 22:19 10497问题的描述; yarn 启动时,nodemanager 成功, ... -
hbase常识及habse适合什么场景
2015-09-18 14:15 378http://blog.csdn.net/lifuxiangc ... -
HBase案例设计分析
2015-09-18 14:03 434http://www.thebigdata.cn/JieJue ...
相关推荐
Hbase从入门到进阶的全部视频,主要内容: 1、HBase的安装、目录结构以及启动 2、Hbase原理、运维、API、数据迁移备份 3、Hbase架构解析 4、Hbase实例 5、源码获取编译与分析 等等
HBase的原理及核心知识大纲脑图
### HBase 学习知识点详解 #### 一、HBase 概述 HBase 是一个分布式、可扩展的大规模数据存储系统,它基于 Google 的 BigTable 模型设计并实现。作为一个非关系型数据库(NoSQL),HBase 提供了高可靠性和高性能的...
**HBase简介** ...通过深入学习和实践,你可以掌握HBase的基本操作,进一步了解其在大数据场景下的应用,如实时数据分析、日志存储等。HBase的灵活性和扩展性使其成为处理大规模结构化稀疏数据的首选工具之一。
**HBase学习总结** HBase,全称是Apache HBase,是一个分布式的、面向列的开源数据库,它是基于Google的Bigtable模型构建的,专为处理海量数据而设计。HBase是Apache Hadoop生态系统的一部分,它运行在Hadoop分布式...
### HBase学习利器:HBase实战 #### 一、HBase简介与背景 HBase是Apache Hadoop生态系统中的一个分布式、可扩展的列族数据库,它提供了类似Bigtable的能力,能够在大规模数据集上进行随机读写操作。HBase是基于...
本文首先简单介绍了HBase,然后重点讲述了HBase的高并发和实时处理数据 、HBase数据模型、HBase物理存储、HBase系统架构,HBase调优、HBase Shell访问等。
在IT行业中,尤其是在大数据处理领域,HBase是一个广泛使用的分布式、高性能、列式存储的NoSQL数据库。HBase是建立在Hadoop文件系统(HDFS)之上,为处理大规模数据提供了一个高效的数据存储解决方案。而Spring Data...
HBase的学习和使用需要对Hadoop生态系统有所了解,因为HBase与Hadoop的其他组件紧密集成,尤其是HDFS和Zookeeper。对于希望构建大规模、可扩展的分布式系统的技术人员来说,掌握HBase是实现这一目标的关键技能之一。
自己在大数据培训班学习整理的笔记,比较详细,适合新手学习,我感觉还是挺有帮助的,希望可以帮助到你
《HBase学习文档》 HBase,全称为Apache HBase,是构建在Hadoop文件系统(HDFS)之上的分布式列式数据库,是大数据领域的重要组件。它为海量数据提供了实时、高性能的读写能力,尤其适用于处理半结构化或非结构化的...
- 在线课程:许多在线教育平台提供HBase的培训课程,包括基础概念、实战操作等。 - 开源社区:参与HBase社区,了解最新动态,解决问题。 通过深入学习HBase,你可以掌握如何在大数据环境中构建高性能的实时数据...
学习HBase,可以从《HBase权威指南》和《HBase实战》这两本书入手,它们分别深入探讨了HBase的设计原理、使用方法以及最佳实践,是理解并掌握HBase的重要资源。通过阅读这些书籍,你可以全面了解HBase的核心特性和...
这是我学了hbase之后整理的一些简单清晰的内容关于hbase的,hbase速成方法
Hbase学习总结,很不错的资源,对你绝对有帮助
HBASE的主要原理解读:包括HBase 读写逻辑、HBase region拆分和合并
【HBase 学习】 HBase 是一个分布式、列式存储的开源数据库,基于 Google BigTable 的设计理念,专为处理大规模结构化和半结构化数据而设计。它运行在 HDFS(Hadoop 分布式文件系统)之上,提供高可靠性和高性能的...
标题“自己学习HBase”表明本文是一份自学HBase(一个开源的非关系型分布式数据库)的开发文档。HBase是建立在Hadoop之上的,使用Google BigTable的数据模型,它是Apache Software Foundation的Hadoop项目的一部分,...
【HBase数据库设计】 HBase是一种基于列存储的分布式数据库,它是Apache Hadoop生态系统的一部分,设计用于处理海量数据。HBase的主要特征包括: 1. **分布式存储**:HBase构建在Hadoop的HDFS(Hadoop Distributed...