一、Hadoop入门,了解什么是Hadoop
1、Hadoop产生背景
2、Hadoop在大数据、云计算中的位置和关系
3、国内外Hadoop应用案例介绍
4、国内Hadoop的就业情况分析及课程大纲介绍
5、分布式系统概述
6、Hadoop生态圈以及各组成部分的简介
7、Hadoop核心MapReduce例子说明
二、分布式文件系统HDFS,是数据库管理员的基础课程
1、分布式文件系统HDFS简介
2、HDFS的系统组成介绍
3、HDFS的组成部分详解
4、副本存放策略及路由规则
5、NameNode Federation
6、命令行接口
7、Java接口
8、客户端与HDFS的数据流讲解
9、HDFS的可用性(HA)
三、初级MapReduce,成为Hadoop开发人员的基础课程
1、如何理解map、reduce计算模型
2、剖析伪分布式下MapReduce作业的执行过程
3、Yarn模型
4、序列化
5、MapReduce的类型与格式
6、MapReduce开发环境搭建
7、MapReduce应用开发
8、更多示例讲解,熟悉MapReduce算法原理
四、高级MapReduce,高级Hadoop开发人员的关键课程
1、使用压缩分隔减少输入规模
2、利用Combiner减少中间数据
3、编写Partitioner优化负载均衡
4、如何自定义排序规则
5、如何自定义分组规则
6、MapReduce优化
7、编程实战
五、Hadoop集群与管理,是数据库管理员的高级课程
1、Hadoop集群的搭建
2、Hadoop集群的监控
3、Hadoop集群的管理
4、集群下运行MapReduce程序
六、ZooKeeper基础知识,构建分布式系统的基础框架
1、ZooKeeper体现结构
2、ZooKeeper集群的安装
3、操作ZooKeeper
七、HBase基础知识,面向列的实时分布式数据库
1、HBase定义
2、HBase与RDBMS的对比
3、数据模型
4、系统架构
5、HBase上的MapReduce
6、表的设计
八、HBase集群及其管理
1、集群的搭建过程讲解
2、集群的监控
3、集群的管理
九、HBase客户端
1、HBase Shell以及演示
2、Java客户端以及代码演示
十、Pig基础知识,进行Hadoop计算的另一种框架
1、Pig概述
2、安装Pig
3、使用Pig完成手机流量统计业务
十一、Hive,使用SQL进行计算的Hadoop框架
1、数据仓库基础知识
2、Hive定义
3、Hive体系结构简介
4、Hive集群
5、客户端简介
6、HiveQL定义
7、HiveQL与SQL的比较
8、数据类型
9、表与表分区概念
10、表的操作与CLI客户端演示
11、数据导入与CLI客户端演示
12、查询数据与CLI客户端演示
13、数据的连接与CLI客户端演示
14、用户自定义函数(UDF)的开发与演示
十二、Sqoop,Hadoop与rdbms进行数据转换的框架
1、配置Sqoop
2、使用Sqoop把数据从MySQL导入到HDFS中
3、使用Sqoop把数据从HDFS导出到MySQL中
十三、Storm
1、Storm基础知识:包括Storm的基本概念和Storm应用
场景,体系结构与基本原理,Storm和Hadoop的对比
2、Storm集群搭建:详细讲述Storm集群的安装和安装时常见问题
3、Storm组件介绍: spout、bolt、stream groupings等
4、Storm消息可靠性:消息失败的重发
5、Hadoop 2.0和Storm的整合:Storm on YARN
6、Storm编程实战
- 浏览: 189667 次
最新评论
-
guooo:
老乡兄弟有感而发啊
一点感悟(一) 初识 -
a3x60:
真不错!!!
Java 生成随机数 -
qindongliang1922:
支持河南老乡
一点感悟(一) 初识 -
InJavaWeTrust:
加油
一点感悟(一) 初识 -
感受微风:
city_moon 写道ID如果不是数字类型的呢?比如是UUI ...
mysql 删除重复数据只保留一条
相关推荐
大数据学习路线图权威指导,立马收藏吧,一图就够了,
在这个"大数据学习路线知识图谱.zip"压缩包中,我们主要关注的是大数据的核心技术,包括Hadoop、Spark以及流式计算。下面将详细阐述这三个领域的关键知识点。 首先,Hadoop是Apache基金会开源的一个分布式计算框架...
2016年6月1日 - 作为一门对数学和计算机都有较高要求的一门交叉学科,从事大数据是有一定门槛的,但相对于10年以上的职业生涯(国外顶尖数据科学家50-60岁仍然十分活跃)...
分享大数据学习路线作战地图
传智播客电商大数据学习路线1
大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 包括Hadoop、Hive、Spark、Storm、Flink、HBase、Kafka、Zookeeper、Flume、Sqoop等技术的学习 Hadoop 分布式文件存储系统 —— HDFS 分布式计算框架 ...
全新大数据学习路线图
大数据学习路线图,可以系统的了解所有的大数据技术栈,补齐自己的不足,了解目前大数据技术栈的范围。
大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分散文件存储系统 —— HDFS 多元计算框架——MapReduce 集群资源管理器 —— YARN Hadoop单机伪集群环境搭建 Hadoop 云服务环境搭建 HDFS...
内容概要:本文为初学者提供了一份详尽的大数据学习路线,涵盖了从基础知识到高级技术的全面指南。文章以幽默风趣的语言风格,带领读者逐步掌握编程语言、数据库知识、数据处理工具、数据分析方法、项目实践等关键...
首先,大数据学习的起点通常是**大数据采集与迁移**。这一环节涵盖了多种工具,如Apache Nifi用于数据流的自动化处理,Flume用于日志收集,以及Spark Streaming或Kafka用于实时数据摄取。了解这些工具的工作原理和...
大数据学习路线-全面/细致
大数据学习路线+知识点大梳理
完整的大数据知识体系,大数据学习路线图 大数据知识体系是指在大数据领域中,对于各种技术的总结和整理,包括数据存储、数据处理、数据分析、机器学习等方面的知识。根据大数据学习路线图,我们可以将大数据知识...
大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线大数据方向学习路线...
**大数据学习路线** 1. **JavaSE** 和 **JavaEE核心** 的内容与Java学习路线相同。 2. **Hadoop生态体系**: - **Hadoop**:分布式存储和计算框架,解决大数据处理问题。 - **Zookeeper**:分布式服务管理,...
2020最新大数据学习路线图.jpg
2019年最新出来的大数据学习路线图,以及需要掌握的详细知识点
2018最新最全大数据学习路线图,知名专业IT培训机构尚硅谷内部资料。