基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
网盘地址1:https://pan.baidu.com/s/1jJXzcfs 密码: ty5g
网盘地址2:https://pan.baidu.com/s/1dpGaIy 密码: wmxh
备用地址(腾讯微云):http://url.cn/5K6k3Ks 密码:a0DNoQ
课程内容简介:
本课程分两大部分:
第一部分全面深入地介绍了Greenplum数据库,包括架构特性、部署、管理、开发和调优等,由浅入深
,理论结合实战,让同学全面彻底掌握这把大数据利剑。
第二部分深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、
Chukwa等实战运用。另外还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在
各个互联网巨头商业环境的运用。
【上集】 Greenplum 分布式数据库基础(41课时)
1 Greenplum架构
什么是Greenplum
Greenplum体系结构
Greenplum高可用性架构
2 安装Greenplum
配置环境
安装并初始化GPDB系统
启停数据库
配置GP系统
3 分布式数据库存储
数据是如何存储的
分布策略
4 GBDB查询处理
查询命令的执行
SQL查询处理机制
并行查询计划
5 角色权限及客户端认证管理
客户端认证
管理用户和组
6 客户端接口和程序
pgAdmin III
PSQL
7 定义数据库对象
创建并管理数据库
创建并管理表空间
创建并管理模式
创建并管理表
分区表
数据分布与分区
压缩存储与行列存储
序列、索引与视图
8 管理数据
插入、更新、删除记录
事务管理
空间回收和统计
9 查询数据
定义查询
使用函数和运算符
查询分析
10 工作负载及资源管理
GP工作负载管理概述
配置工作负载管理
创建资源队列
分配资源队列
检查资源队列状态
11 装载和卸载数据
GP装载命令概述
装载数据到GP
从GP卸载数据
格式化数据文件
12 备份恢复
串行备份和恢复
并行恢复和恢复
13 性能调优
如何进行调优
常见的性能问题
14 GP系统配置参数
关于GP的Master参数与本地化参数
设置配置参数
配置参数种类
15 开启高可用性
GP高可用概述
开启GP的Mirror
获知Segment何时失败
恢复失败的Segment
恢复失败的Master
16 GP MapReduce
MapReduce基础
GP MapReduce编程
MapReduce作业执行和故障诊断
【下集】 Hadoop分布式平台(55课时)
1 Hadoop的起源和体系
Hadoop思想起源:Google
Hadoop子项目家族
Hadoop的架构
2 Hadoop的安装与配置
准备和配置环境
三种运行模式
完全分布式模式安装
3 HDFS-大数据存储
HDFS概念与体系结构
HDFS的可靠性
HDFS文件操作
HDFS API
4 关于MapReduce
MapReduce编程模型
MapReduce的集群行为
MapReduce任务的优化
MapReduce工作机制
错误处理及作业调度机制
5 MapReduce应用开发
Hadoop Eclipse插件开发
数据筛选程序开发
倒排索引程序开发
6 Hadoop监控与管理
页面监控
hadoop备份
7 HBase数据库
Hbase体系结构
HBase shell
HBase API应用实例
HBase场景应用
HBase模式设计
8 Hive数据仓库
Hive组件与体系架构
Hive安装配置
Hive的服务接口
HiveQL常用操作
Hive的优化
Hive UDF编程
Hive综合实战
9 Pig数据分析平台
Pig框架
Pig安装配置
Pig的使用
Pig的数据模型
常用Pig Latin操作
Pig UDF编程
Pig数据分析实战
10 ZooKeeper分布式服务框架
ZooKeeper工作原理
ZooKeeper设计目标
ZooKeeper的数据结构和组成
ZooKeeper的安装配置
ZooKeeper命令行工具
ZooKeeper API
ZooKeeper实战:Hadoop任务调度
11 Chukwa集群监控系统
Chukwa的组成
Chukwa架构和设计
Chukwa安装与配置
常用Chukwa命令
实现自定义数据处理
12 Hadoop商业应用案例
云计算概念和特征
云计算服务模式和形态
Hadoop在云计算的运用
京东商城
百度
阿里巴巴
腾讯
13 Greenplum Hadoop集群
集成架构的特征
集成架构的优势
配置gphdfs协议使用环境
使用HDFS外部表
分享到:
相关推荐
《Hadoop开发案例:Greenplum Hadoop大数据应用案例剖析》是一门针对高级开发者的Java课程,专注于讲解Greenplum和Hadoop在大数据处理中的应用。课程由经验丰富的讲师迪伦主讲,旨在帮助学员掌握大数据解决方案的...
《Hadoop开发案例:Greenplum Hadoop大数据应用案例剖析》是一份详尽的文档,旨在教授读者如何在Greenplum和Hadoop平台上进行大数据处理。课程覆盖了96个课时,是目前市场上最为全面且深入的Greenplum、Hadoop以及...
hadoop应用开发实例教程之Greenplum架构,由北风网提供,hhadoop应用开发实例教程主要介绍什么是Greenplum;Greenplum体系结构;Greenplum高可用性架构。安装Greenplum:配置环境;安装并初始化GPDB系统;启停数据库...
《Hadoop开发案例Hadoop视频教程-Greenplum Hadoop大数据应用案例剖析》是一门针对高级程序员设计的深度课程,旨在帮助学员掌握大数据处理的核心技术,特别是Greenplum和Hadoop的结合应用。课程由拥有丰富实战经验的...
在大数据领域,分布式平台如Greenplum和Hadoop已经成为存储和处理海量数据的关键技术。本教程将重点关注如何在这样的环境中进行高效的数据查询。Greenplum是Pivotal公司开发的一款高性能、并行处理的MPP(大规模并行...
而"08 - 角色权限及客户端认证管理(2).mp4"可能是对应的视频教程,演示了实际操作步骤,帮助用户更好地理解和实践这些概念。 在实际操作中,理解并正确设置这些权限和认证机制对于任何Greenplum和Hadoop管理员来说...
文件"18 - 定义数据库对象(8).mp4"可能是视频教程,详细演示了如何在实际操作中创建和加载分区表的过程。而"18.定义数据库对象(8)-创建和装载分区表.ppt"可能包含相关幻灯片,总结了关键概念和步骤,是学习和复习的...
- 视频教程"01 - Greenplum架构(1).mp4":该视频可能详细讲解了Greenplum的基本架构和核心特性,适合初学者入门。 - PPT讲义"01.Greenplum架构(1).ppt":通常包含更详细的图文解释,有助于深入理解Greenplum的架构...
在"16 - 定义数据库对象(6).mp4"的视频教程中,可能涵盖了如何使用SQL命令创建、修改和查询变更表的步骤,以及如何配置和优化其性能。同时,讲师可能会深入讨论变更表的内部工作机制,如WAL(Write-Ahead Log)日志...
本文将从《hadoop开发案例hadoop视频教程-GreenplumHadoop大数据应用案例剖析》这一资料出发,深入探讨Hadoop与Greenplum在大数据领域中的应用案例及其关键技术。 #### 二、Hadoop与Greenplum概述 - **Hadoop**:一...
通过这个视频教程套餐,你将学习如何安装和配置Hadoop环境,掌握MapReduce编程模型,理解HBase的数据模型和操作,以及如何在实际项目中运用YARN管理资源。此外,你还将了解Greenplum的高级特性以及如何利用Chukwa...
### Hadoop与Greenplum大数据应用案例解析 #### 一、Hadoop与Greenplum概述 **Hadoop**是一款能够处理大数据集的开源框架,它能够以可靠且高效率的方式处理PB级别的数据。Hadoop的核心组件包括**HDFS**(Hadoop ...
本视频教程将通过实例演示,帮助你理解和掌握如何配置、管理和使用Greenplum,从而充分发挥其在大数据分析领域的优势。无论你是数据库管理员、数据工程师还是数据分析师,都能从中受益,提升你的数据分析能力。
此外,课程还包括视频教程,这些直观的教学方式将帮助你更好地理解和应用所学知识。每个主题都将通过实例演示和详细解释,确保你能从理论到实践全面掌握大数据处理的关键技术。 总之,《Hadoop大数据零基础实战培训...
在本压缩包“hadoop大数据零基础实战培训教程.rar”中,您将获得一系列关于大数据处理和Hadoop生态系统的深入学习资源。这个教程涵盖了多个关键领域,包括HBase数据库、MapReduce编程模型、多语言MapReduce实现、...