- 浏览: 11020 次
最新评论
文章列表
盘点那些在CDH5中是bug,到了CDH6版本就修复了的问题。涉及到Hadoop、HDFS、YARN、HBASE、hive、hue、impala、kudu、oozie、solr、spark、kafka、parquet、zookeeper等组件。如果你的集群问题是被列出的这些,那么升级是可以解决问题的。
列出的只是部分的一百多个问题,Cloudera今年年底会停止CDH5的支持,对于CDH5的用户来说,升级是大势所趋。
问题 问题描述
HADOOP-12267 s3a failure due to integer overflow bug in AWS SDK
HADOOP-15169 & ...
第一类:开发类
1、Spark and Hadoop开发人员培训 (4天)
考试建议:CCA175
课程概述
学习关键概念和掌握使用最新技术和工具将数据采集到Hadoop 机群并进行处理。通过学习掌握诸如Spark(包括 Spark Streaming和Spark SQL)、Flume、Kafka 以及Sqoop 这样的Hadoop 生态系统工具和技术,Hadoop开发员将具备解决实际大数据问题和挑战的能力。
培训对象
面向具有 Scala或Python 编程经验的开发人员。熟悉 Linux 命令行,对SQL有基本了解。强烈建议不熟悉Hadoop的人员参加该培训
2、Apache HBas ...
1、CCA Administrator Exam (CCA131) 管理员认证
认证准备建议:Administrator管理员培训
考试形式:120分钟;70%通过;基于一个预配置的Cloudera企业版集群,解决8~12个场景下的任务
2、CCA Spark and Hadoop Developer (CCA175) 开发者认证
认证准备建议:Spark and Hadoop开发者培训
考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题
3、CCA Data Analyst (CCA159)数据分析师认证
认证准备建议:Data Analyst数据分 ...
认证准备建议:Spark and Hadoop开发者培训
考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题
考试大纲
数据采集
这包括以下内容:
使用Sqoop将数据从MySQL数据库导入HDFS
使用Sqoop从HDFS导出数据到MySQL数据库
使用Sqoop更改导入期间数据的分隔符和文件格式
将实时和近乎实时的流数据导入HDFS
处理流数据,因为它被加载到群集上
使用Hadoop文件系统命令将数据加载到HDFS中转换,分批,储存
将存储在HDFS中的给定格式的一组数据值转换为新的数据值或新的数据格式,并将其写入HDFS。
从HDFS加载RDD数据,用 ...
1、CCAAdministrator Exam (CCA131) 管理员认证
认证准备建议:Administrator管理员培训
考试形式:120分钟;70%通过;基于一个预配置的Cloudera企业版集群,解决8~12个场景下的任务
2、CCA Sparkand Hadoop Developer (CCA175) 开发者认证
认证准备建议:Spark and Hadoop开发者培训
考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题
3、CCA DataAnalyst (CCA159)数据分析师认证
认证准备建议:Data Analyst数据分析师培训
考 ...
Administrator管理员培训 培训时长:4天/28课时 认证考试:CCAH
从安装及配置、负载均衡及调整,以及 诊断和解决部署问题等各方面了解 Hadoop 系统管理员的概念和实践。
面向需要建立或维护 Hadoop 集群的管 理员。培训对象要求具备 Linux 基本知识。 Hadoop相关知识不作要求。
Spark and Hadoop开发者培训 培训时长:4天/28课时 认证考试:CCA175
了解 Apache Spark 的基础知识及其与 Hadoop 整体生态系 ...