`
ClouderaHadoop
  • 浏览: 11020 次
社区版块
存档分类
最新评论
文章列表
盘点那些在CDH5中是bug,到了CDH6版本就修复了的问题。涉及到Hadoop、HDFS、YARN、HBASE、hive、hue、impala、kudu、oozie、solr、spark、kafka、parquet、zookeeper等组件。如果你的集群问题是被列出的这些,那么升级是可以解决问题的。 列出的只是部分的一百多个问题,Cloudera今年年底会停止CDH5的支持,对于CDH5的用户来说,升级是大势所趋。 问题 问题描述 HADOOP-12267 s3a failure due to integer overflow bug in AWS SDK HADOOP-15169 & ...
第一类:开发类 1、Spark and Hadoop开发人员培训 (4天) 考试建议:CCA175 课程概述 学习关键概念和掌握使用最新技术和工具将数据采集到Hadoop 机群并进行处理。通过学习掌握诸如Spark(包括 Spark Streaming和Spark SQL)、Flume、Kafka 以及Sqoop 这样的Hadoop 生态系统工具和技术,Hadoop开发员将具备解决实际大数据问题和挑战的能力。 培训对象 面向具有 Scala或Python 编程经验的开发人员。熟悉 Linux 命令行,对SQL有基本了解。强烈建议不熟悉Hadoop的人员参加该培训 2、Apache HBas ...
1、CCA Administrator Exam (CCA131)  管理员认证 认证准备建议:Administrator管理员培训 考试形式:120分钟;70%通过;基于一个预配置的Cloudera企业版集群,解决8~12个场景下的任务 2、CCA Spark and Hadoop Developer (CCA175) 开发者认证 认证准备建议:Spark and Hadoop开发者培训 考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题 3、CCA Data Analyst (CCA159)数据分析师认证  认证准备建议:Data Analyst数据分 ...
认证准备建议:Spark and Hadoop开发者培训 考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题 考试大纲 数据采集 这包括以下内容: 使用Sqoop将数据从MySQL数据库导入HDFS 使用Sqoop从HDFS导出数据到MySQL数据库 使用Sqoop更改导入期间数据的分隔符和文件格式 将实时和近乎实时的流数据导入HDFS 处理流数据,因为它被加载到群集上 使用Hadoop文件系统命令将数据加载到HDFS中转换,分批,储存 将存储在HDFS中的给定格式的一组数据值转换为新的数据值或新的数据格式,并将其写入HDFS。 从HDFS加载RDD数据,用 ...
1、CCAAdministrator Exam (CCA131)  管理员认证 认证准备建议:Administrator管理员培训 考试形式:120分钟;70%通过;基于一个预配置的Cloudera企业版集群,解决8~12个场景下的任务 2、CCA Sparkand Hadoop Developer (CCA175) 开发者认证 认证准备建议:Spark and Hadoop开发者培训 考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题 3、CCA DataAnalyst (CCA159)数据分析师认证 认证准备建议:Data Analyst数据分析师培训 考 ...
Administrator管理员培训              培训时长:4天/28课时             认证考试:CCAH 从安装及配置、负载均衡及调整,以及 诊断和解决部署问题等各方面了解 Hadoop 系统管理员的概念和实践。 面向需要建立或维护 Hadoop 集群的管 理员。培训对象要求具备 Linux 基本知识。 Hadoop相关知识不作要求。 Spark and Hadoop开发者培训                      培训时长:4天/28课时             认证考试:CCA175 了解 Apache Spark 的基础知识及其与 Hadoop 整体生态系 ...
Global site tag (gtag.js) - Google Analytics