Spark and Hadoop认证考试大纲CCA175 - - ITeye博客

`

ClouderaHadoop

浏览: 11254 次

最近访客更多访客>>

大数据2017

czmmiao

zhgwso

u012363178

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Spark and Hadoop认证考试大纲CCA175

阅读更多

认证准备建议：Spark and Hadoop开发者培训
考试形式：120分钟；70%通过；解决10~12基于CDH5机群上需通过实际操作的问题

考试大纲
数据采集
这包括以下内容：
使用Sqoop将数据从MySQL数据库导入HDFS
使用Sqoop从HDFS导出数据到MySQL数据库
使用Sqoop更改导入期间数据的分隔符和文件格式
将实时和近乎实时的流数据导入HDFS
处理流数据，因为它被加载到群集上
使用Hadoop文件系统命令将数据加载到HDFS中转换，分批，储存
将存储在HDFS中的给定格式的一组数据值转换为新的数据值或新的数据格式，并将其写入HDFS。
从HDFS加载RDD数据，用于Spark应用程序
使用Spark将RDD的结果写回HDFS
以各种文件格式读取和写入文件
对数据执行标准提取，变换，加载（ETL）过程
数据分析
使用Spark SQL在应用程序中以编程方式与metastore进行交互。通过使用查询加载数据生成报告。
使用转移表作为Spark应用程序的输入源或输出接收器
了解在Spark中查询数据集的基本原理
使用Spark过滤数据
编写计算聚合统计信息的查询
使用Spark加入不同的数据集
生成排名或排序数据
配置
这是一个实操的考试，考生不仅要会编写代码，也应该熟悉整个开发环境
提供命令行方式，改变你的应用配置，如增加可用内存大小
中国区内需要报名考试或者培训的都可以问问我1438 118790

分享到：

大数据工程师值得一考的4个Hadoop认证 | CCA131/CCA159/CCA175认证考试代报名

2017-11-30 15:55
浏览 1768
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Big Data Analytics with Spark and Hadoop 无水印pdf 0分: Big Data Analytics with Spark and Hadoop 英文无水印pdf pdf使用FoxitReader和PDF-XChangeViewer测试可以打开

Big Data Analytics with Spark and Hadoop（Spark与Hadoop大数据分析）代码code: Big Data Analytics with Spark and Hadoop（Spark与Hadoop大数据分析）代码code

CCA175，CCA131考试大纲: 6. 完成课程后，鼓励学员继续学习并报名参加CCA Spark和Hadoop开发者考试。获得认证是一个很好的区分因素，它帮助学员在领域内树立领导地位，向雇主和客户提供了他们技能和专业知识的具体证明。 7. 课程中会涉及...

Spark和Hadoop的集成: Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。Storm是一个分布式的、容错的实时计算系统。两者整合，优势互补。

Developer Training for Apache Spark and Hadoop: Developer Training for Apache Spark and Hadoop

Spark和hadoop开发人员培训(CCA)1: 7. **预备认证**：此课程是获得CCA Spark & Hadoop Developer认证的良好起点，虽然要通过认证考试还需要额外的学习，但课程内容覆盖了考试中的许多主题。 **目标受众与前提条件**：这门课程面向有编程经验的...

Big Data Analytics with Spark and Hadoop mobi: Big Data Analytics with Spark and Hadoop 英文mobi 本资源转载自网络，如有侵权，请联系上传者或csdn删除本资源转载自网络，如有侵权，请联系上传者或csdn删除

Python+Spark 2.0+Hadoop机器学习与大数据: 《Python+Spark 2.0+Hadoop机器学习与大数据》是一本深入探讨大数据处理与机器学习技术结合的著作。作者林大贵以其丰富的经验，详细介绍了如何利用Python、Spark 2.0以及Hadoop这一组合来构建高效的数据分析解决方案...

Developer Training for Apache Spark and Hadoop:Hands-On Exercise: 《Developer Training for Apache Spark and Hadoop: Hands-On Exercise》是一份深入实践的教程，旨在帮助开发者熟悉Apache Spark和Hadoop两大大数据处理框架。本教程通过一系列的手动操作练习，覆盖了从基础环境...

Big Data Analytics with Spark and Hadoop epub: Big Data Analytics with Spark and Hadoop 英文epub 本资源转载自网络，如有侵权，请联系上传者或csdn删除本资源转载自网络，如有侵权，请联系上传者或csdn删除

Spark+Hadoop+IDE环境搭建: 在大数据处理领域，Spark和Hadoop是两个至关重要的框架。Spark以其高效的内存计算和易用性，成为数据处理的新宠，而Hadoop作为分布式存储和计算的基础，为大数据提供了基石。本文将详细介绍如何在IDE环境下搭建Spark...

Python+Spark+Hadoop大数据基于用户画像电影推荐系统毕业源码 - 副本.zip: 标题中的“Python+Spark+Hadoop大数据基于用户画像电影推荐系统毕业源码”指的是一个使用Python、Apache Spark和Apache Hadoop构建的大数据处理项目，旨在实现一个基于用户画像的电影推荐系统。这个系统可能利用大...

spark-3.2.1 不集成hadoop安装包: 在标题"spark-3.2.1 不集成hadoop安装包"中，我们看到的是Spark的一个特定版本——3.2.1，而且特别强调了这个版本不包含Hadoop的集成。这意味着这个Spark发行版没有内置对Hadoop的支持，用户需要自己配置和管理与...

Spark高清hadoop: 《Spark高清Hadoop》这本书是针对大数据处理领域的一份宝贵学习资料，主要聚焦于Apache Spark这一强大的分布式计算框架。Spark以其高效、易用和多用途的特点，在大数据处理领域备受推崇，尤其是在实时处理、机器学习...

CCA175学习手册: 官方的学习资料，目标是通过此手册提供的知识点通过CCA Spark and Hadoop Developer (CCA175) 的考试。下载文档的朋友，我附带VM虚拟机，下载后请加群1141169，向我索要VM。

Spark、Hadoop大数据平台搭建.pdf: 《Spark与Hadoop大数据平台搭建指南》在大数据处理领域，Spark和Hadoop是两个重要的组件，它们分别负责计算和存储。本指南将详细介绍如何在Linux环境下搭建Spark和Hadoop的大数据平台，以及如何配置环境变量，安装...

spark-3.1.3-bin-without-hadoop.tgz: 这个"spark-3.1.3-bin-without-hadoop.tgz"压缩包是Spark的3.1.3版本，不含Hadoop依赖的二进制发行版。这意味着在部署时，你需要自行配置Hadoop环境，或者在不依赖Hadoop的环境中运行Spark。 Spark的核心特性包括...

spark_hadoop2.5assembly: HADOOP SPARK 开发依赖包，对于第一个SPARK开发的例子，可以导入这个包去进行开发

Spark/Hadoop开发缺失插件-winutils.exe: 本地开发Spark/Hadoop报错“ERROR Shell: Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.” ...

Global site tag (gtag.js) - Google Analytics