`
ClouderaHadoop
  • 浏览: 11016 次
社区版块
存档分类
最新评论

Spark and Hadoop认证考试大纲CCA175

阅读更多
认证准备建议:Spark and Hadoop开发者培训
考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题

考试大纲
数据采集
这包括以下内容:
使用Sqoop将数据从MySQL数据库导入HDFS
使用Sqoop从HDFS导出数据到MySQL数据库
使用Sqoop更改导入期间数据的分隔符和文件格式
将实时和近乎实时的流数据导入HDFS
处理流数据,因为它被加载到群集上
使用Hadoop文件系统命令将数据加载到HDFS中转换,分批,储存
将存储在HDFS中的给定格式的一组数据值转换为新的数据值或新的数据格式,并将其写入HDFS。
从HDFS加载RDD数据,用于Spark应用程序
使用Spark将RDD的结果写回HDFS
以各种文件格式读取和写入文件
对数据执行标准提取,变换,加载(ETL)过程
数据分析
使用Spark SQL在应用程序中以编程方式与metastore进行交互。通过使用查询加载数据生成报告。
使用转移表作为Spark应用程序的输入源或输出接收器
了解在Spark中查询数据集的基本原理
使用Spark过滤数据
编写计算聚合统计信息的查询
使用Spark加入不同的数据集
生成排名或排序数据
配置
这是一个实操的考试,考生不仅要会编写代码,也应该熟悉整个开发环境
提供命令行方式,改变你的应用配置,如增加可用内存大小
中国区内需要报名考试或者培训的都可以问问我1438 118790
分享到:
评论

相关推荐

    Big Data Analytics with Spark and Hadoop 无水印pdf 0分

    Big Data Analytics with Spark and Hadoop 英文无水印pdf pdf使用FoxitReader和PDF-XChangeViewer测试可以打开

    Big Data Analytics with Spark and Hadoop(Spark与Hadoop大数据分析)代码code

    Big Data Analytics with Spark and Hadoop(Spark与Hadoop大数据分析)代码code

    CCA175,CCA131考试大纲

    6. 完成课程后,鼓励学员继续学习并报名参加CCA Spark和Hadoop开发者考试。获得认证是一个很好的区分因素,它帮助学员在领域内树立领导地位,向雇主和客户提供了他们技能和专业知识的具体证明。 7. 课程中会涉及...

    Spark和Hadoop的集成

    Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。Storm是一个分布式的、容错的实时计算系统。两者整合,优势互补。

    Developer Training for Apache Spark and Hadoop

    Developer Training for Apache Spark and Hadoop

    Spark和hadoop开发人员培训(CCA)1

    7. **预备认证**:此课程是获得CCA Spark & Hadoop Developer认证的良好起点,虽然要通过认证考试还需要额外的学习,但课程内容覆盖了考试中的许多主题。 **目标受众与前提条件**: 这门课程面向有编程经验的...

    Big Data Analytics with Spark and Hadoop mobi

    Big Data Analytics with Spark and Hadoop 英文mobi 本资源转载自网络,如有侵权,请联系上传者或csdn删除 本资源转载自网络,如有侵权,请联系上传者或csdn删除

    Python+Spark 2.0+Hadoop机器学习与大数据

    《Python+Spark 2.0+Hadoop机器学习与大数据》是一本深入探讨大数据处理与机器学习技术结合的著作。作者林大贵以其丰富的经验,详细介绍了如何利用Python、Spark 2.0以及Hadoop这一组合来构建高效的数据分析解决方案...

    Developer Training for Apache Spark and Hadoop:Hands-On Exercise

    《Developer Training for Apache Spark and Hadoop: Hands-On Exercise》是一份深入实践的教程,旨在帮助开发者熟悉Apache Spark和Hadoop两大大数据处理框架。本教程通过一系列的手动操作练习,覆盖了从基础环境...

    Big Data Analytics with Spark and Hadoop epub

    Big Data Analytics with Spark and Hadoop 英文epub 本资源转载自网络,如有侵权,请联系上传者或csdn删除 本资源转载自网络,如有侵权,请联系上传者或csdn删除

    Spark+Hadoop+IDE环境搭建

    在大数据处理领域,Spark和Hadoop是两个至关重要的框架。Spark以其高效的内存计算和易用性,成为数据处理的新宠,而Hadoop作为分布式存储和计算的基础,为大数据提供了基石。本文将详细介绍如何在IDE环境下搭建Spark...

    spark-3.2.1 不集成hadoop安装包

    在标题"spark-3.2.1 不集成hadoop安装包"中,我们看到的是Spark的一个特定版本——3.2.1,而且特别强调了这个版本不包含Hadoop的集成。这意味着这个Spark发行版没有内置对Hadoop的支持,用户需要自己配置和管理与...

    Spark高清hadoop

    《Spark高清Hadoop》这本书是针对大数据处理领域的一份宝贵学习资料,主要聚焦于Apache Spark这一强大的分布式计算框架。Spark以其高效、易用和多用途的特点,在大数据处理领域备受推崇,尤其是在实时处理、机器学习...

    CCA175学习手册

    官方的学习资料,目标是通过此手册提供的知识点通过CCA Spark and Hadoop Developer (CCA175) 的考试。下载文档的朋友,我附带VM虚拟机,下载后请加群1141169,向我索要VM。

    spark-3.1.3-bin-without-hadoop.tgz

    这个"spark-3.1.3-bin-without-hadoop.tgz"压缩包是Spark的3.1.3版本,不含Hadoop依赖的二进制发行版。这意味着在部署时,你需要自行配置Hadoop环境,或者在不依赖Hadoop的环境中运行Spark。 Spark的核心特性包括...

    Spark、Hadoop大数据平台搭建.pdf

    《Spark与Hadoop大数据平台搭建指南》 在大数据处理领域,Spark和Hadoop是两个重要的组件,它们分别负责计算和存储。本指南将详细介绍如何在Linux环境下搭建Spark和Hadoop的大数据平台,以及如何配置环境变量,安装...

    spark_hadoop2.5assembly

    HADOOP SPARK 开发依赖包,对于第一个SPARK开发的例子,可以导入这个包去进行开发

    Spark/Hadoop开发缺失插件-winutils.exe

    本地开发Spark/Hadoop报错“ERROR Shell: Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.” ...

    spark/hadoop读取s3所需要的外部依赖包

    在大数据处理领域,Spark和Hadoop是两个非常重要的框架,它们广泛用于数据处理、分析以及存储。当需要从云存储服务如Amazon S3(Simple Storage Service)读取或写入数据时,这两个框架需要额外的依赖包来实现与S3的...

Global site tag (gtag.js) - Google Analytics