`

Java之大数据学习路线

阅读更多
三个月大数据研发学习计划实战解析

http://blog.csdn.net/GitChat/article/details/78341484



第一阶段(基础阶段)

1)Linux学习(跟鸟哥学就ok了)—–20小时

Linux操作系统介绍与安装。
Linux常用命令。
Linux常用软件安装。
Linux网络。
防火墙。
Shell编程等。
官网:https://www.centos.org/download/
中文社区:http://www.linuxidc.com/Linux/2017-09/146919.htm

2)Java 高级学习(《深入理解Java虚拟机》、《Java高并发实战》)—30小时

掌握多线程。
掌握并发包下的队列。
了解JMS。
掌握JVM技术。
掌握反射和动态代理。
官网:https://www.java.com/zh_CN/
中文社区:http://www.java-cn.com/index.html

推荐书籍:
《自己动手写Java虚拟机》
《Java核心技术卷II:高级特性(原书第10版)》


3)Zookeeper学习(可以参照这篇博客进行学习:http://www.cnblogs.com/wuxl360/p/5817471.html)

Zookeeper分布式协调服务介绍。
Zookeeper集群的安装部署。
Zookeeper数据结构、命令。
Zookeeper的原理以及选举机制。
官网:http://zookeeper.apache.org/
中文社区:http://www.aboutyun.com/forum-149-1.html

第二阶段(攻坚阶段)

4)Hadoop (《Hadoop 权威指南》)—80小时

HDFS

HDFS的概念和特性。
HDFS的shell操作。
HDFS的工作机制。
HDFS的Java应用开发。
MapReduce

运行WordCount示例程序。
了解MapReduce内部的运行机制。
MapReduce程序运行流程解析。
MapTask并发数的决定机制。
MapReduce中的combiner组件应用。
MapReduce中的序列化框架及应用。
MapReduce中的排序。
MapReduce中的自定义分区实现。
MapReduce的shuffle机制。
MapReduce利用数据压缩进行优化。
MapReduce程序与YARN之间的关系。
MapReduce参数优化。
MapReduce的Java应用开发

官网:http://hadoop.apache.org/
中文文档:http://hadoop.apache.org/docs/r1.0.4/cn/
中文社区:http://www.aboutyun.com/forum-143-1.html

5)Hive(《Hive开发指南》)–20小时

Hive 基本概念

Hive 应用场景。
Hive 与hadoop的关系。
Hive 与传统数据库对比。
Hive 的数据存储机制。
Hive 基本操作

Hive 中的DDL操作。
在Hive 中如何实现高效的JOIN查询。
Hive 的内置函数应用。
Hive shell的高级使用方式。
Hive 常用参数配置。
Hive 自定义函数和Transform的使用技巧。
Hive UDF/UDAF开发实例。
Hive 执行过程分析及优化策略

官网:https://hive.apache.org/
中文入门文档:http://www.aboutyun.com/thread-11873-1-1.html
中文社区:http://www.aboutyun.com/thread-7598-1-1.html

6)HBase(《HBase权威指南》)—20小时

hbase简介。
habse安装。
hbase数据模型。
hbase命令。
hbase开发。
hbase原理。
官网:http://hbase.apache.org/
中文文档:http://abloz.com/hbase/book.html
中文社区:http://www.aboutyun.com/forum-142-1.html

7)Scala(《快学Scala》)–20小时

Scala概述。
Scala编译器安装。
Scala基础。
数组、映射、元组、集合。
类、对象、继承、特质。
模式匹配和样例类。
了解Scala Actor并发编程。
理解Akka。
理解Scala高阶函数。
理解Scala隐式转换。
官网:http://www.scala-lang.org/
初级中文教程:http://www.runoob.com/scala/scala-tutorial.html

8)Spark (《Spark 权威指南》)—60小时

enter image description here

Spark core

Spark概述。
Spark集群安装。
执行第一个Spark案例程序(求PI)。
RDD

enter image description here

RDD概述。
创建RDD。
RDD编程API(Transformation 和 Action Operations)。
RDD的依赖关系
RDD的缓存
DAG(有向无环图)
Spark SQL and DataFrame/DataSet

enter image description here

Spark SQL概述。
DataFrames。
DataFrame常用操作。
编写Spark SQL查询程序。
Spark Streaming

enter image description here

enter image description here

park Streaming概述。
理解DStream。
DStream相关操作(Transformations 和 Output Operations)。
Structured Streaming

其他(MLlib and GraphX )

这个部分一般工作中如果不是数据挖掘,机器学习一般用不到,可以等到需要用到的时候再深入学习。

官网:http://spark.apache.org
中文文档(但是版本有点老):https://www.gitbook.com/book/aiyanbo/spark-programming-guide-zh-cn/details
中文社区:http://www.aboutyun.com/forum-146-1.html

9)Python (推荐廖雪峰的博客—30小时

10)自己用虚拟机搭建一个集群,把所有工具都装上,自己开发一个小demo —30小时

可以自己用VMware搭建4台虚拟机,然后安装以上软件,搭建一个小集群(本人亲测,I7,64位,16G内存,完全可以运行起来,以下附上我学习时用虚拟机搭建集群的操作文档)











分享到:
评论

相关推荐

    Java及大数据学习路线.pdf

    **大数据学习路线** 1. **JavaSE** 和 **JavaEE核心** 的内容与Java学习路线相同。 2. **Hadoop生态体系**: - **Hadoop**:分布式存储和计算框架,解决大数据处理问题。 - **Zookeeper**:分布式服务管理,...

    大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南

    大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 包括Hadoop、Hive、Spark、Storm、Flink、HBase、Kafka、Zookeeper、Flume、Sqoop等技术的学习 Hadoop 分布式文件存储系统 —— HDFS 分布式计算框架 ...

    java学习路线(鱼皮)

    Java学习路线(鱼皮) Java学习路线(鱼皮)是一条龙版本的学习路线,从入门到入土,旨在帮助学习者快速掌握Java开发的所有知识点。本路线的特点是新、完整、实用、开源、回馈社区、持续更新。 学习路线的主要...

    大数据精选入门指南,包括大数据学习路线、大数据技术栈思维导图

    大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分散文件存储系统 —— HDFS 多元计算框架——MapReduce 集群资源管理器 —— YARN Hadoop单机伪集群环境搭建 Hadoop 云服务环境搭建 HDFS...

    完整的大数据知识体系,大数据学习路线图.docx

    根据大数据学习路线图,我们可以将大数据知识体系分为十一个部分,分别是Java语言、数据结构与算法、数据库原理与MYSQL数据库、LINUX操作系统、Hadoop技术、分布式数据库技术、数据仓库HIVE、PYTHON语言、机器学习...

    大数据学习路线和相关技术

    在大数据领域,学习路线通常涵盖多个关键组成部分,包括数据存储、数据处理、数据分析以及相关的工具和技术。以下是对这些核心领域的详细解析: 1. **Hadoop家族**:Hadoop是大数据处理的基础,它由Apache基金会...

    从大数据学习路线(收藏).docx

    大数据技术的发展历程和学习路线 大数据,作为现代信息技术领域的重要组成部分,已经成为企业和组织处理海量复杂数据的关键工具。对于想要进入或转型到大数据领域的专业人士来说,了解其学习路线和历史背景至关重要...

    大数据技术学习路线思维导图.zip

    由于大数据技术体系比较庞大,所以在学习大数据的时候首先应该根据自身的知识结构,找到一个适合的切入点。本思维导图将介绍大数据技术学习需要经过的十二个阶段,帮助想转大数据开发的同学,对大数据技术有个整体的...

    大数据方向学习路线.pdf

    以下是一条详细的大数据学习路线,旨在帮助你系统地构建大数据知识体系。 首先,你需要打好数字化基础,包括: 1. **Java SE**:Java是大数据开发的基础语言,学习Java SE阶段的内容,包括语法、面向对象编程、...

    Java、Python、大数据、前端学习路线图(思维导图)

    本压缩包提供的"Java、Python、大数据、前端学习路线图(思维导图)"为初学者和进阶者提供了一个清晰的学习路径,帮助他们有效地规划自己的学习进度。下面将详细解析这四个领域的关键知识点。 1. **Java**: Java...

    一张图解决你的烦恼

    java大数据学习路线,java大数据学习路线java大数据学习路线

    大数据学习路线+知识点大梳理.pdf

    ### 大数据学习路线与知识点梳理 #### 一、数据存储技术概览 **1. 关系型数据库** - **MySQL** - **特点**: 开源、稳定、易用。 - **应用场景**: 适用于中小型企业的业务应用。 - **SQL Server** - **特点**: ...

    java+大数据(1).pdf

    Java大数据学习路线旨在帮助开发者掌握Java编程基础以及大数据技术,为从事相关项目开发做准备。以下是一些关键知识点的详细说明: 1. **Java基础**(45天): - **Java网络编程**:理解Socket编程,TCP/IP协议,...

    大数据学习笔记,学习路线,技术案例整理。.zip

    本资料包“大数据学习笔记,学习路线,技术案例整理”是一个全面的大数据学习资源,旨在帮助初学者和进阶者系统地掌握大数据的核心技术和应用实践。 首先,我们来了解一下大数据的关键概念和技术栈。大数据通常有四...

    Java最新2024学习路线+Java自学全套免费网盘资料

    对于想要学习Java的初学者而言,本学习路线旨在覆盖从基础到高级,甚至是架构师级别的知识体系。以下是对所提供的文件内容的详细知识点解析: 1. 学习方法 - Java基础:指出了学习Java的首要任务是掌握其基础语法、...

    基于java实现的交通大数据可视化系统

    【基于Java实现的交通大数据...通过学习和实践基于Java的交通大数据可视化系统,开发者不仅可以掌握Java编程,还能深入理解大数据处理、数据可视化和Web应用开发等多个领域,对提升技能和解决实际问题有极大的帮助。

    大数据方向学习图谱--珍藏版

    总之,这个珍藏版的大数据学习图谱提供了全面而系统的学习资源,无论你是初学者还是希望深化理解的从业者,都能从中受益。通过深入研究Hadoop家族,提升大数据工程师的必备技能,理解大数据平台架构,并遵循科学的...

    Hadoop大数据学习线路图.docx

    本文将围绕Hadoop大数据学习路线展开,帮助初学者逐步掌握这一核心技术。 1. **云计算和云计算技术** - 云计算是一种基于互联网的计算方式,它通过网络共享软硬件资源和信息,按需提供给用户,包括动态扩展和虚拟...

    BigDataGuide:大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频,面试资料

    大数据学习路线 学习路线中的视频,文档资料可以关注公众号:旧时光大数据,回复相应关键字获取云盘链接 基础部分 一,编程工具选择 现在一般都是使用IDEA了,不过Eclipse也不错,初学时我看的是刘意老师的15年版本...

Global site tag (gtag.js) - Google Analytics