`
hyz301
  • 浏览: 373962 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【转】Hadoop学习路线图

阅读更多

 按照这个路线图来学习即可。
    1、M. Tim Jones的三篇文章:
    用Hadoop进行分布式数据处理第1部分(入门):http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/index.html
    用Hadoop进行分布式数据处理第2部分(进阶):http://www.ibm.com/developerworks/cn/linux/l-hadoop-2/index.html
    用Hadoop进行分布式数据处理第3部分(应用程序开发):http://www.ibm.com/developerworks/cn/linux/l-hadoop-3/index.html

    2、“银河里的星星”的博客,其中的Google论文系列(就包括开创性论文“MapReduce:简化大集群上的数据处理”)、搜索与分布式方面的介绍
    [google论文三]MapReduce简化大集群上的数据处理:http://duanple.blog.163.com/blog/static/709717672010923203501/
    词频统计的Map/Reduce程序可以从这里找到:http://blog.csdn.net/shijinupc/article/details/7522446
    Google论文系列:http://duanple.blog.163.com/blog/#m=0&t=3&c=google
    按照Hadoop各组件来串联:http://duanple.blog.163.com/blog/static/7097176720119791920962/
    
    3、IBM developerWorks上的其他Hadoop文章,在dw上用Hadoop关键字进行搜索,可以找到大量Hadoop的文章
    下面一些需要看:
    Hadoop Distributed File System简介:http://www.ibm.com/developerworks/cn/web/wa-introhdfs/index.html
    使用Apache Pig处理数据:http://www.ibm.com/developerworks/cn/bigdata/basic.html
        
    4、《开源软件架构》中的介绍
    (卷1第8章)HDFS--Hadoop分布式文件系统:http://www.ituring.com.cn/article/4299
    英文原文:http://www.aosabook.org/en/index.html (其中的卷1第8章)
    
    5、阿里集团数据平台的官方博客,包含大量Hadoop研究和应用经验
    http://www.alidata.org/archives
    
    6、百度搜索研发部的官方博客,主要包含分布式系统(Hadoop)、搜索技术、数据挖掘、大型网站架构等方面的经验

    http://baidu-tech.com/

 

    7、董的博客,关于Hadoop、分布式系统的研究

    http://dongxicheng.org/recommend/


    8、官方文档当然更不能少了,主要包括Hadoop集群的搭建,MapReduce的使用,HDFS架构方面的介绍
    优先看稳定版:http://hadoop.apache.org/docs/stable/
    最新版(包括下一代MapReduce即YARN的介绍):http://hadoop.apache.org/docs/current/
        
    9、caibinbupt的博客,Hadoop源代码分析系列
    http://caibinbupt.iteye.com/?page=6
    千与的专栏,Hadoop-0.20.0源码分析
    http://blog.csdn.net/shirdrn/article/category/595039/3
    
    10、spork的博客,其中关于Hadoop的系列
    http://www.cnblogs.com/spork/category/226077.html
    
    11、chinacloud的博客,其中的Hadoop架构、分布式系统设计方面的一些经验
    http://www.cnblogs.com/chinacloud/archive/2010/12/03/1895369.html
    
    12、beanmoon的博客,其中的Hadoop系列
    http://www.cnblogs.com/beanmoon/

转自:http://blog.csdn.net/zhoudaxia/article/details/8801769

分享到:
评论
1 楼 smartleon 2015-04-04  
确实不错

相关推荐

    Hadoop学习路线图

    有计划的安排大数据的学习之路,可以在对Hadoop的学习规划上有一个更清晰的目标!

    Hadoop学习必看路线图2.pdf

    ### Hadoop学习必看路线图概览 #### 一、Linux与Python基础 - **Linux安装及基本操作**:这是Hadoop学习的基础,包括Linux系统的安装、常用的命令行操作(如文件管理、进程管理等)。熟悉Linux环境对于后续的学习...

    hadoop学习路线

    1、对hadoop、zookeeper、hbase、hive、sqoop、flume、pig的理论体系有个系统掌握,对核心知识能够掌握;阅读市面上的各种图书和各种文章不再有困难; 2、能够在linux环境搭建hadoop、hbase等的伪分布和分布模式,...

    学习hadoop--java零基础学习hadoop手册

    本手册旨在为完全没有Java基础的学习者提供一个从零开始学习Hadoop的路线图。Hadoop是一个能够处理大量数据的大规模分布式计算框架,其核心组件包括HDFS(Hadoop Distributed File System)和MapReduce。 #### 二、...

    IT学习路线图.pdf

    IT学习路线图 关于IT学习路线图,这个文件提供了多种IT职业路线图的概述,包括Python研发工程师、信息安全工程师、大数据工程师、Web前端工程师和Android研发工程师等多种职业方向。以下是每个职业方向的知识点摘要...

    2020 it行业最新学习路线图.rar

    "2020 IT行业最新学习路线图"是一个宝贵的资源,它为IT从业者或爱好者提供了清晰的学习路径,涵盖了多个热门领域,包括大数据、Java、Python、区块链以及运维等。下面将分别对这些领域进行详细解读。 首先,大数据...

    Hadoop大数据学习线路图.docx

    本文将围绕Hadoop大数据学习路线展开,帮助初学者逐步掌握这一核心技术。 1. **云计算和云计算技术** - 云计算是一种基于互联网的计算方式,它通过网络共享软硬件资源和信息,按需提供给用户,包括动态扩展和虚拟...

    Python最佳学习路线图

    ### Python最佳学习路线图 #### 一、Python基础学习阶段 **1. Python3环境搭建** - **基础知识:** - 了解Python的历史与发展现状。 - 掌握Python3安装与配置方法。 - 熟悉常用的Python集成开发环境(IDE)如...

    大数据学习路线图

    大数据学习路线图权威指导,立马收藏吧,一图就够了,

    2017大数据数据分析学习资料合集(含学习路线图).docx

    包括Hadoop的学习路线图和实战教程等资源。 - **机器学习与数据挖掘**:介绍了机器学习的基础概念、常见算法及其应用场景,并提供了一系列学习资源,帮助学习者从理论到实践全面掌握这一领域。 #### 就业指导 - **...

    大数据、云计算系统高级架构师课程学习路线图.pdf

    大数据、云计算系统高级架构师课程学习路线图 本课程学习路线图旨在帮助学员快速掌握大数据、云计算系统高级架构师的知识和技能。该课程涵盖了 Linux基础、Hadoop核心技术、Hive数据仓库、大数据协作框架等多个方面...

    小白快速掌握Hadoop集成Kerberos安全技术频教程

    从零学习Kerberos安全认证机制,并和Hadoop、YARN、HIVE进行集成,通过知识点 + 案例教学法帮助小白快速掌握Hadoop集成Kerberos安全技术。 课程亮点 1,专项攻破Hadoop安全配置。 2,生动形象,化繁为简,讲解通俗...

    Java、Python、大数据、前端学习路线图(思维导图)

    本压缩包提供的"Java、Python、大数据、前端学习路线图(思维导图)"为初学者和进阶者提供了一个清晰的学习路径,帮助他们有效地规划自己的学习进度。下面将详细解析这四个领域的关键知识点。 1. **Java**: Java...

    完整的大数据知识体系,大数据学习路线图.docx

    根据大数据学习路线图,我们可以将大数据知识体系分为十一个部分,分别是Java语言、数据结构与算法、数据库原理与MYSQL数据库、LINUX操作系统、Hadoop技术、分布式数据库技术、数据仓库HIVE、PYTHON语言、机器学习...

    一种基于Hadoop的分布式地图匹配算法.pdf

    这是因为HashMap网格索引通过将道路网络映射到一个二维网格中,为每个格子存储可能匹配的路线段,从而能够快速缩小搜索范围,加快数据匹配速度。同时,Hadoop的MapReduce模型还能够有效地支持并行计算,将原本需要...

    大数据学习路线图、大数据所有技术汇总

    在大数据领域,学习和掌握全面的技术是至关重要的。本文将基于提供的标题和描述,深入探讨大数据的各个方面,包括数据采集与迁移、数据存储与仓库、搜索引擎、离线与实时处理、大数据应用、服务器集群部署与监控、...

    Hadoop测试数据

    1. **201404公交出行数据样例**:这可能是一组公共交通系统的数据,包含了公交车的行驶路线、时间、站点等信息。这样的数据可用于交通流量分析、预测模型构建,或者优化公交调度策略。 2. **车辆标注数据样例**:这...

    Hadoop权威指南 中文版

    了解Hadoop的未来趋势,可以帮助用户更好地规划其技术路线图。 综上所述,《Hadoop权威指南 中文版》系统地介绍了Hadoop的理论基础和实践经验,涵盖了从核心概念到应用实践的各个方面,是学习和深入了解Hadoop不可...

Global site tag (gtag.js) - Google Analytics