`
jipengyun2008
  • 浏览: 32535 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop学习

 
阅读更多
Hadoop基本原理介绍:
http://wangwei.cao.blog.163.com/blog/static/10236252620130253346928/
Hadoop体系架构
http://blog.sina.com.cn/s/blog_a94476040101c9qo.html
http://www.open-open.com/lib/view/open1329835694186.htmlHadoop应用场景
http://www.open-open.com/bbs/view/1342075659562
Hadoop的起源、解决的问题
http://developer.51cto.com/art/201006/203510.htm
Hadoop生态系统:

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。
1.这一切,都起源自Web数据爆炸时代的来临
2.数据抓取系统-Nutch
3.海量数据怎么存,当然是用分布式文件系统-HDFS
4.数据怎么用呢,分析,处理
5.MapReduce框架,让你编写代码来实现对大数据的分析工作
6.非结构化数据(日志)收集处理-fuse,webdav,chukwa,flume,Scribe
7.数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了-Hiho,sqoop
8.MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据–Pig,Hive,Jaql
9.让你的数据可见-drilldown,Intellicus
10.用高级语言管理你的任务流–oozie,Cascading
11.Hadoop当然也有自己的监控管理工具–Hue,karmasphere,eclipse plugin,cacti,ganglia
12.数据序列化处理与任务调度–Avro,Zookeeper
13.更多构建在Hadoop上层的服务–Mahout,Elastic map Reduce
14.OLTP存储系统–Hbase

HDFS实战-Java API使用
http://blog.csdn.net/zhangzhaokun/article/details/5597433
分享到:
评论

相关推荐

    java及hadoop学习资料

    这份“java及hadoop学习资料”压缩包提供了丰富的学习资源,帮助初学者或进阶者深入理解和掌握这两个领域的核心概念。 Java部分: 1. **Java基础知识**:Java的学习通常从基础语法开始,包括数据类型、变量、控制...

    最新Hadoop学习笔记

    **Hadoop学习笔记详解** Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储海量数据。它的核心组件包括HDFS(Hadoop Distributed File System)和MapReduce,两者构成了大数据处理的基础...

    hadoop学习整理的文档

    【标题】:“Hadoop学习整理的文档” 【文档概述】: Hadoop是Apache软件基金会开发的一个开源分布式计算框架,主要用于处理和存储大规模数据。这个文档集合可能是针对Hadoop初学者或者希望深入理解Hadoop生态系统...

    大数据之Hadoop学习教程+笔记合计_超详细完整.zip

    大数据之Hadoop学习教程+笔记合计_超详细完整.zip

    Hadoop学习笔记

    Hadoop学习笔记,自己总结的一些Hadoop学习笔记,比较简单。

    Hadoop 学习笔记.md

    Hadoop 学习笔记.md

    Hadoop学习总结

    以下是对Hadoop学习的详细总结: **HDFS(Hadoop Distributed File System)简介** HDFS是Hadoop的核心组件之一,是一个高度容错性的分布式文件系统。它被设计成能在普通的硬件上运行,并能够处理大规模的数据集。...

    hadoop学习资料

    与孙老师交流Hadoop学习方法也是一种宝贵的学习机会。在学习过程中遇到问题时,可以向孙老师请教,获取及时的帮助和支持。此外,加入相关的学习社区或论坛,与其他学习者互动交流,也是提高学习效率的有效途径之一。...

    HADOOP学习笔记

    【HADOOP学习笔记】 Hadoop是Apache基金会开发的一个开源分布式计算框架,是云计算领域的重要组成部分,尤其在大数据处理方面有着广泛的应用。本学习笔记将深入探讨Hadoop的核心组件、架构以及如何搭建云计算平台。...

    hadoop学习手册

    Hadoop学习手册 Hadoop是开源、高可靠、可扩展的分布式计算框架,主要功能包括海量数据存储(HDFS)、海量数据分析(MapReduce)和分布式资源调度(Yarn)。作为云计算的标准开源软件,Hadoop的生态系统分布图包括...

    Hadoop学习总结和源码分析

    本文将基于“Hadoop学习总结和源码分析”这一主题,结合提供的文档资源,深入探讨Hadoop的核心组件HDFS(Hadoop Distributed File System)和MapReduce。 首先,我们从“Hadoop学习总结之一:HDFS简介.doc”开始,...

    hadoop学习笔记.rar

    《Hadoop学习笔记详解》 Hadoop,作为大数据处理领域中的核心框架,是Apache软件基金会下的一个开源项目,主要用于分布式存储和并行计算。本文将根据提供的Hadoop学习笔记,深入解析Hadoop的关键概念和实战技巧,...

    hadoop学习资料书

    【Hadoop学习资料书】 Hadoop是大数据处理领域的一个核心框架,由Apache软件基金会开发,以其分布式计算模型和高容错性而闻名。本学习资料书主要针对Hadoop的初学者,旨在提供全面的基础知识解析,帮助读者快速掌握...

    hadoop学习总结1-5

    总的来说,"hadoop学习总结1-5"这份资料可能涵盖了从Hadoop的基本概念到实际操作的各个方面,对于想要深入了解和掌握Hadoop的初学者来说,是一份宝贵的参考资料。通过系统学习,可以逐步提升在大数据处理领域的专业...

Global site tag (gtag.js) - Google Analytics