`

Hadoop从零开始(一)什么是Hadoop

 
阅读更多


古时候,人们用牛来拉重物,当一头牛拉不动一根圆木的时候,他们不曾想过培育个头更大的牛。同样,我们也不需要尝试更大的计算机,而是应该开发更多的计算系统。

                                                                                          ---------格蕾斯·霍伯

首先在了解Hadoop之前,先来看看以下数据:据IDC估计2006年“数字全球”项目的数据总量为0.18ZB,并且预测到2011年这个数字将达到1.8ZB,为2006年的10倍。1ZB相当于10的21次方字节的数据,或相当于1000EB,1000000PB,或者大家更熟悉的10亿TB的数据,这相当于世界上每个人一个磁盘驱动器的数量级。Hadoop架构作为MapReduce算法的一种开源应用,是应对海量数据的理想工具。

Apache Hadoop项目简介 

Core---- 一系列分布式文件系统和通用I/O的组件和接口(序列化、Java RPC和持久化数据结构)

Avro---- 一种提供高效、跨语言PRC的数据序列化系统,持久化数据存储。

MapReduce----分布式数据处理模式和执行环境,运行于大型商用机集群;

HDFS----分布式文件系统,运行于大型商用机集群;

ZooKeeper----一个分布式的、高可用性的协调服务;

Pig---- 一种数据流语言和运行环境,用以检索非常大的数据集,运行在MapReduceHDFS集群上;

Chukwa------ 分布式数据收集和分析系统;

Hive--- 分布式数据仓库,Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据;

Hbase---- -一个分布式的、列存储数据库。HBase使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询。

 

其中MapReduce和HDFS是Hadoop的核心

分享到:
评论

相关推荐

    Hadoop 从零开始(1) ——CentOS 安装配置

    在本文中,我们将深入探讨如何从零开始在CentOS操作系统上安装和配置Hadoop,这是一个分布式文件系统,为大数据处理提供了强大的支持。首先,我们需要理解Hadoop的基本概念和它的核心组件。 Hadoop是由Apache软件...

    从零开始学Hadoop教学PPT.rar

    这个从零开始学Hadoop的教学PPT涵盖了Hadoop生态中的主要组件和技术,包括大数据的概述、HDFS的工作原理、MapReduce的编程模型、Zookeeper的分布式协调作用、HBase的数据库特性、Flume的日志收集、Redis的内存数据...

    最短路径系列之一从零开始学习Hadoop

    Hadoop是一个由Apache基金会开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。它有以下几个核心组成部分: 1. Hadoop Common:包含...

    最短路径系列之一从零开始学习HADOOP

    最短路径系列之一从零开始学习HADOOP,只要有一台能上网的计算机,就可以让读者在最短的时间内,学会Hadoop的初级开发。所以,这本书只讲干货,也就是必须要知道的Hadoop的最核心知识点,包括如何搭建Hadoop,如何写...

    从零开始学Hadoop大数据分析.pptx

    《从零开始学Hadoop大数据分析》是一本由刘鹏等编写的书籍,本书基于作者多年的教学和实践经验,详细介绍了Hadoop在大数据分析中的应用。本书从零开始,逐步深入,不仅适合初学者快速上手,也有助于有一定基础的读者...

    从零开始搭建Hadoop2

    通过上述步骤,您可以从零开始搭建一个Hadoop2.7.1的分布式集群。此过程涉及到了环境配置、Java环境设置、SSH无密码登录配置以及Hadoop的基本配置与启动。通过实践这一过程,不仅可以掌握Hadoop的基础架构,还能深入...

    从零开始Hadoop安装和配置.docx

    ### Hadoop从零开始安装与配置详解 #### 一、事前准备 Hadoop是一种分布式计算框架,能够让数据处理能力分布在多个计算机节点上,从而提高数据处理效率和系统的可扩展性。本文将详细介绍如何从零开始搭建Hadoop...

    Hadoop.chm HadoopAPI Hadoop英文版最新API

    从零开始构建一个网络搜索引擎是一个很大的计划,并且往往会遇到很多的问题。不仅是因为编写一个爬虫并索引页面的软件比较复杂,而且,一个这样的项目需要一个专门的团队来实现。项目中也包含许多随时都需要修改的...

    从零开始部署hadoop_3.1.1集群.docx

    本文将详细讲解如何从零开始构建一个Hadoop 3.1.1集群,适用于初学者和有经验的IT从业者。 ### 1. 部署前期规划 在部署Hadoop集群前,你需要根据实际需求规划集群规模。一个小型Hadoop集群通常包括一个NameNode...

    hadoop入门最好的文档

    hadoop从零开始 细节问题细得不能再细 新手绝对入门的圣经 1.细细品味Hadoop_Hadoop集群(第1期)_CentOS安装配置 2.细细品味Hadoop_Hadoop集群(第2期)_机器信息分布表 3.细细品味Hadoop_Hadoop集群(第3期)_...

    金山云杨钢:拒绝Hadoop,从零开始做大数据

    在第四届中国云计算大会上,金山云CTO杨钢发表了《拒绝Hadoop,从零开始做大数据》的主题演讲,分享了金山云从无到有的技术演进。他透露,国内95%以上的网盘采用了Hadoop或直接购买存储设备,金山云偏偏没有采用大...

    Hadoop大数据零基础实战培训教程

    总之,《Hadoop大数据零基础实战培训教程》将带你全面了解和掌握大数据处理的各个环节,无论你是想要入门大数据领域,还是希望提升现有技能,这都是一份不可多得的学习资源。通过学习,你将能够熟练运用Hadoop生态中...

    学习hadoop--java零基础学习hadoop手册

    本手册旨在为完全没有Java基础的学习者提供一个从零开始学习Hadoop的路线图。Hadoop是一个能够处理大量数据的大规模分布式计算框架,其核心组件包括HDFS(Hadoop Distributed File System)和MapReduce。 #### 二、...

    王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第八讲Hadoop图文训练课程:Hadoop文件系统的操作

    首先,课程的初级阶段“从零开始”致力于让初学者无痛入门Hadoop。在这个阶段,学习者将学会处理Hadoop工程师日常编程工作所需的技能,为进入云计算大数据的美妙世界打下坚实的基础。教程中涉及的Hadoop文件系统的...

    从零开始搭建hadoop集群 视频 # 谭子

    视频时长一小时半,当然也可以看另外一条链接:https://share.weiyun.com/UOWqIx61,不过它会更长一些(链接是我自己电脑上搞的hadoop,挂在腾讯微云,可以直接看的。不过我还是比较推荐看这里的视频)

    云计算分布式大数据Hadoop实战之路-从零开始(第1-10讲)

    此教程来自于王家林免费发布的3本Hadoop教程:云计算分布式大数据Hadoop实战高手之路(共3本书):1,王家林编写的“云计算分布式大数据Hadoop实战高手之路---从零开始”带领您无痛入门Hadoop并能够处理Hadoop工程师...

    Hadoop实战之路--从零开始(第1-10讲)

    在本课程"云计算分布式大数据Hadoop实战之路--从零开始(第1-10讲)"中,我们将全面深入地探讨Hadoop这一核心的云计算大数据处理框架。Hadoop是Apache软件基金会开发的一个开源项目,其设计目标是允许在廉价硬件上...

    从零开始Hadoop安装和配置.rar

    hadoop安装与配置 Hadoop,说白了就是让我们计算机的算力可以进行分散,小唐这个月的搭建是真的,啊啊啊啊啊,为了让后人避免踩坑,以及后续自己也可以回来看看,就简单的说一下自己的搭建流程。 咱们首先准备好这些...

Global site tag (gtag.js) - Google Analytics