`
tmj_159
  • 浏览: 707518 次
  • 性别: Icon_minigender_1
  • 来自: 永州
社区版块
存档分类
最新评论

Hadoop 学习之一(前言)

阅读更多

好几次想集中精力去系统的学习下hadoop,各种原因每次都是表面看了几天,然后搭建了简单的例子就放弃了,到现在连例子和linux虚拟机镜像都让我安装系统给弄丢了,正好,大不了从头再来!

 

在外企环境下上班有至少两点好处:

一、常看英文,导致看官方文档速度有所上升。

二、时间比较充足,可以学习自己感兴趣的东西。

 

所以跟着官网学习hadoop,官网地址

http://hadoop.apache.org/docs/current/index.html

版本:V2.6.0

 

Overview

Apache Hadoop 2.6.0 是在2.x.y版本线中的一个小版本,构建在稳定的2.4.1。

下面是主要特性和提升的一个简要说明:

       Common

               使用HTTP proxy server认证提升,这会为通过一个proxy server访问WebHDFS带来好处。

               一个新的Hadoop度量sink 可以直接写入Graphte

               Specification work 致力于 Hadoop Compatible FileSystem

      HDFS

               支持POSIX类型的文件系统的属性

               使用OfflineImageViewer,客户端可以通过WebHDFS API访问一个fsimage

               NFS 网关有些提升和解决了一些bug,Hadoop portmapper 不在需要运行一个网关,而且网关可 以拒绝未授权的端口的连接。

               SecondaryNameNode,JournalNode 和DataNode webUI用时髦的HTML5和Javascript 提升了看起来更加时髦一点。

      YARN

               YARN的REST API 支持写和修改操作了,用户可以通过它们提交和关闭应用

               时间线存储在YARN,用来存储通用的信息和应用规格的信息,支持Kerberos的认证

               公平调度支持在动态的分层的用户队列中工作,用户队列可以在指定的父队列中动态的创建

 

明天继续:)

分享到:
评论

相关推荐

    Hadoop the definition guide

    这表明Hadoop是大数据处理领域的重要工具之一,并且与Spark存在联系,两者均用于处理大规模数据集。 3. 标签信息:“Hadoop”和“big data”:这两个标签揭示了书籍的主要内容方向和目标读者群体。标签“Hadoop”...

    Windows环境安装Hadoop.docx

    #### 一、前言 Hadoop是一个开源软件框架,用于分布式存储和处理大型数据集。虽然Hadoop主要为Linux/Unix环境设计,但在某些情况下,用户可能需要在Windows环境下进行学习或开发工作。本文将详细介绍如何在Windows...

    使用VMware安装Hadoop全过程

    随着大数据技术的发展,Hadoop作为处理海量数据的重要工具之一,在数据存储与处理领域占据了举足轻重的地位。为了更好地学习和掌握Hadoop平台,本文将详细介绍如何通过虚拟化软件VMware来搭建一个完整的Hadoop环境。...

    在Windows上使用eclipse编写Hadoop应用程序

    随着大数据技术的不断发展,Hadoop作为处理大规模数据集的重要工具之一,在企业和研究机构中得到了广泛应用。Hadoop主要由两个部分组成:Hadoop分布式文件系统(HDFS)和MapReduce计算框架。为了方便开发者在Windows...

    Hadoop2.6集群环境搭建,原来4G内存也能任性一次

    随着大数据技术的不断发展,Hadoop作为处理大规模数据集的重要工具之一,在各行业中得到了广泛的应用。本文将详细介绍如何在资源有限的情况下(例如仅有4G内存的笔记本电脑),通过合理配置搭建一个Hadoop2.6集群...

    hadoop文档

    1. **HDFS(Hadoop Distributed File System)**:Hadoop的核心之一,是一个分布式文件系统,能够将大型数据集分布在大量的计算机节点上,提供高吞吐量的数据访问。HDFS具有高容错性和高可用性,通过数据块复制实现...

    Hadoop权威指南(英文原版)

    《Hadoop权威指南》一书由Tom White撰写,是学习Hadoop的权威读物,本书在前言中由Hadoop项目的创始人之一Doug Cutting亲笔签名。作者Tom White详细介绍了Hadoop的各个方面,包括其架构、存储系统HDFS、数据处理模型...

    Hadoop专业解决方案-第13章Hadoop的发展趋势.docx

    - **MapReduce**:Hadoop的核心计算模型之一,用于大规模数据集的分布式处理。通过将任务分解成Map(映射)和Reduce(归约)两个阶段,实现对大量数据的有效处理。 **2. 现状与发展** - 近年来,为了降低...

    Hadoop大数据处理技术基础与实践1

    【Hadoop大数据处理技术基础与实践1】 Hadoop是一个开源的分布式计算框架,它源于谷歌的云计算和大...随着大数据产业的持续发展,Hadoop技术的学习和应用将变得越来越重要,这本书无疑为学习者提供了一个理想的起点。

    [Hadoop权威指南(第三版)].Tom.White.文字版.pdf

    本书是Hadoop领域内的经典之作,被视为学习Hadoop的重要参考资料之一。该版本为第三版,相较于之前的版本进行了大量的更新与改进,以反映Hadoop技术的最新发展。 #### 书籍内容概览 1. **前言**:介绍了Hadoop的...

    LDA漫游指南_前言.pdf

    它是自然语言处理、信息检索等领域的重要工具之一。 - **应用背景**:LDA算法由于其强大的数学理论基础和广泛的应用场景,在学术界和工业界均获得了高度认可。它可以用于文档分类、语料库分析、信息检索等多个方面...

Global site tag (gtag.js) - Google Analytics