`

在Ubuntu14.04下安装Hadoop2.4.0 (单机模式)

 
阅读更多

 

一、配置core-site.xml

    /usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。

    编辑器中打开此文件

    sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xml

     

 

 

    在该文件的之间增加如下内容:

    

        fs.default.name

        hdfs://localhost:9000

    

    保存、关闭编辑窗口。

    最终修改后的文件内容如下:

    

 

      

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

二、配置yarn-site.xml

    /usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce启动时的配置信息。

    编辑器中打开此文件

    sudo gedit yarn-site.xml

   

 

 

    

在该文件的之间增加如下内容:

    

        yarn.nodemanager.aux-services

        mapreduce_shuffle

    

    

        yarn.nodemanager.aux-services.mapreduce.shuffle.class

        org.apache.hadoop.mapred.ShuffleHandler

    

 

    保存、关闭编辑窗口

    最终修改后的文件内容如下

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

三、创建和配置mapred-site.xml

 

    默认情况下,/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件,我们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce使用的框架。

    

    复制并重命名

    cp mapred-site.xml.template mapred-site.xml

    编辑器打开此新建文件

    sudo gedit mapred-site.xml

 

 

 

 

  

 

在该文件的之间增加如下内容:

    

        mapreduce.framework.name

        yarn

    

    保存、关闭编辑窗口    

    最终修改后的文件内容如下

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

 

四、配置hdfs-site.xml

    /usr/local/hadoop/etc/hadoop/hdfs-site.xml用来配置集群中每台主机都可用,指定主机上作为namenode和datanode的目录。

 

    创建文件夹,如下图所示

 

 

 

 

 

 

 

   

 

 

   

你也可以在别的路径下创建上图的文件夹,名称也可以与上图不同,但是需要和hdfs-site.xml中的配置一致。

 

    编辑器打开hdfs-site.xml

    在该文件的之间增加如下内容:

    

    

        dfs.replication

        1

    

    

        dfs.namenode.name.dir

        file:/usr/local/hadoop/hdfs/name

    

    

        dfs.datanode.data.dir

        file:/usr/local/hadoop/hdfs/data

    

 

    保存、关闭编辑窗口

    最终修改后的文件内容如下:    

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

五、格式化hdfs

 

    hdfs namenode -format    

    只需要执行一次即可,如果在hadoop已经使用后再次执行,会清除掉hdfs上的所有数据。

六、启动Hadoop

 

    经过上文所描述配置和操作后,下面就可以启动这个单节点的集群    

    执行启动命令:

    sbin/start-dfs.sh    

    执行该命令时,如果有yes /no提示,输入yes,回车即可。    

    接下来,执行:

    sbin/start-yarn.sh    

    执行完这两个命令后,Hadoop会启动并运行    

    执行 jps命令,会看到Hadoop相关的进程,如下图:

      

      

 

 

 

 

 

 

 

 

 

浏览器打开 http://localhost:50070/,会看到hdfs管理页面

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

浏览器打开http://localhost:8088,会看到hadoop进程管理页面

 

 

 

 

 

 

 

 

 

 

 

 

 

 

七、WordCount验证

    dfs上创建input目录

    bin/hadoop fs -mkdir -p input

    

把hadoop目录下的README.txt拷贝到dfs新建的input里

    hadoop fs -copyFromLocal README.txt input

 

    运行WordCount

    hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output

    

 

 

可以看到执行过程

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

运行完毕后,查看单词统计结果

    hadoop fs -cat output/*

分享到:
评论

相关推荐

    ubuntu14.04 Docker离线安装包

    在Ubuntu 14.04上安装Docker是许多系统管理员和开发者的需求,尤其是在没有互联网连接或者网络环境受限的情况下。Docker是一个开源的应用容器引擎,它允许开发者将他们的应用及其依赖打包到一个可移植的容器中,然后...

    Ubuntu14.04下hadoop-2.6.0单机配置和伪分布式配置 - Reverse - 博客频道 - CSDN1

    在Ubuntu 14.04操作系统上配置Hadoop,无论是单机模式还是伪分布式模式,都是Hadoop初学者的重要步骤。Hadoop是一个开源的分布式计算框架,它允许在大量廉价硬件上处理大规模数据。这篇文章将详细介绍如何在Ubuntu...

    Ubuntu14.04离线安装NFS方法和安装包

    离线安装NFS在特定环境中很有用,但需要注意的是,这种方式可能不会自动处理依赖关系,所以在安装过程中可能需要手动解决这些问题。总的来说,理解和掌握NFS的工作原理以及如何在Ubuntu 14.04上离线安装和配置,对于...

    ubuntu14.04下Hadoop2.7.2安装.pdf

    【Ubuntu 14.04下Hadoop 2.7.2安装】 在Ubuntu 14.04操作系统中安装Hadoop 2.7.2是大数据处理的基础步骤,尤其对于学习和实验分布式计算环境至关重要。以下是详细的安装过程: ### 一、前提安装 1. **JDK安装**:...

    ubuntu14.04下Hadoop2.7.2安装.docx

    标题提及的文档是关于在Ubuntu 14.04操作系统上安装Hadoop 2.7.2稳定版的详细步骤。Hadoop是一个开源的分布式计算框架,广泛应用于大数据处理和分析。以下是根据描述和部分内容整理出的关键知识点: 1. **JDK安装**...

    ubuntu server 14.04上编译Hadoop 2.6.4

    通过以上步骤,您可以在 Ubuntu Server 14.04 上成功编译 Hadoop 2.6.4。整个过程中需要注意每一步的细节,特别是环境变量的配置和依赖库的安装。成功编译 Hadoop 后,您可以进一步配置集群并运行 MapReduce 任务。...

    ubuntu14.04安装gitlab.pdf

    Ubuntu 14.04 安装 GitLab 指南 GitLab 是一个用于仓库...本文介绍了如何在 Ubuntu 14.04 上安装 GitLab,并且对 GitLab 的配置进行了详细的介绍。GitLab 是一个功能强大且灵活的仓库管理系统,能够满足企业级的需求。

    Ubuntu 14.04安装配置NFS服务器

    在安装 nfs-kernel-server 的时候,也会安装 nfs-common。如果没有安装这个软件包,则需要执行以下命令: `apt-get install nfs-common` 配置共享的文件目录 创建一个共享的文件目录,例如 /home/share。使用以下...

    虚拟机+Ubuntu 14.04安装方法

    默认情况下,可以使用NAT网络模式,这样虚拟机可以访问网络同时宿主机的网络配置不会受到虚拟机的干扰。根据需要设置磁盘空间大小,注意分配足够大的空间,以避免运行过程中出现存储空间不足的问题。选择将虚拟磁盘...

    ubuntu14.04 默认root登陆

    在 Ubuntu 14.04 中,默认情况下 root 帐号是禁用的,这是为了安全考虑。但是在某些情况下,我们需要使用 root 帐号来进行系统管理和维护。下面我们将介绍如何启用 root 帐号、如何在终端模式下切换到 root 身份,...

    Ubuntu14.04离线安装ssh所需安装包deb

    1.按以下顺序执行安装 sudo dpkg -i openssh-client_6.6p1-2ubuntu1_amd64.deb sudo dpkg -i openssh-sftp-server_6.6p1-2ubuntu1_amd64.deb sudo dpkg -i libck-connector0_0.4.5-3.1ubuntu2_amd64.deb sudo dpkg -...

    Ubuntu14.04中安装配置bochs详解

    Ubuntu14.04中安装配置bochs详解。亲自安装成功。

    在ubuntu 14.04上安装php7.pdf

    ### 在Ubuntu 14.04上安装PHP 7的知识点详解 #### 一、环境准备与基础概念 - **Ubuntu 14.04**:这是一个基于Debian的Linux发行版,以其稳定性著称。它非常适合服务器部署,特别是在Web开发环境中。 - **PHP 7**:...

    在Ubuntu14.04上安装ELK

    在Ubuntu14.04上安装ELK,搭建步骤和过程中遇到的问题。

    四、ubuntu14.04+caffe环境安装1

    在安装依赖项的过程中,如果发现G++ 4.8也被安装了,可以使用`update-alternatives`将其设置为较低优先级,但根据描述,这部分在本次安装中未执行。 安装NVIDIA驱动通常通过Ubuntu的“软件和更新”设置来完成,选择...

    在ubuntu14.04系统中安装indigo版本ROS的教程

    配置Ubuntu软件仓库的目的是为了使系统能够访问到ROS的安装源,具体操作包括允许"restricted"、"universe"和"multiverse"三种安装模式。这些模式允许用户安装不同类型的软件包,包括有限支持的软件包、非商业软件包...

    Ubuntu 14.04版本 NFS 离线安装包

    以下将详细讲解如何在Ubuntu 14.04上进行NFS的离线安装,并介绍相关的依赖包。 首先,你需要下载Ubuntu 14.04的NFS离线安装包,这个包应该包含了NFS服务及其所有必需的依赖。在没有网络的情况下,你可以通过其他有...

    vscode_for_ubuntu14.04.zip

    Ubuntu 14.04系统下能用的vscode客户端(新版本在启动时无响应,且无法打开终端),版本号:code_1.42.1-1581432938_amd64.deb 使用方法:解压后执行sudo dpkg -i code*

    在ubuntu 14.04下安装GNU Radio

    ### 在Ubuntu 14.04下安装GNU Radio #### 安装背景及意义 GNU Radio 是一个开源软件开发工具套件,它提供了一个信号处理框架来构建软件定义的无线电应用。用户可以通过简单的图形界面或者Python脚本来组合现有的...

    ubuntu14.04LTS离线安装openssh所需要的介质

    ubuntu14.04LTS离线安装openssh所需要的介质,亲测有效。

Global site tag (gtag.js) - Google Analytics