Hadoop-2.5.2在Win10上的伪分布式单节点配置 -

anhongyang125

浏览: 123996 次
性别:
来自: 沈阳

最近访客更多访客>>

yuanyuan7891

myharmony

xiaomabobo

zihai367

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop-2.5.2在Win10上的伪分布式单节点配置

博客分类：

hadoop

hadoop2 java

Hadoop-2.5.2可以在win10系统上直接运行，而不需要Cygwin。下面来介绍配置过程：

一、下载Hadoop-2.5.2

在http://hadoop.apache.org/releases.html网址中可以找到Hadoop的相关版本点击进行下载

二、解压下载后的文件

（如hadoop-2.5.2.tar.gz）到指定的目录，例如我的在

D:\hadoop\hadoop-2.5.2下。

三、配置相关文件

1、配置hadoop-env.cmd文件（该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop中）

用一种编辑器软件打开并在最后加上如下几句：

set HADOOP_PREFIX=D:\hadoop\hadoop-2.5.2
set HADOOP_CONF_DIR=%HADOOP_PREFIX%\etc\hadoop
set YARN_CONF_DIR=%HADOOP_CONF_DIR%
set PATH=%PATH%;%HADOOP_PREFIX%\bin

2、配置core-site.xml文件（该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop中）

<configuration>
   <property>
     <name>hadoop.tmp.dir</name>
     <value>/hadoop/sysdata/tmp</value>
   </property>
   <property>
     <name>fs.default.name</name>
     <value>hdfs://0.0.0.0:19000</value>
   </property>
</configuration>

3、配置hdfs-site.xml文件（该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop下

用一种编辑器软件打开并在内部编辑如下语句：

<configuration>
    <property>
         <name>dfs.replication</name>
         <value>1</value>
    </property>
    <property>
       <name>dfs.namenode.name.dir</name>
       <value>/hadoop/sysdata/hdfs/name</value>
    </property>
    <property>
       <name>dfs.datanode.data.dir</name>
       <value>/hadoop/sysdata/hdfs/data</value>
    </property>
</configuration>

4、配置mapred-site.xml文件（该文件在D:\hadoop\hadoop-2.5.2\etc\hadoop下）

用一种编辑器软件打开并在内部编辑如下语句：

<configuration>
   <property>
      <name>mapreduce.job.user.name</name>
      <value>%Administrator%</value>
   </property>
 
   <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
  
   <property>
      <name>yarn.apps.stagingDir</name>
      <value>/user/%Administrator%/staging</value>
   </property>
 
   <property>
      <name>mapreduce.jobtracker.address</name>
      <value>local</value>
   </property>
</configuration>

5、配置yarn-site.xml文件（该文件在e:/hadoop/deploy/etc/hadoop下）

用一种编辑器软件打开并在内部编辑如下内容：

<configuration>
 
<property>
   <name>yarn.server.resourcemanager.address</name>
   <value>0.0.0.0:8020</value>
</property>
 
<property>
   <name>yarn.server.resourcemanager.application.expiry.interval</name>
   <value>60000</value>
</property>
 
<property>
   <name>yarn.server.nodemanager.address</name>
   <value>0.0.0.0:45454</value>
</property>
 
<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>
 
<property>
   <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
   <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
 
<property>
   <name>yarn.server.nodemanager.remote-app-log-dir</name>
   <value>/app-logs</value>
</property>
 
<property>
   <name>yarn.nodemanager.log-dirs</name>
   <value>/dep/logs/userlogs</value>
</property>
 
<property>
   <name>yarn.server.nodemanager.remote-app-log-dir</name>
   <value>/app-logs</value>
</property>
 
<property>
   <name>yarn.server.mapreduce-appmanager.attempt-listener.bindAddress</name>
   <value>0.0.0.0</value>
</property>
 
<property>
   <name>yarn.server.mapreduce-appmanager.client-service.bindAddress</name>
   <value>0.0.0.0</value>
</property>
 
<property>
   <name>yarn.log-aggregation.retain-seconds</name>
   <value>-1</value>
</property>
 
<property>
   <name>yarn.application.classpath</name>
   <value>%HADOOP_CONF_DIR,HADOOP_COMMON_HOME%/share/hadoop/common/*,
   %HADOOP_COMMON_HOME%/share/hadoop/common/lib/*,
   %HADOOP_COMMON_HOME%/share/hadoop/hdfs/*,
   %HADOOP_COMMON_HOME%/share/hadoop/hdfs/lib/*,
   %HADOOP_COMMON_HOME%/share/hadoop/mapreduce/*,
   %HADOOP_COMMON_HOME%/share/hadoop/mapreduce/lib/*,
   %HADOOP_COMMON_HOME%/share/hadoop/yarn/*,
   %HADOOP_COMMON_HOME%/share/hadoop/yarn/lib/*</value>
</property>
 
</configuration>

至此，所有的配置文件都以完成，下面要进行环境变量的初始化和相关的验证

四、环境变量的初始化及相关启动

1、打开cmd命令窗口，先切换到D:盘下。用cd D:\hadoop\hadoop-2.5.2\etc\hadoop目录下，执行hadoop-env.cmd命令即可初始化环境变量了。