hadoop学习笔记1

sunbin

浏览: 359855 次
性别:
来自: 深圳

最近访客更多访客>>

xiaomabobo

lch1985110

ganxiwen

u012363178

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

参考hadoop文档https://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/SingleCluster.html

1、本地模式下运行MapReduce

因hadoop是java编写的，本地模式仅需要配置java环境即可

配置文件etc/hadoop/hadoop-env.sh，设置java路径，既可允许

export JAVA_HOME=/usr/java/latest

ex：

$ mkdir input

$ cp etc/hadoop/*.xml input

$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar grep input output 'dfs[a-z.]+'

$ cat output/*

2、在HDFS模式下运行MapReduce

HDFS模式需要namenode和datanode运行方可以正常允许

先配置HDFS访问端口及文件存储位置

core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://域名或ip或主机名:9000</value>//hdfs 对外暴露端口

</property>

<name>hadoop.tmp.dir</name>

<value>/tmp/hadoop-${user.name}</value> //文件存储路径

</property>

</configuration>

配置每个文件的副本数量

hdfs-site.xml:

<name>dfs.replication</name>//副本存储个数

</property>

<name>dfs.nameservices</name> //dfs服务暴露的IP和端口

<value>域名或ip或主机名:9000</value>

</property>

<name>dfs.namenode.datanode.registration.ip-hostname-check</name>//启动namenode检查服务器

<value>false</value>

</property>

</configuration>

格式化文件系统

bin/hdfs namenode -format

启动namenode

sbin/hadoop-deamon.sh start namenode

启动datanode

sbin/hadoop-deamon.sh start datanode

以下已例子

ex：

bin/hdfs dfs -mkdir -p /usr/sunbin/mapreduce/wordcount/input

bin/hdfs dfs -ls -R /

bin/hdfs dfs -put wcinput/wcinput /usr/sunbin/mapreduce/wordcount/input

//-mkdir -p递归创建文件夹；-ls -R递归查看

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.X.X.jar wordcount /usr/sunbin/mapreduce/wordcount/input /usr/sunbin/mapreduce/wordcount/output

使用bin/yarn也可以执行。

3、通过yarn的调度执行MapReduce

设置yarn的java环境（可改可不改）、

yarn-env.sh

export JAVA_HOME=?

yarn主要是对节点（主机）的管理和对资源的分配，需要对nodemanager，resourcemanager进行配置

yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.hostname</name>

</property>

</configuration>

指定mapreduce的允许方式，这里mapreduce是运行在yarn环境里面

mapred-env.sh（可改可不改）

export JAVA_HOME=?

mapred-site.xml:

<name>mapreduce.framework.name</name>

</property>

</configuration>

指定允许的节点，在slaves配置机器因为是单节点，所以只写一个。

本机名或0.0.0.0或ip

以下是运行的示例

ex：

sbin/yarn-demon.sh start resourcemanager

sbin/yarn-demon.sh start nodemanager

bin/hdfs dfs -rm -r /usr/sunbin/mapreduce/wordcount/output

bin/yarn jar -rm -r /usr/sunbin/mapreduce/wordcount/output

分享到：

使用Maven 生成jar包多种方式 | jeesite工作流，已办任务无法读取修改

2018-11-16 14:06
浏览 471
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论