大数据系列12：Hadoop2 – 全新的Hadoop - 杨尚川的博客

yangshangchuan

浏览: 2483406 次
性别:
来自: 北京

最近访客更多访客>>

wangyy

akingde

feilafei123

wf_chn

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

大数据系列12：Hadoop2 – 全新的Hadoop

博客分类：

大数据

hadoop2 hadoopV2 大数据搜索引擎网络爬虫

tar -xzvf hadoop-2.2.0.tar.gz

cd hadoop-2.2.0

vi etc/hadoop/hadoop-env.sh

修改：

export JAVA_HOME=/home/ysc/jdk1.7.0_17

vi etc/hadoop/slaves

修改localhost为host001

vi etc/hadoop/core-site.xml

增加：

<name>fs.defaultFS</name>

</property>

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

vi etc/hadoop/mapred-site.xml

增加：

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.cluster.local.dir</name>

<value>/home/ysc/mapreduce/local</value>

</property>

vi etc/hadoop/yarn-site.xml

增加：

<name>yarn.resourcemanager.hostname</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

vi etc/hadoop/hdfs-site.xml

增加：

<value>/home/ysc/dfs/filesystem/name</value>

</property>

<value>/home/ysc/dfs/filesystem/data</value>

</property>

<name>dfs.replication</name>

</property>

sudo vi /etc/profile

增加：

export HADOOP_PREFIX=/home/ysc/hadoop-2.2.0

export HADOOP_COMMON_HOME=/home/ysc/hadoop-2.2.0

export HADOOP_MAPRED_HOME=/home/ysc/hadoop-2.2.0

export HADOOP_CONF_DIR=/home/ysc/hadoop-2.2.0/etc/hadoop

export HADOOP_HDFS_HOME=/home/ysc/hadoop-2.2.0

export HADOOP_YARN_HOME=/home/ysc/hadoop-2.2.0

source /etc/profile

格式化：

bin/hdfs namenode -format

启动dfs：

sbin/start-dfs.sh

启动yarn：

sbin/start-yarn.sh

启动historyserver：

sbin/mr-jobhistory-daemon.sh start historyserver

运行wordcount：

echo "APDPlat is a java open source project, Application Product Development Platform." > text1.txt

echo "Yang Shangchuan is the founder of APDPlat which won the "2013 Outstanding Open Source Project" award." > text2.txt

bin/hadoop fs -mkdir input

bin/hadoop fs -put text1.txt input

bin/hadoop fs -put text2.txt input

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount input output

访问管理页面：

ResourceManager: http://host001:8088

NodeManager: http://host001:8042

NameNode:http://host001:50070

停止dfs：

sbin/stop-dfs.sh

停止yarn：

sbin/stop-yarn.sh

停止historyserver：

sbin/mr-jobhistory-daemon.sh stop historyserver

注意：要把这里的主机host001和用户ysc替换为你自己的，在/etc/hosts文件中要把127.0.0.1 localhost改为实际IP地址 host001

APDPlat旗下十大开源项目

6
顶

1
踩

分享到：

Hadoop分布式文件系统HDFS和OpenStack对象 ... | 使用JSoup+CSSPath采集和讯网人物信息

2013-11-01 00:02
浏览 9303
评论(6)
分类:互联网
查看更多

6 楼咱不怕 2015-01-17

川哥,为啥hadoop2的版本+Hive或者Pig这些配置在管网找不到配置文档()...找了好多地方都没找到....(是不是我的方法有问题?).
求推荐...

5 楼 fighting_2013 2013-11-10

yangshangchuan 写道

fighting_2013 写道

yangshangchuan 写道

fighting_2013 写道

请问 hadoop 2.2.0 有 eclipse 插件吗？

看这：http://yangshangchuan.iteye.com/blog/1950158

我是想问有没有2.2.0这个版本下的Eclipse Plugin

没有

那如果Hadoop换成了2.2.0这个版本，要想在Eclipse里面像之前那几个版本一样开发，有没有什么好的方法？

4 楼 yangshangchuan 2013-11-10

fighting_2013 写道

yangshangchuan 写道

fighting_2013 写道

请问 hadoop 2.2.0 有 eclipse 插件吗？

看这：http://yangshangchuan.iteye.com/blog/1950158

我是想问有没有2.2.0这个版本下的Eclipse Plugin

没有

3 楼 fighting_2013 2013-11-10

yangshangchuan 写道

fighting_2013 写道

请问 hadoop 2.2.0 有 eclipse 插件吗？

看这：http://yangshangchuan.iteye.com/blog/1950158

我是想问有没有2.2.0这个版本下的Eclipse Plugin

2 楼 yangshangchuan 2013-11-09

fighting_2013 写道

请问 hadoop 2.2.0 有 eclipse 插件吗？

看这：http://yangshangchuan.iteye.com/blog/1950158

1 楼 fighting_2013 2013-11-09

请问 hadoop 2.2.0 有 eclipse 插件吗？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

大数据系列12：Hadoop2 – 全新的Hadoop

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

大数据系列12：Hadoop2 – 全新的Hadoop

评论

发表评论

相关推荐

数据生成器

分布式内存文件系统：Tachyon

大数据系列6：HBase – 基于Hadoop的分布式数据库

大数据系列1：在win7上安装配置Hadoop伪分布式集群

大数据系列11：Gora – 大数据持久化

大数据系列10：Spark – 内存计算

大数据系列5：Pig – 大数据分析平台

大数据系列4：Hive – 基于HADOOP的数据仓库

大数据系列9：Mahout – 机器学习

大数据系列8：Sqoop – HADOOP和RDBMS数据交换

大数据系列7：Storm – 流计算

大数据系列2：建立开发环境编写HDFS和Map Reduce程序

大数据系列3：用Python编写MapReduce

最近访客更多访客>>