Linux配置
1、配置ip地址:192.168.56.100/24
2、修改主机名:/etc/sysconfig/network
3、修改主机名和IP地址的映射:/etc/hosts
4、关闭防火墙: service iptables stop、chkconfig iptables off
reboot
解压命令:tar -zxvf
安装jdk
解压jdk后,在/etc/profile文件中配置环境变量
export JAVA_HOME=/usr/java/jdk1.7.0_79 export PATH=$PATH:$JAVA_HOME/bin
然后source该文件,然后查看jdk的版本,看是否配置成功
[root@centos1 bin]# java -version java version "1.7.0_79" Java(TM) SE Runtime Environment (build 1.7.0_79-b15) Java HotSpot(TM) Client VM (build 24.79-b02, mixed mode)
安装hadoop2.2.0
到该地址去下载,找stable或current目录,该目录为稳定版
http://archive.apache.org/dist/ http://archive.apache.org/dist/hadoop/core/stable/
解压文件,后开始配置hadoop,这里一共需要配置五个文件
文件一:hadoop-env.sh
位置:
hadoop-2.2.0/etc/hadoop
配置:
export JAVA_HOME=/usr/java/jdk1.7.0_79
文件二:core-site.xml
位置:
hadoop-2.2.0/etc/hadoop
配置:
<configuration> <!-- 制定HDFS的老大(NameNode)的地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://centos1:9000</value> </property> <!-- 指定hadoop运行时产生文件的存储目录 --> <property> <name>hadoop.tmp.dir</name> <value>/usr/hadoop/hadoop-2.2.0/tmp</value> </property> </configuration>
文件三:hdfs-site.xml
位置:
hadoop-2.2.0/etc/hadoop
配置:
<configuration> <!-- 指定HDFS副本的数量 --> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
文件四:mapred-site.xml
该文件并不存在,但是有一个mapred-site.xml.template存在,修改该文件的名称
mv mapred-site.xml.template mapred-site.xml
位置:
hadoop-2.2.0/etc/hadoop
配置:
<configuration> <!-- 指定mr运行在yarn上 --> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
文件五:yarn-site.xml
位置:
hadoop-2.2.0/etc/hadoop
配置:
<configuration> <!-- 指定YARN的老大(ResourceManager)的地址 --> <property> <name>yarn.resourcemanager.hostname</name> <value>centos1</value> </property> <!-- reducer获取数据的方式 --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
在/etc/profile 中添加hadoop环境变量
export HADOOP_HOME=/usr/hadoop/hadoop-2.2.0 export PATH=.:$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin
格式化hdfs,hadoop namenode -format 这个命令在hadoop2中已经过时了,格式化后会在hadoop-2.2.0/tmp目中生成一些文件
hdfs namenode -format
启动hadoop使用,这是需要属于秘密,每启动一个进程都需要输入一次密码
sbin/start-dfs.sh sbin/start-yarn.sh
启动后查看进程
[root@centos1 sbin]# jps 5129 SecondaryNameNode 5522 NodeManager 5552 Jps 5251 ResourceManager 4890 NameNode 4972 DataNode
192.168.56.100:50070 查看Namenode,访问Browse the filesystem时通过主机名,需要配置hosts文件
192.168.56.100:8088 查看yarn
配饰ssh免密码
#目录 /root/.ssh #生成rsa密钥和公钥 ssh-keygen -t rsa #生成的文件 -rw-------. 1 root root 1675 Sep 19 10:21 id_rsa -rw-r--r--. 1 root root 394 Sep 19 10:21 id_rsa.pub #copy公钥到认证文件中,文件名必须为 authorized_keys cp id_rsa.pub authorized_keys # -rw-r--r--. 1 root root 394 Sep 19 10:24 authorized_keys -rw-------. 1 root root 1675 Sep 19 10:21 id_rsa -rw-r--r--. 1 root root 394 Sep 19 10:21 id_rsa.pub #把本机的公钥copy给对方主机 ssh-copy-id 对方主机地址
相关推荐
总结来说,安装64位的Hadoop 2.2.0涉及下载源代码、配置编译环境、编译源代码、安装和配置Hadoop以及启动服务。这个过程对于理解和掌握Hadoop的工作原理非常有帮助,同时也能确保在64位Linux系统上顺利运行大数据...
此伪分布式搭建文件绝对正确,LZ亲自试验过。另,本文件为传智播客中使用文件,请勿用于商业用途,否则后果自负。
### Hadoop 2.2.0 部署详尽指南 #### 一、安装Linux **1. 安装wmware11** - **待补充:** 这部分需要更详细的说明来指导用户如何顺利安装wmware11,包括系统的最低配置要求、安装过程中需要注意的关键步骤等。 **...
hadoop2 - 虚拟机VMWare - Linux(ubuntu) ,单节点伪分布环境搭建快速手册,同之前上传的doc文档配套。
### Hadoop2.2.0 + HBase0.98.1 + Sqoop1.4.4 + Hive0.13 完全安装手册 #### 前言 随着大数据技术的发展,Hadoop已经成为处理海量数据的核心框架之一。本文旨在为读者提供一套最新的Hadoop2.2.0、HBase0.98.1、...
Hadoop2.2.0版本 - 虚拟机VMWare - Linux(ubuntu) ,多节点伪分布环境搭建详细操作手册,可以直接用于完全分布。每一步都有自己详细操作记录和相关说明,几夜风雨的辛劳搭建和测试。 此操作手册搭建的集群详细说明: ...
我们将基于提供的hadoop-2.2.0版本进行操作,并参考名为“hadoop2.2.0伪分布式搭建.txt”的指南文件。 首先,我们需要安装Java开发工具包(JDK),因为Hadoop是用Java编写的,依赖于JDK运行。确保你的系统已经安装...
3. Hadoop 伪分布安装配置 在单机上模拟分布式环境,便于学习和测试: 3.1 配置SSH免密钥登陆:实现节点间的无密码登录,简化操作。 3.2 Hadoop伪分布式配置: - 配置hadoop-env.sh:设置Hadoop相关环境变量,如...
6. "hadoop2.2.0伪分布式搭建.txt" - 这可能是一个文本指南,指导如何在单机环境下设置Hadoop的伪分布式模式,这是学习Hadoop的常见起点。 7. "分布式文件系统.txt" - 可能详细阐述了Hadoop分布式文件系统(HDFS)...
本话题主要聚焦于在单机环境中设置Hadoop的伪分布式模式,使用的版本为2.2.0。这种配置方式允许你在一台计算机上模拟多节点集群的行为,以便学习、测试或开发Hadoop相关应用。 首先,我们需要理解Hadoop的两个核心...
Hadoop 有三种模式:独立模式、伪分布模式、完全分布模式。Hadoop 主要由 NameNode(核心)、SecondNameNode、DataNode 组成。 Hadoop 在 Windows 上安装步骤: 1. 下载 JDK 1.8,并配置环境变量 JAVA_HOME=jdk ...
3,hadoop2.2.0:这里用于练习的是伪分布模式。4,完成内容:喜欢该商品的人还喜欢,相同购物喜好的好友推荐。1,通过sqoop从mysql中将“用户收藏商品”(这里用的是用户收藏商品信息表作为推荐系统业务上的依据,...
### Hadoop 2.2 伪分布环境搭建详解 #### 一、环境准备与配置 在搭建 Hadoop 2.2 的伪分布环境之前,首先需要进行一系列的基础环境准备及配置工作,确保 Linux 虚拟机能够正常运行并具备相应的网络设置。 ##### ...
在这个场景中,我们将关注Hadoop 2.2.0版本的伪分布式配置,这是一种在单台机器上模拟分布式环境的方式,便于测试和学习。 在Hadoop的配置文件中,有几个核心的参数需要我们重点关注: 1. **core-site.xml**:这是...
在 Windows 上安装 Hadoop 主要用于个人测试和学习,通常采用伪分布模式。安装步骤包括: 1. 安装 Java Development Kit (JDK) 并配置 `JAVA_HOME` 环境变量。 2. 将 Hadoop 添加到系统路径中,包括 `HADOOP_...
1. **Spark**:这里提供的是`spark-2.2.0-bin-hadoop2.7.tgz`,这是Spark 2.2.0版本的二进制包,内含了对Hadoop 2.7的兼容支持。Spark提供了编程接口,包括Scala、Java、Python和R,其中Scala是其原生语言,提供了最...