hadoop分布式集群安装
1、配置ssh无密码登录
安装ssh后
将slaves的ip加入/etc/hosts中
执行cd ~ ,输入ssh-keygen后连续3次回车
cat .ssh/id_rsa.pub >> .ssh/authorized_keys
分发主机公钥
scp .ssh/id_rsa.pub root@slave:/root/master.pub
cat master.pub >> .ssh/authorized_keys
测试ssh slave
#ssh master
ssh-keygen -t rsa -p ''
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
for slave in $HADOOP_HOME/conf/slaves) do
scp ~/.ssh/id_rsa.pub root@slave:/root/master.pub
done
#for slaves
domain=""
master="192.168.0.100 $1 $domain"
slave="192.168.0.$3 $2 $domain"
ssh-keygen -t rsa -p ''
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
cat /root/master.pub >> ~/.ssh/authorized_keys
echo $master >> /etc/hosts
echo $slave >> /etc/hosts
mkdir /home/hadoop
#for master
for slave in $HADOOP_HOME/conf/slaves) do
scp $HADOOP_HOME root@$slave:$HADOOP_HOME
done
#sync conf
for slave in $HADOOP_HOME/conf/slaves) do
scp $HADOOP_HOME/conf/*-site.xml root@$slave:$HADOOP_HOME/conf/
scp $HADOOP_HOME/conf/masters root@$slave:$HADOOP_HOME/conf/
scp $HADOOP_HOME/conf/slaves root@$slave:$HADOOP_HOME/conf/
done
2、安装java1.6
到java官方网站下载解压版jdk1.6或以上
tar -xzf jdk-*-tar.gz
3、安装hadoop
下载hadoop-*-tar.gz 并解压
3、配置hadoop
vi /etc/profile
追加以下hadoop环境变量及hadoop快捷命令
export JAVA_HOME=/usr/jdk1.7.0_03
export HADOOP_HOME=/home/hadoop/hadoop-0.20.203
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
alias hls='hadoop fs -ls'
alias hcat='hadoop fs -cat'
alias hput='hadoop fs -put'
alias hget='hadoop fs -get'
alias hrmr='hadoop fs -rmr'
alias hmkdir='hadoop fs -mkdir'
alias hjar='hadoop jar'
修改bin/hadoop加入export JAVA_HOME=/usr/jdk1.7.0_03后分发
修改site.xml后分发
配置masters、slaves文件。
4、启动集群
start-all.sh
jps查看启动情况
查看master机器上的http服务是否与预期一致。
http://192.168.0.100:50030/查看jobtracker的情况,http://192.168.0.100:50070/查看dfs情况
5、测试集群
在master上执行以下命令测试测试dfs及mr。
hls /
hmkdir input
hput conf/*.xml input
通过hjar来执行wordcount来测试map reduce
hjar hadoop-example*.jar wordcount
分享到:
相关推荐
hadoop分布式集群安装,一主两从的hadoop集群,安装版本为3.2.x
Hadoop分布式集群配置指南 Hadoop分布式集群配置是大数据处理的关键步骤之一,本指南将指导读者成功配置一个由5台计算机构成的Hadoop集群,并成功运行wordcount处理大型数据(大于50G)。 一、Hadoop集群架构简介 ...
Hadoop分布式集群搭建的...总结来说,Hadoop分布式集群的搭建是一个涉及到硬件环境、软件安装、网络配置、系统参数调优等多方面知识的综合过程。搭建完成后,应该进行充分的测试以确保集群的稳定性和性能表现符合预期。
Hadoop分布式集群初次启动 本文档主要讲解了Hadoop分布式集群的初次启动过程,包括配置SSH免密登录、格式化HDFS、启动HDFS和YARN模块等步骤。 一、配置SSH免密登录 在Hadoop分布式集群中,需要配置集群中各个节点...
Hadoop 分布式集群初次启动 Hadoop 分布式集群初次启动是大数据处理中的重要步骤,本文将指导用户如何在虚拟机中搭建 Hadoop 分布式集群,并对其进行初次启动。 1. SSH 免密登录 在 Hadoop 分布式集群中,各个...
为了解决这些问题,本文提出了一种基于Hadoop的分布式集群大数据动态存储系统的设计方案。 首先,需要明确Hadoop在大数据处理中的地位和作用。Hadoop是一个开源的分布式存储和计算平台,它提供了一套完整的生态系统...
(85条消息) Hadoop分布式集群搭建(完整版)_卡布达暴龙兽的博客-CSDN博客_hadoop分布式集群搭建.htm
Hadoop 分布式集群初次启动 Hadoop 分布式集群初次启动是大数据处理的重要步骤,涉及到 Hadoop 集群的搭建、ssh 免密登录、HDFS 格式化、Hadoop 集群启动等多个知识点。本文将详细介绍 Hadoop 分布式集群初次启动的...
2. Hadoop分布式集群:Hadoop分布式集群是指运行Hadoop平台的多个计算机节点组成的集群,这些节点协同工作,共同处理大量数据。Hadoop的核心组件包括HDFS(用于存储数据)和MapReduce(用于处理数据)。 3. Hadoop...
Hadoop分布式集群参数配置 Hadoop分布式集群参数配置是大数据处理中不可或缺的一部分。本文将详细介绍Hadoop分布式集群参数配置的过程,包括master节点和slave节点的配置。 一、Hadoop分布式集群参数配置概述 ...
基于Hadoop分布式集群搭建方法研究的知识点包含以下几个方面: 1. Hadoop简介与大数据分布式基础架构: Hadoop是一个开源的大数据平台,由Apache软件基金会支持。它包括HDFS(Hadoop分布式文件系统)和MapReduce...
大数据之Hadoop分布式集群初次启动 在当前信息技术迅猛发展的背景下,大数据技术成为推动社会进步的重要力量。其中,Hadoop作为大数据领域最为流行的开源框架之一,它通过提供分布式存储与计算解决方案,有效地处理...
Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程 按照文档中的操作步骤,一步步操作就可以完全实现hadoop2.2.0版本的完全分布式集群搭建过程
Hadoop 分布式集群搭建.md
第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式...
Hadoop分布式集群容错验证
Hadoop分布式集群搭建过程中IP配置,包括单机伪分布式和多台机器集群搭建。同时包括VBox linux虚拟机网卡配置
在构建Hadoop分布式集群的过程中,有两个关键的组件是必不可少的:Java开发工具包(JDK)和Hadoop发行版。本资源包包含了这两个组件的安装文件,分别是`jdk-8u171-linux-x64.tar.gz`和`hadoop-2.7.5.tar.gz`,它们...
《Hadoop分布式集群大数据云计算源码视频教程》是一套深入解析Hadoop技术栈及大数据云计算实践的综合学习资源。该教程旨在帮助学习者理解和掌握Hadoop在分布式集群环境中的核心概念、工作原理以及实际应用,从而提升...