准备三台机器
vm101(namenode) vm102(datanode) vm103(datanode)
都下载好hadoop(1.1.x版本)以及jdk目录如下
/root/hadoop /root/jdk1.6.0_38
编辑三台机器的/etc/HOSTNAME分别为vm101,vm102,vm103,三台机器均配置/ets/hosts文件添加如下映射
192.168.1.101 vm101 vm101.site 192.168.1.102 vm102 vm102.site 192.168.1.103 vm103 vm103.site
在vm101上创建ssh-keygen -t rsa,将.ssh/id_rsa.pub追加到vm101,vm102,vm103的~/.ssh/authorized_keys里面,实现从vm101到vm101,vm102,vm103的自动登录(如果启动集群失败可能需要事先手动登录输入密码一次)
在vm101上编辑配置文件如下
#编辑conf/core-site.xml <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>fs.default.name</name> <value>hdfs://192.168.1.101:9000</value> </property> </configuration> #编辑conf/mapred-site.xml <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>mapred.job.tracker</name> <value>hdfs://192.168.1.101:9001</value> </property> </configuration> #编辑conf/hdfs-site.xml <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>dfs.replication</name> <value>3</value> </property> <property> <name>dfs.name.dir</name> <value>/root/opt/hadoop/var/namedir</value> </property> <property> <name>dfs.data.dir</name> <value>/root/opt/hadoop/var/datadir</value> </property> </configuration> #编辑conf/hadoop-env.sh export JAVA_HOME=/root/jdk1.6.0_38 #编辑conf/masters vm101 #编辑conf/slaves vm102 vm103
将conf/*拷贝到vm102,vm103两台机器。
在vm101上执行
bin/hadoop namenode -format
bin/start-all.sh
查看运行结果(namenode正常运行,datanode正常运行)
vm101:~/hadoop # jps 25091 NameNode 15110 DataNode 15514 TaskTracker 25284 SecondaryNameNode 25821 Jps 25374 JobTracker vm103:~ # jps 11150 TaskTracker 11043 DataNode 11468 Jps
相关推荐
Hadoop 集群架构搭建分析 Hadoop 集群架构搭建分析是指设计和搭建一个高效、可靠、可扩展的 Hadoop 集群环境,以满足大数据处理和分析的需求。本文将从概述、环境准备、环境搭建三个方面对 Hadoop 集群架构搭建进行...
Hadoop集群环境搭建是大数据处理的核心组件之一,本文将详细介绍Hadoop集群环境的搭建过程,包括集群规划、前置条件、免密登录、集群搭建、提交服务到集群等几个方面。 集群规划 在搭建Hadoop集群环境时,需要首先...
在大数据领域,Hadoop是一个广泛使用的开源框架,用于存储和处理海量数据。本文将详细讲解如何搭建一个...这个超详细的教程覆盖了从零开始到集群搭建完成的全过程,按照步骤执行,可以轻松掌握Hadoop集群搭建技术。
"hadoop集群环境的搭建" Hadoop 是一个开源的大数据处理框架,由Apache基金会开发和维护。它可以实现大规模数据的存储和处理,具有高可扩展性、可靠性和高性能等特点。搭建 Hadoop 集群环境是实现大数据处理的重要...
### 基于Hadoop集群搭建HBase集群详解 #### 一、引言 随着大数据技术的迅猛发展,海量数据的高效存储与处理成为企业关注的重点。Hadoop作为一款能够处理大量数据的基础框架,被广泛应用于各类场景之中。然而,在...
在Linux环境下搭建Hadoop集群是一项复杂但至关重要的任务,它为大数据...一旦集群搭建成功,就可以开始处理大规模的数据了。记住,实践是检验真理的唯一标准,多操作、多调试,才能更好地掌握Hadoop集群的搭建与运维。
本教程“Hadoop集群搭建详细简明教程”将带你逐步走进Hadoop的世界,了解并掌握如何构建一个高效稳定的Hadoop集群。 Hadoop是由Apache基金会开发的一个开源项目,其核心包括两个主要组件:Hadoop Distributed File ...
以上内容是Hadoop集群搭建的基础步骤和关键知识点,具体的实施过程中可能需要根据实际环境进行调整。提供的文档资料应详细记录了每一步的操作,帮助读者理解和实践Hadoop集群的搭建。通过这份文档,你可以学习到...
Hadoop集群搭建详解 Hadoop是一个开源的分布式计算平台,由 Apache 软件基金会开发,核心组件包括HDFS(Hadoop Distributed Filesystem)和MapReduce。HDFS是一个分布式文件系统,提供了对文件系统的命名空间和...
基于Centos7下的hadoop2.7集群的搭建。(在vmware中的2台虚拟机。)
脚本搭建hadoop集群 可以自定义主机名和IP地址 可以自定义安装jdk和hadoop(格式为*tar.gz) 注意事项 1、安装完jdk和hadoop请手动source /etc/profile 刷新环境变量 2测试脚本环境为centOS6,其他操作系统会有些...
在Linux环境下搭建Hadoop集群是一项复杂但至关重要的工作,它涉及到多个步骤,包括理解Hadoop的基本概念、配置网络环境、安装必要的软件以及调整系统参数。本文将深入探讨这些知识点。 首先,我们需要了解Hadoop的...
【标题】:“Hadoop集群服务搭建共6页.pdf” 这篇文档很显然是关于Hadoop集群服务的搭建教程,可能涵盖了从基础概念到实际操作的详细步骤。Hadoop是Apache基金会的一个开源分布式计算框架,广泛应用于大数据处理...
8. "HadoopCluster_Vol.10.rar"、"HadoopCluster_Vol.7.rar"、"HadoopCluster_Vol.8.rar":这些可能是Hadoop集群搭建过程的多个阶段,可能包含了更多关于集群管理、监控、优化等方面的内容。 综上所述,这个压缩包...
该文档提供了linux环境中搭建hadoop集群(大数据)的步骤,个人认为比较详细,供大家学习