前提条件:
1.首先要使得要配成集群环境的几台机器安装jdk
2.在每台机器上安装ssh
3.在每台机器上安装hadoop
在这个基础上,再来配置各机器之间的分布实现。
首先来说明一下:Linux系统下jdk的安装吧!
因为要配置成集群环境,所以每台机器的jdk软件包的版本必须一致,当然,hadoop的jar包的版本也必须一致,不然,会出现意想不到的错误,我们组在配置时就犯了这个错误,还必须注意:每台机器jdk和hadoop解压后的文件夹也必须放到统一的目录下:jdk解压后放在/usr/local/java,hadoop解压后是放在/usr/local/hadoop中。
大致分为一下几个步骤:
1.从网站上下载:jdk软件包。我们组用的是:
2在/usr/local下建立java目录。
3.将jdk软件包复制到java目录中。
4.给jdk文件赋予权限,可以使得当前用户操作。
5.解压jdk软件包,进行安装。
在终端输入:sudo ./jdk-6u30-linux-i586.bin
6.配置环境变量。
sudo gedit /etc/profile
在这个文件中输入以下内容
:
7.重启计算机,查看jdk是否安装成功。
在终端输入: java -version
出现如上图所示:就表示:jdk已经安装成功。
安装ssh:
在终端输入:
sudo apt-get install ssh
sudo apt-get install rsync
ssh-keygen -t rsa -P ' ' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
然后验证是否安装成功:
ssh localhost
出现如下图所示:就表示安装成功。
安装hadoop:
1.将hadoop软件包复制到/usr/local中
2.解压该hadoop软件包到当前路径下:
sudo tar xzf hadoop-0.20.203.tar.gz
3.为了方便起见:将其重命名。
mv hadoop-0.20.203 hadoop
4.必须将该文件夹的权限赋给当前登录用户。
为了集群的方便管理,我们还可以建立一个hadoop组和hadoop用户(hadoop用户是在hadoop组下的)。
sudo addgroup hadoop(建立hadoop组)
sudo adduser -ingroup hadoop hadoop(创建hadoop用户,并将该用户归到hadoop组中)
给hadoop用户添加权限
sudo gedit /etc/sudoers
在该文件的root All=(All) All的下一行添加:
hadoop All=(All) All
以上表示:每台机器的准备工作已经做好。
再从这些机器中选取一台作为namenode节点.
1.必须使namenode能够无密码登录到其他的datanode节点。所以,要将namenode的公钥发送给其他datanode节点。在 namenode的终端输入:scp ~/.ssh/id_rsa.pub hadoop@机器名 ~/.ssh/authorized_keys
其原理就是:当namenode要无密码登录到其他datanode节点后,datanode就可以用namenode的公钥进行解密,从而之间可以进行通信。
2.配置hadoop环境
在集群中的每台机器的hostst文件将集群中所有机器的ip加入进来,由于ip太长,我们可以给ip做个映射,即:ip 机器名
在 namenode机器上的/usr/local/hadoop/conf的目录下新建masters和slaves文件。masters文件里将 secondarynode的机器名添加进去,masters文件里表明的是这个集群中谁作为备份节点。然后在slaves里面添加:所有 datanode的机器名。这个slaves和masters文件只需在namenode机器上创建。slaves文件里的内容代表:当namenode 启动时:可以自行也将其他datanode也启动。
然后配置:/usr/local/hadoop/conf/core-site.xml,将如下内容添加进去。
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
</configuration>
然后在配置:/usr/local/hadoop/conf/hdfs-site.xml,将一下内容添加进去。
<configuration>
<property>
<name>dfs.name.dir</name>
<value>/usr/local/hadoop/datalog1,/usr/local/hadoop/datalog2</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/usr/local/hadoop/data1,/usr/local/hadoop/data2</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
在配置:/usr/local/hadoop/conf/mapred-site.xml,将以下内容添加进去
。
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>master:9001</value>
</property>
</configuration>
然后,再将namenode的这个三个配置文件全部复制到其他datanode上去。
这样,集群环境就已经配置成功!
启动namenode节点。
在namenode结点的终端输入:sudo bin/hadoop namenode -format
bin/start-all.sh
停止hadoop进程。
bin/stop-all.sh
查看集群中有几个datanode,
bin/dfsadmin -report
感悟:由于这个集群环境是过年之前配置的,当时没有写文档,而且配置过程中遇到过很多问题,没有记录,导致现在重新回想这个过程,感觉很吃力。虽然集群配置环境只有这么几个步骤,但是,每一步配置的时候,会遇到各种问题。所以,各位在配置这个环境时,如遇到问题,请及时记录,以便以后好好研究。
- 大小: 18.2 KB
- 大小: 16.4 KB
- 大小: 10.4 KB
- 大小: 7.9 KB
分享到:
相关推荐
分布式与云计算Hadoop集群搭建是一个关于搭建Hadoop集群并实现map-reduce的实验PPT,附有详细的方法和步骤
2. **集群搭建**:选择合适的硬件资源并安装MongoDB。 3. **集群配置**: - 设定主从复制(Master-Slave)架构,以提高数据的可靠性和读取性能。 - 配置分片(Sharding)以提供更高效的存储和查询性能。分片允许...
通过搭建云计算集群实验平台,该模型能够验证最终的预测准确性。 时间序列预测算法本质上是一种回归预测算法。它的基本原理包括承认事务发展的连续性,并利用历史时间序列数据进行统计分析,根据关注点推测事务发展...
该文件讨论了如何综合应用各种云计算产品,搭建一个跨地域的PaaS云平台,主要解决私有云资源浪费和异地容灾问题。 文档提到的核心技术包括: 1. 容器技术:容器是一种轻量级、可移植、自给自足的软件打包技术,它...
通过系统性学习,学员不仅能够掌握Linux操作系统的使用,还能够精通虚拟化技术、云计算平台搭建、系统安全和性能调优等高级技能,为成为一名合格的云计算集群架构师打下坚实的基础。同时,课程还强调了运维实战技术...
### Hadoop云计算环境搭建知识点详解 #### 一、引言 - **编写目的**:本文旨在详细介绍搭建Hadoop云计算环境的全过程,以便于读者能够快速掌握并实施搭建工作。通过本指南,读者不仅可以了解必要的软件及其版本...
云计算平台的搭建与研究涉及的知识点非常广泛,包含云计算基础理论、分布式数据库技术、云平台环境搭建以及性能测试等多个方面。接下来将结合给定文件的描述和内容部分,详细阐述相关知识点。 ### 云计算基础 ...
搭建Kubernetes集群需要至少两台机器,一台作为主节点(Master Node),其余作为工作节点(Worker Node)。主节点负责整个集群的管理,包括调度容器的部署和运行,工作节点则是实际运行容器的主机。搭建过程通常包括...
本文主要围绕大型云计算数据中心的搭建及使用进行详细解读。 首先,云计算数据中心的建设背景和要求。云计算数据中心的出现是为了解决传统数据中心在资源利用、能效比、灵活性和成本效益方面的不足。随着大数据时代...
云计算是一种大规模服务器集群——“云”,通过网络为用户提供的一种按需付费使用并可以弹性扩展的服务模式。 1.2 云计算的分类 云计算可以按照服务对象分类为公有云、私有云、混合云。公有云为每一个进入到饭店的...
总结来说,基于Hadoop的云计算试验平台搭建研究涵盖了虚拟化技术、Linux操作系统、Java环境、Hadoop框架的安装配置以及故障恢复等多个方面,是大数据处理和云计算教学及研发的重要实践环节。通过这个平台,不仅可以...
本文档提供了完整的 Hadoop 云计算平台搭建过程,包括硬件要求、软件要求、网络拓扑图、安装环境简介、Hadoop 集群安装部署等方面的内容。 一、安装环境简介 Hadoop 云计算平台可以在 Linux 主机集群系统上得到...
在云计算环境中,多台虚拟机可能需要组成一个集群,例如在Hadoop场景中,会有NameNode(主节点)和DataNode(从节点)。为此,需要创建统一的用户组和用户,比如名为'hadoop'的用户,并为其赋予适当的权限。这通常...
HADOOP快速入门及搭建集群环境 HADOOP是一种分布式计算技术,旨在处理大规模数据集,能够将大规模数据处理工作分配到多个计算机节点上,从而提高数据处理速度和效率。本资源旨在指导读者快速入门HADOOP,并搭建集群...
云是互联网中由大量服务器集群提供的资源,主要包含云计算和云存储。云计算能够提供计算服务,包括数据处理和存储能力,而云存储则提供数据存储服务。云技术的目的是将信息、工具和应用程序存储在互联网上的虚拟空间...
【HCIE-Cloud云计算环境搭建指南】是华为认证专家(HCIE)在云计算领域的实践指导文档,主要针对希望获得HCIE-Cloud认证的专业人士。该指南详细阐述了如何构建一个符合HCIE-Cloud实验标准的云计算环境,为考生提供了一...