我的集群部署在局域网内部,与外网隔离开来。这个主要处于安全性考虑,在公网使用一段时间linux,你用 sudo cat /var/log/secure 查看安全日志会发现,每天都有一大堆居心不良的人在试探你的sshd服务。当然这个可以通过配置 sshd 来避免,不过还是谨慎为妙。
闲话少说,步入正题。我的网络结构是这样的:我的机器通过多IP配置与集群在一个网段,也可以在另一个网段通过拨号上网。我机器的操作系统是Fedora 13,集群上的机器是CentOS。
我快速部署的思路是这样的:在我的机器上下载cloudera.com上的hadoop安装包,然后在自己的机器上配置一个 yum 源,集群通过yum来批量升级和安装hadoop。
第一步,下载安装包和相关文件。
其实 cloudera 就有一个 yum源,查看一下http://archive.cloudera.com/redhat/cdh/3/ ,yum源的结构就很清晰了。
wget -mc http://archive.cloudera.com/redhat/cdh/3/
在当前文件夹下就有一个archive.cloudera.com的文件夹。
第二步,配置本地源。
mkdir /var/www/html/cloudera-hadoop
cp -r archive.cloudera.com/redhat/cdh/3 /var/www/html/cloudera-hadoop
这里是将对应的安装包和文件考到 web 目录下。
注意这里需要使用的 httpd 服务,没开启服务的话,使用service httpd start开启,没有apache软件的话,使用 sudo yum install apache安装。
然后自己做一个repo文件:
vi cloudera-hadoop.repo
内容:
[cloudera-cdh3]
name=Cloudera's Distribution for Hadoop, Version 3
baseurl=http://192.168.0.240/cloudera-hadoop/3/
gpgcheck = 0
192.168.0.240是我机器在集群网段的IP。
第三步,集群yum配置。
将cloudera-hadoop.repo拷到集群机器的 /etc/yum.repos.d/目录下。
然后在集群机器上更新yum: sudo yum update yum
在列表中看到 hadoop 的rpm包就差不多了。
接着,yum install hadoop-0.20 //安装hadoop主文件
yum install hadoop-0.20-<daemon type> //安装hadoop相关配置
sudo yum install <CDH3-component-name> //安装hadoop相关组件
这里可以参考cloudera官网的有关说明:
https://docs.cloudera.com/display/DOC/CDH3+Installation
除了主节点外,其他节点配置相同可以用集群管理命令 psh 批量安装。
分享到:
相关推荐
资源名称:云计算Hadoop:快速部署Hadoop集群内容简介: 近来云计算越来越热门了,云计算已经被看作IT业的新趋势。云计算可以粗略地定义为使用自己环境之外的某一服务提供的可伸缩计算资源,并按使用量付费。可以...
首先,我们来看任务1——Hadoop集群的部署。这一步至关重要,因为它为整个大数据处理系统提供了基础架构。在虚拟机中安装Ubuntu Kylin 16.04.4是常见的选择,因为这是一个稳定且支持Hadoop的Linux发行版。安装完成后...
Hadoop 集群部署操作 Hadoop 集群部署操作是指规划、安装和配置 Hadoop 集群的整个过程,以便在生产环境中运行 Hadoop 应用程序。下面是 Hadoop 集群部署操作的详细知识点: 规划 Hadoop 集群 * 规划主机名:...
部署全分布模式Hadoop集群 实验报告一、实验目的 1. 熟练掌握 Linux 基本命令。 2. 掌握静态 IP 地址的配置、主机名和域名映射的修改。 3. 掌握 Linux 环境下 Java 的安装、环境变量的配置、Java 基本命令的使用。 ...
最近要在公司里搭建一个hadoop测试集群,于是采用docker来快速部署hadoop集群。 0. 写在前面 网上也已经有很多教程了,但是其中都有不少坑,在此记录一下自己安装的过程。 目标:使用docker搭建一个一主两从三台机器...
"Hadoop集群部署方案" Hadoop 集群部署方案是指在分布式系统中部署 Hadoop 集群的详细步骤和配置过程。下面是该方案的详细知识点解释: 1. Hadoop 简介 Hadoop 是Apache软件基金会旗下的开源项目,主要用于大数据...
根据给定的文件标题、描述、...以上就是关于 Hadoop 2.4.1 集群部署的详细步骤。通过按照这些步骤进行操作,即使是没有经验的新手也能成功搭建起一个功能齐全的 Hadoop 集群。希望这篇指南能对您的学习和实践有所帮助。
总结来说,通过Ansible自动化安装Hadoop集群,可以极大地简化部署流程,减少手动操作出错的可能性,同时提高运维效率。了解并熟练运用Ansible的这一特性对于任何希望管理大规模Hadoop集群的IT专业人员都是极其重要的...
由于工作需要,最近一段时间开始接触学习 Hadoop 相关的东西,目前公司的实时任务和离线任务都跑在一个 Hadoop 集群,离线 任务的特点就是每天定时跑,任务跑完了资源就空闲了,为了合理的利用资源,我们打算在搭一...
里面讲了一些hadoo是如何部署与运维的知识点,希望对初学者有所帮助!
Hadoop集群安装部署的知识点总结如下: 1. Hadoop集群安装部署的目标: - 掌握Hadoop的集群安装配置方法; - 掌握SSH配置方法; - 掌握Hadoop集群服务启动与停止; - 会使用Hadoop集群运行简单的MapReduce计算...
本压缩包文件包含了一系列关于Hadoop集群部署、实战应用以及相关技术的详细资料,对于想要深入了解和掌握Hadoop技术的人来说,是非常宝贵的资源。 首先,我们来看《EasyHadoop集群部署文档.doc》。这份文档通常会...
教程:在linux虚拟机下(centos),通过docker容器,部署hadoop集群。一个master节点和三个slave节点。
2.3 Hadoop 集群的测试与优化一旦集群部署完毕,进行基本的功能测试是非常重要的,如创建文件系统目录、上传数据、运行 MapReduce 示例任务等。这些操作有助于验证 Hadoop 集群的正确性和可用性。同时,根据实际需求...
Hadoop集群部署完整版 Hadoop是一款开源的大数据处理框架,主要用于存储和处理大量的数据。Hadoop集群部署是指在多台服务器上部署Hadoop,以实现高可用性、高性能和高 Scalability的大数据处理。 Hadoop简介 ...
【Hadoop集群环境部署及应用】 随着大数据时代的到来,数据量呈现爆炸性增长,传统的单机处理方式已无法满足需求。Hadoop作为一个开源的分布式计算框架,基于云计算理念,为解决大规模数据处理提供了有效的解决方案...
hadoop2.9 伪集群安装部署 分析 打通免密登录 Zookeeper 集群搭建 Hadoop 伪集群搭建