04_hadoop1.x的分布式安装 - aren - ITeye博客

`

arenzhj

浏览: 67968 次
性别:
来自: 上海

最近访客更多访客>>

redsnower

ahuiii

以太_cpp

bigdesert

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

04_hadoop1.x的分布式安装

博客分类：

hadoop

04_hadoop1.x的分布式安装

阅读更多

1.hadoop的分布式安装过程
    1.1 分布结构    主节点(1个,是hadoop0):NameNode、JobTracker、SecondaryNameNode
                    从节点(2个,是hadoop1、hadoop2):DataNode、TaskTracker
    1.2 各节点重新产生ssh加密文件
    1.3 编辑各个节点的/etc/hosts，在该文件中含有所有节点的ip与hostname的映射信息
    1.4 两两节点之间的SSH免密码登陆
            ssh-copy-id -i hadoop1
            scp /root/.ssh/authorized_keys   hadoop1:/root/.ssh/
    1.5 把hadoop0的hadoop目录下的logs和tmp删除
    1.6 把hadoop0中的jdk、hadoop文件夹复制到hadoop1和hadoop2节点
            scp -r /usr/local/jdk   hadoop1:/usr/local/
    1.7 把hadoop0的/etc/profile复制到hadoop1和hadoop2节点，在目标节点中执行source /etc/profile
    1.8 编辑hadoop0的配置文件slaves，改为从节点的hostname，分别是hadoop1和hadoop2
    1.9 格式化，在hadoop0节点执行hadoop namenode -format
    1.10 启动，在hadoop0节点执行start-all.sh
    ****注意：对于配置文件core-site.xml和mapred-site.xml在所有节点中都是相同的内容。
2.动态的增加一个hadoop节点
    2.1 配置新节点的环境
    2.2 把新节点的hostname配置到主节点的slaves文件中
    2.3 在新节点，启动进程
            hadoop-daemon.sh start datanode
            hadoop-daemon.sh start tasktracker
    2.4 在主节点执行脚本 hadoop dfsadmin -refreshNodes
3.动态的下架一个hadoop节点

===================================================================================
1==
(1)hostname chaoren
(2)vi /etc/sysconfig/network
(3)vi /etc/hosts
192.168.1.130   hadoop0
192.168.1.131   hadoop1
192.168.1.132   hadoop2

2===
ssh-copy-id -i hadoop1
scp /root/.ssh/authorized_keys   hadoop1:/root/.ssh/
scp /root/.ssh/authorized_keys   hadoop2:/root/.ssh/

export JAVA_HOME=/usr/local/jdk
export HADOOP_HOME=/usr/local/hadoop
export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH

scp -r /usr/local/jdk   hadoop1:/usr/local/
scp -r /usr/local/hadoop   hadoop1:/usr/local/
scp -r /usr/local/jdk   hadoop2:/usr/local/
scp -r /usr/local/hadoop   hadoop2:/usr/local/

scp -r /etc/profile   hadoop1:/etc/profile
scp -r /etc/profile   hadoop2:/etc/profile
source /etc/profile

分享到：

05_ZooKeeper | 03_hdfs操作

2015-03-30 00:39
浏览 419
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

1.Hadoop入门进阶课程_第1周_Hadoop1.X伪分布式安装.pdf: ### Hadoop 1.X 伪分布式安装知识点概览 #### 1. Hadoop 简介 - **定义**: Apache Hadoop 是一个开源框架，它允许开发者通过简单的编程模型来处理大量的数据集，并且能够在集群服务器上进行分布式处理。 - **特点**...

大数据技术之Hadoop3.x-视频教程网盘链接提取码下载 .txt: Hadoop是大数据技术中最重要的框架之一，是学习大数据必备的第一课，在Hadoop平台之上，可以更容易地开发和运行其他处理大规模数据的框架。尚硅谷Hadoop视频教程再次重磅升级！以企业实际生产环境为背景，增加了更...

03 云计算与大数据培训课程_Hadoop2.x64位伪分布式安装指南（Ubuntu）.zip: 在本课程中，我们将深入探讨“Hadoop 2.x 64位伪分布式安装”这一主题，这是一项针对云计算和大数据处理的关键技术。Hadoop 是一个开源框架，它允许高效地存储和处理海量数据，而伪分布式安装模式是单台机器上模拟...

第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf: 第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件...

Hadoop2.x 深入浅出企业级应用实战: 模块二：Hadoop2.x分布式文件系统HDFS HDFS（Hadoop Distributed File System）是Hadoop的核心组件之一，专为大规模数据存储设计，具有高容错性、高吞吐量等特性。在本模块中，将详细讲解HDFS的设计理念、架构特点、...

hadoop 2.X 伪分布式配置文件: 这个压缩包文件“hadoop 2.X 伪分布式配置文件”是为在单个机器上模拟Hadoop集群的伪分布式环境而设计的。这种环境对于学习、测试和调试Hadoop组件非常有用，因为它避免了实际分布式环境中的复杂性，同时保留了主要...

sqoop-1.4.6.bin__hadoop-0.23.tar.gz: Sqoop 是一个开源工具，主要用于在关系型数据库（如 MySQL、Oracle 等）与 Hadoop 分布式文件系统（HDFS）之间高效地导入和导出数据。它弥补了传统 ETL 工具在大数据处理场景下的不足，提供了一种简单、灵活的方式来...

hadoop详细视频教程: 04_hadoop_hdfs1分布式文件系统04 05_hadoop_hdfs1分布式文件系统05 06_hadoop_hdfs1分布式文件系统06 07_hadoop_hdfs1分布式文件系统07 08_hadoop_hdfs1分布式文件系统08_io 09_hadoop_hdfs1分布式文件系统09_io 10...

Hadoop3.x系统文档: 文档中提到，与Hadoop 2.x相比，3.x版本在集群安装和配置方面基本变化不大，但具体到新版本的特性以及对默认端口的改变上，还是存在一些需要特别注意的地方。 #### 1. Hadoop 3.x集群安装知识在集群安装知识部分，...

win32win64hadoop2.7.x.hadoop.dll.bin: 标签“hadoop.dll”、“hadoop2.7.x”和“hadoop”进一步强调了这是关于Hadoop分布式文件系统（HDFS）的核心库文件。 Hadoop是一个开源框架，由Apache软件基金会维护，它允许分布式存储和处理大量数据。在这个场景...

hadoop3.x盘地址及官方其他版本下载地址.rar: Hadoop是Apache软件基金会开发的一个开源分布式计算框架，主要用于处理和存储海量数据。Hadoop 3.x系列是Hadoop的主要版本之一，相比之前的Hadoop 2.x，它引入了诸多改进和优化，提升了整体的存储性能和计算效率。在...

Apache Hadoop2.x 安装入门详解 PDF: Apache Hadoop是一个开源框架，主要用于...学习Hadoop 2.x的安装不仅涉及技术操作，更需要理解其背后的分布式计算原理。通过本教程，读者将能够掌握Hadoop的基础安装和使用方法，为进一步深入大数据处理打下坚实基础。

Hadoop2.X集群安装与配置: 在大数据处理领域，Hadoop是一个不可或缺的核心组件，它提供了分布式存储和计算的能力。Hadoop 2.x 是Hadoop发展的一个重要阶段，引入了许多关键改进，增强了系统的稳定性和可扩展性。本文将详细介绍如何在三节点...

hadoop3.x带snappy(可用于windows本地开发): Hadoop是一个开源的大数据处理框架，由Apache软件基金会开发，它使得在分布式环境中存储和处理大规模数据变得可能。而Snappy是一种高效的压缩和解压缩库，旨在提高数据处理的速度。【描述】"编译过的hadoop3.0版本...

Hadoop2.x版本完全分布式安装与部署: 本文将详细介绍Hadoop 2.x版本在完全分布式环境下的安装与部署过程。首先，搭建Hadoop完全分布式环境需要准备硬件环境。在这个案例中，需要准备三台安装有CentOS操作系统的机器。三台节点机需保证相互之间可以被...

spark-3.3.3-bin-hadoop3.tgz: 这个版本特别针对Hadoop 3.x进行了优化，使得它能够充分利用Hadoop生态系统中的新特性和性能改进。在本文中，我们将深入探讨Spark 3.3.3与Hadoop 3.x的集成，以及它们在大数据处理领域的关键知识点。首先，Spark的...

Hadoop 2.x: Hadoop 2.x 是一个开源的分布式计算框架，它是Apache Hadoop项目的最新版本，旨在提供高效、可扩展的数据处理能力。这个版本引入了若干关键改进，使得Hadoop更适合大数据处理的需求，提高了系统的性能和可用性。 **...

hadoop2.6_windows_x64.zip: 在Windows x64平台上安装Hadoop可能与在Linux系统上有所不同，因为Hadoop原本是为Unix-like系统开发的。然而，通过一些适配，Hadoop也可以在Windows环境下运行。这个压缩包"hadop2.6_windows_x64.zip"提供了适用于64...

hadoop2.7.x_winutils_exe&&hadoop;_dll: 1. **环境变量设置**：确保已设置HADOOP_HOME环境变量，并将其值指向Hadoop的安装目录。这使得系统能够找到winutils.exe和其他相关脚本。 2. **PATH变量**：将%HADOOP_HOME%\bin添加到系统PATH环境变量中，这样在...

初识Hadoop 2.x.pdf: 1. **安装Java**：Hadoop依赖于Java运行，因此首先需要在服务器上安装合适的Java版本。 2. **配置Hadoop环境**：包括设置`HADOOP_HOME`环境变量、配置`core-site.xml`、`hdfs-site.xml`等配置文件。 3. **格式化HDFS...

Global site tag (gtag.js) - Google Analytics