hadoop部署实践操作(伪分布式)
环境ubuntu
操作:
1安装好JDK(java基础,非本文重点)
2修改主机名,并绑定ip,关闭防火墙
假设修改主机名为aly
~# hostname aly (此方法及时生效,重启还原)
(此方法永久生效,包括重启,没测试)
# vi /etc/hostname
修改为 aly,保存退出。
现在ping主机名,ping不通,需要绑定ip
#ping aly (找不到)
# vi /etc/hosts
加上:(你的ip) aly,如114.215.104.** aly 保存退出。
#ping aly (是否ping的通)
关闭防火墙(这里测试以防万一,正式环境一般开启)
#sudo ufw status (查看状态)
#sudo ufw disable (关闭)
#sudo ufw enable (开启)
3配置ssh免密码登录模式
首先确定已经安装ssh,没有输入命令# sudo apt-get install ssh (安装)
# cd ~/.ssh (进入根目录的ssh隐藏文件夹,如果没有创建一个)
# ssh-keygen -t rsa (生成私钥id_rsa 公钥id_rsa.pub给对方,这里对方是自己)
# cp id_rsa.pub authorized_keys (意思是把公钥加到用于认证的公钥文件中,这里的authorized_keys是用于认证的公钥文件)
# ssh localhost (验证登录ssh)
# exit (退出)
4安装hadoop
下载hadoop-1.1.2并上传到服务器
# tar -zxvf hadoop-1.1.2.tar.gz (解压)
# vi /etc/profile (添加环境变量)
export HADOOP_HOME=/home/hadoop-1.1.2
export PATH=
$HADOOP_HOME/bin:$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
# source /etc/profile
修改/home/hadoop-1.1.2/conf下的4个文件
1.hadoop-env.sh (第9行export JAVA_HOME=/usr/java/jdk1.7.0_51 ##jdk安装路径)
注意:sh文件不要下载下来修改,这样会影响格式类型转换,直接使用vi修改
2.core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://aly:9000</value> <!-- 主机名 -->
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value> <!-- 指定文件系统依赖的基础配置路径 -->
</property>
</configuration>
3.hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>
4.mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>aly:9001</value> <!-- 主机名 -->
</property>
</configuration>
root@aly:/home/hadoop-1.1.2/bin#
hadoop namenode -format (启动格式化)
注意:多次格式化也是错误的,方法:删除/usr/local/hadoop/tmp文件夹,重新格式化
# start-all.sh (启动)
# stop-all.sh (关闭)
# jps (查看启动的java进程)
8450 SecondaryNameNode
8639 TaskTracker
8232 NameNode
8525 JobTracker
8341 DataNode
输入ip加端口
http://114.215.104.**:50070/ (NameNode)
http://114.215.104.**:50030 (Map/Reduce)
修改启动时警告
Warning: $HADOOP_HOME is deprecated.
在/etc/profile中加上
export HADOOP_HOME_WARN_SUPPRESS=1
分享到:
相关推荐
为此,【Hadoop部署实践】教学实施方案的提出,旨在通过系统性的教学与实践活动,培养学生的Hadoop系统基础知识和实际操作技能,尤其是其核心组件HDFS和MapReduce的应用能力。 该教学实施方案针对的是数据科学与...
本文档旨在介绍《Hadoop部署实践》课程的教学实施方案,该方案将通过理论与实践相结合的方式,全面提高学生的实际操作技能和数据处理能力。 首先,教学目标明确指出了三个核心方向。首先,学生需要能够独立部署...
教材需要与时俱进,及时反映Hadoop及相关技术的最新发展,而评价机制则需全面考虑学生的理论学习和实践操作能力,通过期末考核与平时成绩相结合的方式,公正地评价每位学生的综合表现。 总体而言,《Hadoop系统搭建...
在IT领域,Hadoop是一个广泛使用的开源框架,用于处理和存储大规模数据集。本文将详细介绍如何在基于Vmware 10.0的虚拟环境中,在一台服务器上安装...这对于学习和实践Hadoop和Spark的大数据处理能力提供了清晰的指导。
在大数据处理领域,Hadoop是一个不可或...随着技术的发展,现在还有更多高级工具如Spark、Flink等,但Hadoop作为基础,仍然是大数据领域不可或缺的一部分,理解其工作原理和实践操作对任何大数据从业者来说都是必要的。
### DELL的Hadoop部署方案 #### 概览与总结 本指南主要介绍了戴尔(Dell)与Cloudera联合提供的Apache Hadoop部署解决方案,旨在帮助用户更好地理解和实施Hadoop集群部署。该文档覆盖了从硬件配置到软件安装、再到...
学习云计算不仅涉及理论知识,更侧重于实践操作,以理解如何有效地管理和利用这些资源。Hadoop作为大数据处理的重要工具,与云计算紧密相连,常在云环境中部署,以处理海量的数据。 首先,我们要理解云计算的基本...
通过实践操作,你可以深入理解Hadoop的工作原理,并为后续的Hadoop开发打下坚实的基础。 2. 术语、定义和缩略语 - Hadoop:一种开源的分布式计算框架,由Apache基金会开发,用于处理和存储大量数据。 - MapReduce:...
11. **最佳实践**:最后,了解和遵循最佳实践是确保Hadoop HA部署稳定的关键,这包括定期维护,监控系统性能,以及对配置进行定期审计。 在实际操作中,部署和测试Hadoop多节点HA环境是一个复杂的过程,需要对...
通过本实验的学习和实践,我们不仅掌握了Hadoop的基本原理和关键技术,还能够独立完成Hadoop集群的安装与配置。这对于进一步探索大数据领域的其他技术和应用具有重要意义。未来,随着数据量的持续增长和技术的不断...
标题 "Hadoop部署及管理内含源码以及说明书可以自己运行复现.zip" 提供了关于这个压缩包的核心内容:它包含的是有关Hadoop部署和管理的资源,其中包括源码和说明书,允许用户自己运行和复现教程中的步骤。...
根据给定的文件标题、描述、标签以及部分内容,本文将详细介绍如何进行Hadoop 2.4.1集群的部署步骤。对于初次接触Hadoop集群搭建的学习者来说,本指南将提供一个全面且易于理解的过程。 ### 一、准备工作 #### 1. ...
Hadoop安装部署手册是针对初学者的全面指南,旨在帮助用户了解和实践Hadoop的安装与运行。Hadoop是一个开源的分布式计算框架,由Apache基金会开发,主要用于处理和存储大规模数据集。以下是详细的步骤和关键知识点:...
实验2的目的是在Hadoop平台上部署WordCount程序,以此来理解和体验云计算的基础应用。这个实验主要涉及以下几个关键知识点: 1. **Linux系统基础**:实验要求学生具备Linux系统的使用知识,包括基本的命令行操作、...
总的来说,Hadoop和HBase的部署与学习是一个涵盖网络、操作系统、分布式系统、数据库等多个领域的综合过程。理解其基本原理和操作流程,对于大数据处理和分析至关重要。在实践中,你可能需要不断地调试和优化配置,...
总的来说,这个资源对于想要学习或实践Hadoop及相关组件的人来说,是一个非常实用的起点,无需从零配置,可以直接在预设环境中进行实战操作,深入理解大数据处理的各个环节。无论是初学者还是经验丰富的开发者,都能...
【分布式计算开源框架Hadoop入门实践】 Hadoop是Apache开源组织开发的一款分布式计算框架,它在业界得到了广泛应用,尤其在大型互联网公司如亚马逊、Facebook和Yahoo等中扮演着重要角色。Hadoop的核心设计理念是...
本文档旨在为初学者提供一个清晰、详尽的Hadoop部署流程,包括单机伪分布模式和多节点集群的安装与配置,帮助读者快速理解Hadoop的核心概念和实际操作。 1.2 背景 在Linux环境下部署Hadoop,需要对操作系统有基本的...
【Hadoop部署大报告】 在IT领域,大数据处理和分析是一个关键部分,而Hadoop作为开源的大数据处理框架,扮演着至关重要的角色。本报告主要讲述了如何在虚拟机上安装和部署Hadoop及其相关的组件,如JDK、Zookeeper和...
【Hadoop部署手册】 在大数据处理领域,Apache Hadoop是一个不可或缺的开源框架,它提供了分布式存储和计算的能力。本手册将详细介绍如何在单机环境中安装和配置Hadoop 2.0.2,以便进行初步的实践操作和学习。 ###...