`
DemoGilbete
  • 浏览: 5719 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

hadoop安装及配置流程

阅读更多

<div class="iteye-blog-content-contain" style="font-size: 14px"></div>

 

Hadoop环境配置以及安装过程:

<!--[1、Linux系统安装,以及网络的搭建

1.1 网络的选择为host-only模式

1.2 启动vmwave的虚拟网络配置器

1.3修改ip地址,将VMware网络配置器中的iP地址设置成192.168.80.1,在Linux中网络连接中将连接更改为manual(自定义),并设定ip地址192.168.80.X,只需要网关为192.168.80.1

1.4 验证ip地址设定是否成功,在本机cmd模式下,ping 192.168.80.X,并在Linux中终端ping 192.168.80.1,若能ping通,则网络设置成功。

2、主机名的更改,绑定iP与主机名

2.1 执行命令hostname demo1,将主机名修改为demo1

2.2 执行命令vi /etc/hosts ,并将192.168.80.9  demo1, 添加至文件中,保存并退出

2.3 执行命令 vi /etc/sysconfig/network ,hostname 的值修改为demo1,保存退出

2.4 执行命令source /etc/sysconfig/network ,激活文件

3、安装jdk

3.1 拷贝文件,使用winscpjdk文件、Hadoop文件拷贝至/usr/local 文件下

3.2 执行命令 ./jdk-6u24-linux-i585.bin得到文件jdk-----

3.3 执行命令mv jdk----   jdk 将文件名修改为jdk

3.4 配置环境变量 执行vi /etc/profile 打开文件profile,并添加

Export JAVA_HOME=/usr/local/jdk

Export PATH=.:$PATH:$JAVA_HOME/bin

3.4 保存关闭后,在shell命令下执行source  /etc/profile 来激活配置文件

3.5 使用JavajavacJava -version来验证是否安装成功

4、关闭防火墙

4.1 执行命令service iptables status 来查看防火墙的状态消息

4.2 执行命令 service iptables stop 来关闭防火墙

4.3 执行命令chkconfig iptables off 来关闭防火墙的自动运行

4.4 执行命令chkconfig --list | grep iptables 来查看是否关闭服务自动启动设置

5、设置SSH免密码登陆

5.1 执行命令 cd /root/.ssh 切换到文件.ssh文件下

5.2 执行命令ssh-keygen -t rsa 来创建公钥,ssh-keygen -t  rsa”表示使用 rsa 加密方式生成密钥

5.3 执行命令cp id_rsa.pub authorized_keys 将文件复制至authorized_keys

5.4 验证连接 ssh localhost ,并执行exit返回至.ssh文件下

6、安装Hadoop

6.1 执行命令 tar -zxvf hadoop-1.1.2.tar.gz 解压Hadoop压缩文件

6.2 执行命令mv hadoop-1.1.2 hadoop 将文件名修改为Hadoop

6.3 修改环境变量 :执行命令 vi  /etc/profile,添加

Export  HADOOP_HOME=/usr/local/hadoop

修改  PATH=.:$HADOOP_HOME/BIN:$JAVA_HOME/BIN:$PATH(在配置环境变量时PATH=.....必须放在最后,否则将无法识别在PATH后面的变量)

2014-08-18

Hdfs文件系统下的命令:

Hadoop fs -ls:显示hdfs下的文件

Hadoop fs -lsr:递归查询hdfs系统下所有的文件

Hadoop fs -mkdir ./d1:hdfs系统的home目录下创建一个文件夹d1

Hadoop fs -put <原路径> <目的路径>:把数据上传到目的路径

Hadoop fs -get <原路径> <目的路径:把数据从原路径下载到目的路径下

Hadoopfs -tetx <文件>:查看文件

Hadoop fs -rm:删除文件

Hadoop fs -rmr :删除目录

<!--EndFragment-->
分享到:
评论

相关推荐

    Hadoop快速安装配置流程及文件

    Hadoop快速安装配置流程及文件

    Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程

    Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程 按照文档中的操作步骤,一步步操作就可以完全实现hadoop2.2.0版本的完全分布式集群搭建过程

    实验1 安装Hadoop.doc

    本环节重点在于让学生掌握Hadoop的安装配置流程以及基本使用方法,为后续的大数据分析任务打下坚实基础。通过实际操作加深对Hadoop分布式文件系统(HDFS)及MapReduce计算框架的理解。 ### 四、Hadoop的简单应用 #...

    hadoop安装与配置.pdf

    本文详细介绍了Hadoop的基本概念、核心组件以及安装配置流程。通过对Hadoop的理解和实际操作,可以帮助开发者更好地应对大规模数据处理的需求。此外,为了获得最佳性能和稳定性,建议深入学习Hadoop的高级配置选项,...

    hadoop 安装部署手册

    编写该手册的主要目的是为用户提供一个清晰、易懂的Hadoop安装和配置流程,确保用户能够顺利搭建Hadoop环境,从而开始大数据处理的学习和实践。 2. **安装前的准备** - **硬件环境**:Hadoop通常需要多台服务器或...

    Hadoop安装配置与部署运行

    - 配置Hadoop配置文件,如`core-site.xml`, `hdfs-site.xml`, `mapred-site.xml`等。 - 初始化HDFS,格式化NameNode。 - 启动Hadoop服务。 9. 开发与调试 - 使用Eclipse IDE和Hadoop插件,创建MapReduce项目。 - ...

    Linux下Hadoop伪分布式配置及操作命令

    以上知识点详细地阐述了在CentOS系统上配置Hadoop伪分布式环境的全过程,包括了环境准备、JDK安装、环境变量配置、Hadoop配置文件修改、SSH无密码登录配置、集群的启动和使用,以及常用命令的介绍。对于初学者来说,...

    HADOOP安装过程

    - 更新Hadoop配置文件`hdfs-site.xml`等。 **12. 密钥配置:** - 在Slave节点上复制Master节点的私钥,并添加到信任列表。 - 在JobTracker上复制Master节点的公钥,并添加到信任列表。 **13. 启动Hadoop:** - ...

    从零开始Hadoop安装和配置.rar

    说明,因为这里涉及到多台计算机的共同操作,对于主节点namenode 整篇文章照做,对于datanode节点,除了Hadoop的配置,其他照做,如果配置主机数为多太,只需在后更改hadoop配置文件即可 ________________

    hadoop1安装全套手顺

    本文将详细解读Hadoop1的安装过程,包括前期的准备工作以及各个步骤的具体操作,目的是帮助读者在安装Hadoop1时能够少走弯路,顺利安装和配置环境。 首先,安装Hadoop1需要满足一定的硬件和软件需求。在硬件方面,...

    hadoop安装配置共51页.pdf.zip

    【标题】:“Hadoop安装配置共51页.pdf”是一个关于Hadoop分布式文件系统安装与配置的详细教程,涵盖了从环境准备到集群搭建的全过程。Hadoop是Apache软件基金会的一个开源项目,它为大规模数据处理提供了可靠、可...

    部署全分布模式Hadoop集群 实验报告

    部署全分布模式Hadoop集群 实验报告一、实验目的 1. 熟练掌握 Linux 基本命令。...5. 配置全分布模式 Hadoop 集群。 6. 关闭防火墙。 7. 格式化文件系统。 8. 启动和验证 Hadoop。 9. 关闭 Hadoop。

    hadoop集群配置详解

    在datanode(Ubuntu系统)上,配置流程类似,但`slave`文件应为空,因为datanode不需要指定master。同样,核心和HDFS的配置文件需要根据集群需求进行相应调整。 总结起来,配置Hadoop集群涉及的主要步骤包括:系统...

    Hadoop安装配置流程.doc

    在本篇文档中,我们将详述Hadoop的伪分布式安装过程,这主要涉及以下几个关键步骤:设置共享文件夹、安装配置JDK、配置SSH安全连接,以及安装和配置Hadoop。 1. **设置共享文件夹**: 在VMWare中,我们需要在Linux...

    Hadoop分布式安装配置.docx

    Hadoop分布式安装配置 Hadoop是当前大数据处理的主流技术之一,由于其开源、可扩展、灵活的特点,广泛应用于大数据处理、数据分析、机器学习等领域。为帮助读者更好地理解Hadoop的安装配置,本文将从大数据概念、...

Global site tag (gtag.js) - Google Analytics