`
suxain
  • 浏览: 19018 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

初识hadoop之hadoop 安装

阅读更多
本来是用word写的,里面有一些截图,可是iteye的编辑器上传图片不方便,所以,附件中是原版word文档

一、 Hadoop安装
1.1 hosts文件修改
在每个结点修改hosts文件,配置节点IP与别名
Vi /etc/hosts

1.2 建立hadoop用户
Useradd username  //添加用户
Passwd username   //为用户生成密码


1.3 生成公私钥密钥对
用hadoop 用户登录
在各个节点上,分别使用 ssh-keygen –t rsa –f  ~/.ssh/id_rsa来生成密钥
Cd ~/.ssh
cat id_rsa.pub  >> authorized_keys

1.4 密钥合并和相互复制
将各个节点的authorized_keys 合并,并分发到每个节点,如果是从本地免密码登录远程主机,则把本现的id_rsa.pub复制到远程主机。
1.5 安装hadoop
从mirror.bit.edu.cn 用hadoop用户解压到安装目录,
进入hadoop 的conf 目录:


1、 修改core-site.xml
2、

配置  fs.default.name 属性, 即namenode 节点IP和端口
Hadoop.tmp.dir hadoop临时文件目录,弱不配置,则使用操作系统的/tmp,重启后/tmp文件删除,必须重新 格式化hdfs,所以,需要自定义临时目录。

2、修改hdfs-site.xml


dfs.name.dir namenode文件存放目录,此目录在namenode节点
dfs.data.dir  dataNode 数据文件存放目录,应该目录分布在各dataNode 节点
dfs.replication 文件分割数量。小于等于 datanode数

3、修改mapred-site.xml



Mapred.job.tracker mareduce 作业跟踪器主机IP与端口,一般同namenodeIP,配置自定义

4、修改hadoop-env.sh


如图,找到 export_JAVA_HOME,去掉注释,并写上JDK路径

5、其它,在完全分布式安装中,还需要配置 master 和slaves master写nameNode的、slaves中写上各datanode的hostname,配置完后,将hadoop复制到集群中的其它节点。

配置完后,在 namenode上进入hadoop安装目录的bin 第一次使用,运行 hadoop dfs –format格式化文件系统,然后 使用 ./start-all.sh 来启动hadoop
成功启动后,输入JPS命令,如图:


因为我这里是伪分布式,所以namenode和datanode在同一台机上,若为完全分布式,则在datanode主机上查看datanode进程
二、HDFS 文件操作
1、命令行操作
1、列出hadoop 文件列表
Hadoop dfs –ls

详细的,查看API

分享到:
评论

相关推荐

    《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf

    《Hadoop大数据开发实战》教学教案—01初识Hadoop的内容主要涵盖了大数据的基本概念、核心需求以及Hadoop框架的初步介绍。在这个章节中,学习者将了解到大数据在当今信息化社会中的重要地位,并掌握大数据的基本特征...

    第1讲:初识hadoop

    第1讲:初识hadoop

    初识Hadoop 2.x.pdf

    1. **安装Java**:Hadoop依赖于Java运行,因此首先需要在服务器上安装合适的Java版本。 2. **配置Hadoop环境**:包括设置`HADOOP_HOME`环境变量、配置`core-site.xml`、`hdfs-site.xml`等配置文件。 3. **格式化HDFS...

    初识Hadoop.docx

    ### 初识Hadoop知识点详解 #### 一、大数据概览 **1. 大数据定义** - **概念解析**:大数据的概念并非特指某个具体的数据量级,而是指那些无法用传统的数据处理工具进行有效捕捉、管理和处理的数据集合。这种...

    day01_初识hadoop.pdf

    【IT十八掌徐培成】Hadoop第02天-01.Hadoop基础回顾-进程初识-webui.zip

    本资源"【IT十八掌徐培成】Hadoop第02天-01.Hadoop基础回顾-进程初识-webui.zip"聚焦于Hadoop的基础知识,特别是对Hadoop进程的理解以及如何通过Web UI进行监控。这里我们将深入探讨Hadoop的核心组件、进程架构以及...

    hadoop从入门到精通课件pdf

    1. **第三章:初识Hadoop 2.x** - Hadoop概述:介绍Hadoop的起源、发展及在大数据处理中的地位。 - Hadoop生态系统:包括HDFS、MapReduce、YARN、HBase、Hive、Pig等组件的基本概念和作用。 - Hadoop 2.x的新特性...

    Hadoop权威指南 第二版(中文版)

    第1章 初识Hadoop  数据!数据!  数据存储与分析  与其他系统相比  关系型数据库管理系统  网格计算  志愿计算  1.3.4 Hadoop 发展简史  Apache Hadoop和Hadoop生态圈 第2章 关于MapReduce  一个气象数据...

    Hadoop大数据管理实验详细参考文档

    在本套“Hadoop大数据管理实验详细参考文档”中,我们涵盖了从初识Hadoop到进行实际操作的全过程,旨在帮助新手快速入门大数据处理的世界。Hadoop是一个开源框架,主要用于处理和存储海量数据,它的核心组件包括HDFS...

    Hadoop权威指南中文版

    第一章:初识Hadoop 第2章 关于MapReduce 第3章 Hadoop分布式文件系统 第4章 Hadoop I/O 第5章:MapReduce 应用开发 第6章:MapReduce 的工作原理 第7章:MapReduce 的类型与格式

    HadoopDemo

    《HadoopDemo:初识与实践》 HadoopDemo是一个专为Hadoop初学者设计的项目,它通过一系列实例展示了Hadoop的核心功能和使用方法。Hadoop,作为大数据处理领域的重要框架,以其分布式、容错性和扩展性著称,是理解和...

    Hadoop阶段初识学习笔记

    ### Hadoop基础知识详解 #### 一、Hadoop概述 ...作为一种强大的大数据处理工具,Hadoop不仅提供了分布式存储和计算的能力,而且还具备高度的可扩展性和容错性,这使得它成为现代大数据处理领域的关键技术之一。

    Hadoop权威指南(中文版)2015上传.rar

    第1章 初识Hadoop 数据!数据! 数据存储与分析 与其他系统相比 关系型数据库管理系统 网格计算 志愿计算 1.3.4 Hadoop 发展简史 Apache Hadoop和Hadoop生态圈 第2章 关于MapReduce 一个气象数据集 数据的格式 使用...

    Hadoop开发者全集和proHadoop

    这些资料分为三个阶段,逐步深入,旨在帮助读者从初识到精通Hadoop的开发工作。 在《Hadoop开发者第一期》中,首先会介绍Hadoop的基础知识,包括它的起源、核心架构以及为什么它在大数据处理领域如此重要。这一部分...

    Hadoop 2.x

    **Hadoop 2.x 入门指南** Hadoop 2.x 是一个开源的分布式计算框架,它是Apache Hadoop项目的最新版本,旨在提供高效、可...通过学习"0101+初识Hadoop+2.x.pdf"这样的文档,你可以逐步掌握这个领域的核心概念和技术。

    Hadoop集群程序设计与开发教学大纲.docx

    1. **初识Hadoop**:讨论为何学习Hadoop,Hadoop与云计算和大数据的关系,所需基础知识,以及学习环境。这将帮助学生理解Hadoop的背景和应用场景。 2. **Hadoop基础知识**:涵盖Hadoop的简介、版本演进、HDFS、...

    hadoop hive 半自动安装脚本(初识shell脚本)

    为hive-0.11半自动安装脚本 使用前请先阅读本脚本注释部分 已有hadoop环境可使用本脚本 因为初识shell脚本 望大虾勿喷 如有不吝赐教者 不胜感激

    拥抱大数据——初识Hadoop,轻松应对海量数据存储与分析所带来的挑战

    在Linux环境下搭建Hadoop涉及到安装JDK、配置环境变量,然后下载并解压Hadoop安装包,进行Hadoop的配置,包括修改core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml等配置文件,最后启动Hadoop服务,...

Global site tag (gtag.js) - Google Analytics