`
lsw_1012
  • 浏览: 924 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

单机部署hadoop

 
阅读更多

单机部署Hadoop

 

一、系统及版本:CentOS release 6.8 (Final)

                            hadoop-2.8.1

                            JDK1.7(安装并配置环境变量)

        安装前提:ssh安装

 

单机模式:运行在一个单独机器上的独立Java进程,适用于开发或调试环境

 

二、添加用户以及用户组(尽量不适用root用户)

 

$ sudo adduser hadoop                           ##创建用户hadoop

$ sudo usermod -G sudo hadoop                   ##hadoop用户添加进sudo用户组

 

三、配置SSH免密登录

 

$ su -l hadoop                                      ##切换至hadoop用户

$ ssh-keygen -t rsa -P ""                           ##配置SSH免密登录

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys   ##将公钥追加到authorized_keys

$ ssh localhost                                     ##验证

 

 四、Hadoop安装部署

 

1、下载Hadoop:http://hadoop.apache.org/releases.html

将hadoop复制准备安装的目录进行解压

    

$ tar -zxvf hadoop-2.7.1.tar.gz



 

 2、配置

 

配置环境变量



 

 
 重载生效

source  /etc/profile

 

修改配置文件(单机最简配置)

/hadoop-2.8.1etc/hadoop/hadoop-env.sh

 

/hadoop-2.8.1etc/hadoop/core-site.xml

 

/hadoop-2.8.1etc/hadoop/mapred-site.xml

 

 /hadoop-2.8.1etc/hadoop/hdfs-site.xml

 

配置完毕启动Hadoop

首先格式化NameNode,进入bin目录执行

./hdfs namenode -format

格式化成功后,进入sbin目录执行

 ./start-all.sh

 

启动成功后,浏览器访问

 

 

 

  3、测试(运行hadoop自带例子)

(1)创建数据

查看hdfs目录

 创建存放被计算文件的目录 /user/root/input,不要创建输入目录

 

 把需要计算的词汇文件拷贝到hadoop input目录



 

 

(2)执行Hadoop WordCount (词频统计)

 

$ ./bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.8.1-sources.jar org.apache.hadoop.examples.WordCount input output

 

 

 (3)查看生产的单词统计数据

 

(4) 获取结算结果到本地


 

五、问题

1、可能发生异常(不能加载本地库)

util.NativeCodeLoader: Unable to load native-hadoop library for your platform

解决:在/etc/profile与hadoop-env.sh文件加入

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_HOME=安装目录
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"
 
分享到:
评论

相关推荐

    在docker上部署hadoop集群

    教程:在linux虚拟机下(centos),通过docker容器,部署hadoop集群。一个master节点和三个slave节点。

    单机版hadoop安装(linux)

    单机版 Hadoop 安装(Linux) 单机版 Hadoop 安装是指在单台机器上安装 Hadoop 环境,以便快速入门 Hadoop 和了解 Hadoop 的基本原理和使用方法。在这个安装过程中,我们将创建 Hadoop 用户组和用户,安装 JDK,...

    单机下Hadoop部署与配置

    ### 单机下Hadoop部署与配置 #### 关于本教程 本文档旨在详细介绍如何在单节点环境下安装、配置并运行Hadoop集群的过程。通过本教程的学习,读者将能够掌握在Ubuntu Linux系统上搭建单机Hadoop集群的基本步骤,...

    Hadoop单机与集群部署笔记.docx

    ### Hadoop单机与集群部署知识点 #### 一、Hadoop单机系统版本安装配置 **1.1 配置前的准备工作** - **添加hadoop用户并设置密码:** - 在Linux环境下,首先需要创建一个专用的`hadoop`用户,并为其设置一个安全...

    第五课:hadoopwindow单机部署和试用-python验证码识别1

    第五课:hadoopwindow单机部署和试用-python验证码识别1

    Linux运维-运维课程MP4频-06-大数据之Hadoop部署-17hadoop单机部署.mp4

    Linux运维-运维课程MP4频-06-大数据之Hadoop部署-17hadoop单机部署.mp4

    Hadoop完全分布式配置.txt

    Hadoop的安装分为单机方式、伪分布式方式和完全分布式方式。 a. 单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件...

    Linux运维-运维课程MP4频-06-大数据之Hadoop部署-18hadoop单机部署应用测试.mp4

    Linux运维-运维课程MP4频-06-大数据之Hadoop部署-18hadoop单机部署应用测试.mp4

    Linux运维-运维课程MP4频-06-大数据之Hadoop部署-16hadoop单机部署介绍及软件包获取.mp4

    Linux运维-运维课程MP4频-06-大数据之Hadoop部署-16hadoop单机部署介绍及软件包获

    Linux下Hadoop单机配置文档

    ### Linux下Hadoop单机配置知识点详解 #### 一、环境搭建 1. **操作系统**: - 使用的系统为Red Hat Linux 9。 2. **JDK版本**: - 采用JDK 1.6,这符合Hadoop 0.20.1的要求,因为早期版本的Hadoop对JDK版本有...

    hadoop环境配置(单机集群)

    ### Hadoop环境配置详解——单机集群篇 #### 一、引言 随着大数据时代的到来,Hadoop作为处理海量...希望本文能够帮助您更好地理解和掌握Hadoop的部署流程。未来,您可以基于这个基础进一步探索Hadoop的更多高级特性。

    hadoop-2.7.3.tar.gz arm

    Hadoop-2.7.3 arm平台麒麟操作系统部署,已编译支持snappy lz4压缩 Hadoop国产化部署 Linux version 4.19.90-vhulk2001.1.0.0026.ns7.15.aarch64 (root@mockbuild) (gcc version 4.8.5 20150623 (NeoKylin 4.8.5-36)...

    Hadoop 2.0安装部署方法

    安装部署Hadoop 2.0的流程包含以下步骤: 1. 准备硬件,即Linux操作系统。 2. 准备软件安装包,并安装基础软件,主要是JDK。 3. 将Hadoop安装包分发到各个节点的同一个目录下,并进行解压。 4. 修改配置文件,包括但...

    Hadoop环境安装设置(最简单的hadoop单机环境部署教程)

    Hadoop环境安装设置(最简单的hadoop单机环境部署教程) 安装前设置 SSH设置和密钥生成 安装Java.下载Java (JDK<最新版> - X64 ... 下载Hadoop.下载来自Apache基金会软件,使用下面 ... Hadoop操作模式 在单机模式下...

    hadoop单机版安装

    在IT行业中,Hadoop是一个广泛使用的开源框架,...在实际生产环境中,Hadoop通常部署在多台机器上,以实现更高的可用性和性能。在单机版中,虽然无法完全体验到这些特性,但它仍然是学习和测试Hadoop功能的良好起点。

    hadoop-0.20.205.0和hbase-0.90.5,集群和单机 安装配置

    ### Hadoop与HBase集群及单机安装配置详解 #### 一、背景介绍 随着大数据技术的发展,Hadoop和HBase成为了处理大规模数据集的重要工具。Hadoop是一种能够存储和处理大量数据的分布式计算框架,而HBase则是在Hadoop...

    第一步-hadoop-hadoop-2.7.3在centos7上部署安装(单机版).zip

    以上就是在CentOS7上部署Hadoop 2.7.3单机版、HBase单机版和整合Pinpoint的基本步骤。通过这个过程,你可以学习到分布式计算的核心概念,以及如何监控和优化分布式应用的性能。请根据自己的需求调整配置,以适应不同...

    hadoop-3.2.0部署及相关工具

    本篇文章将详细阐述如何部署Hadoop 3.2.0,并探讨与之相关的Eclipse插件及其在本地测试中的应用。 首先,我们来了解Hadoop的核心组件:HDFS(Hadoop Distributed File System)和MapReduce。HDFS是Hadoop的数据存储...

    hadoop及hbase部署与应用

    - 部署Hadoop有三种模式:本地单机模式、伪分布式模式和完全分布式模式。本地模式只用于开发和测试,不涉及分布式;伪分布式模式在一个节点上模拟分布式环境;分布式模式则是在多台机器上运行,适合生产环境。 - ...

Global site tag (gtag.js) - Google Analytics