`
wang吖
  • 浏览: 239871 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop2.2.0的伪分布式搭建(可下载PDF附件)

阅读更多

目录

1. 简介

2. 所需软件

3. 安装环境配置

4. 安装JDK

5. 安装Hadoop2.2.0

6. 启动Hadoop

7. 验证HDFS是否可用

8. 设置免密码登

 

1. 简介

本文主要是介绍Hadoop2.2.0的伪分布式的搭建,通过伪分布式的搭建来认识Hadoop2.2.0主要进程,最后实现一个WordCount的单词计数。

2. 所需软件

1) 准备虚拟机VMware Workstation、CentOS6.4

2) Hadoop2.2.0的安装包,该安装包可以直接去Apache的官网上下载hadoop-2.2.0.tar.gz

3) jdk-6u24-linux-i586.bin  安装包

3. 安装环境配置

注意:为了操作方便,以下软件安装及操作均使用root用户进行操作,实际的生产环境是不可以使用root用户的。

1) 修改虚拟机IP

[root@localhost Desktop]# vi  /etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE="eth0"

BOOTPROTO="static"  ### 修改

HWADDR="00:50:56:2A:0E:A4"

IPV6INIT="yes"

NM_CONTROLLED="yes"

ONBOOT="yes"

TYPE="Ethernet"

UUID="2d678a8b-6c40-4ebc-8f4e-245ef6b7a969"

IPADDR="192.168.80.110" ### 修改

NETMASK="255.255.255.0"  ### 修改

GATEWAY="192.168.80.1"   ### 修改

 

 

2) 修改主机名

[root@localhost Desktop]# vi /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=hd01   ### 修改hd01可以自定义但是要和3)步骤中的映射保持一致

3) 修改主机名与IP的映射关系

[root@localhost Desktop]# vi /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.80.110  hd01  ## 添加ip与主机名的映射中间用空格或者tab键分割均可

 

4) 查看防火墙状态

 

5) 如果防火墙开启则关闭防火墙

[root@localhost Desktop]# service iptables stop

6) 设置防火墙开机不启动

[root@localhost Desktop]# chkconfig iptables off

7) 查看防火墙的状态(如果全是off则为开机不启动防火墙)

[root@localhost Desktop]# chkconfig iptables --list

iptables       0:off 1:off 2:off 3:off 4:off 5:off 6:off

 

8) 重启机器

[root@localhost Desktop]# reboot

9) 验证ip及主机名是否修改完成

Windows 下面使用ping 192.168.80.110 是否能ping通虚拟机

反过来用虚拟机ping 一下Windows的IP

10) 在Linux的根目录下面创建一个cloud目录,使用ftp工具上传jdk及hadoop安装包到该目录

至此安装环境准备完毕!!!

4. 安装JDK

使用root用户进入cloud目录

1) 安装jdk执行命令:

./jdk-6u24-linux-i586.bin

如果./jdk-6u24-linux-i586.bin无权限则授予可执行权限:chmod u+x ./jdk-6u24-linux-i586.bin

2) 配置jdk的环境变量

[root@hd01 ~]# vi /etc/profile

#### 在该文件下添加如下配置

export JAVA_HOME=/cloud/jdk1.6.0_24

export PATH=$PATH:$JAVA_HOME/bin

3) 刷新配置文件

[root@hd01 ~]# source /etc/profile

 

4) 验证安装jdk成功

[root@hd01 ~]# java -version

 

5. 安装Hadoop2.2.0

使用root用户进入cloud目录

1) 解压hadoop-2.2.0的压缩包

tar -zxvf hadoop-2.2.0.tar.gz

2) 配置Hadoop2.2.0的伪分布式,需要修改路径:/cloud/hadoop-2.2.0/etc/hadoop 下面的 5个配置文件

第一个:hadoop-env.sh  (修改第27行)

vi hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_60

 

第二个:core-site.xml

vi core-site.xml

<configuration>

<!-- 用来指定HDFS的老大(NameNode)的地址 -->

<property>

<name>fs.defaultFS</name>

<value>hdfs://hd01:9000</value>

</property>

<!-- 用来指定Hadoop用行时产生文件的存放目录 -->

<property>

<name>hadoop.tmp.dir</name>

<value>/cloud/hadoop-2.2.0/tmp</value>

</property>

</configuration>

 

第三个:hdfs-site.xml

<configuration>

<!-- 指定HDFS保存数据副本的数量 -->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

 

第四个:mapred-site.xml (首先改名:mv mapred-site.xml.template mapred-site.xml)

                然后修改mapred-site.xml

<configuration>

<!-- 告诉Hadoop以后MR运行在YARN上 -->

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

 

第五个:yarn-site.xml

<configuration>

<!-- NodeManager获取数据的方式是shuffle -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<!-- 指定YARN的老大(ResourceManager)的地址 -->

<property>

<name>yarn.resourcemanager.hostname</name>            

<value>hd01</value>

</property>

</configuration>

 

3) 将Hadoop添加到环境变量中

vi /etc/profile

export HADOOP_HOME=/cloud/hadoop-2.2.0

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin  

4) 刷新配置:

  source /etc/profile

5) 验证Hadoop是否安装成功:

[root@hd01 hadoop]# hadoop version

 

6. 启动Hadoop

1) 格式化hadoop

[root@hd01 cloud]# hdfs namenode –format

 

2) 启动HDFS和YARN (需要多次输入root用户密码)

[root@hd01 sbin]# ./start-all.sh

3) 启动完成验证进程是否启动成功(可以看到如下5个进程则启动成功)

[root@hd01 sbin]# jps

 

4) 使用浏览器验证:

HDFD的管理界面:  http://hd01:50070/dfshealth.jsp

 

YARN的管理界面:http://hd01:8088/cluster

 

7. 验证HDFS是否可用

1) 将/root/install.log上传到HDFS的根目录下面

[root@hd01 sbin]# hadoop fs -put /root/install.log hdfs://hd01:9000/

2) 通过浏览器查看是否上传成功

  成功!!! 

3) 运行Hadoop2.2.0安装包提供的wordcount对hdfs://hd01:9000/install.log进行单词计数

[root@hd01 mapreduce]# hadoop jar /cloud/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount hdfs://hd01:9000/install.log /out

 

4) 验证输出结果

 

  

至此Hadoop2.2.0的伪分布式搭建完成!!!

8. 设置免密码登录

1) 进入/root/.ssh 

[root@hd01 ~]# cd  ~/.ssh

2) 在~/.ssh中执行命令ssh-keygen -t rsa (一路回车下去):

[root@hd01 .ssh]# ssh-keygen -t rsa

 

3) 然后执行以下命令(输入一次密码):

[root@hd01 .ssh]# ssh-copy-id hd01

 

4) 此时在~/.ssh中将生成公私玥信息

[root@hd01 sbin]# cd ~/.ssh

[root@hd01 .ssh]# ll

 

 

5) 再次启动Hadoop将无需输入密码

 

分享到:
评论

相关推荐

    基于WoodandBerry1和非耦合控制WoodandBerry2来实现控制木材和浆果蒸馏柱控制Simulink仿真.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    (源码)基于Spring Boot框架的用户管理系统.zip

    # 基于Spring Boot框架的用户管理系统 ## 项目简介 本项目是一个基于Spring Boot框架的用户管理系统,主要用于实现用户的注册、登录、权限管理等功能。项目使用了Spring Security框架进行身份验证和权限控制,结合JWT(JSON Web Token)实现无状态的会话管理。此外,项目还集成了SQLite数据库,简化了数据库的安装和配置。 ## 项目的主要特性和功能 1. 用户管理 用户注册、登录、登出功能。 用户信息的增删改查操作。 用户密码的修改和重置。 2. 权限管理 使用Spring Security进行权限控制。 通过JWT实现无状态的会话管理。 动态配置权限白名单,允许特定URL无需认证访问。 3. 系统监控 获取服务器的基本信息,如CPU、内存、JVM状态等。 提供服务器重启功能。 4. 邮件服务

    基于springboot企业员工薪酬管理系统源码数据库文档.zip

    基于springboot企业员工薪酬管理系统源码数据库文档.zip

    Linux 操作系统3D显示性能测试工具 Glmark2

    Glmark2是Linux操作系统下广泛使用的3D图形性能测试工具,测试步骤: 1、搭建编译环境,安装必要的依赖项 sudo apt-get install g++ build-essential pkg-config sudo apt-get install libx11-dev libgl1-mesa-dev sudo apt-get install libjpeg-dev libpng-dev 2、执行配置、编译、安装命令: ./waf configure --with-flavors=x11-gl ./waf build -j 8 ##(8表示CPU核数) sudo ./waf install 3、终端中运行:$glmark2 4、等待测试完成(10min左右),结果分数越高,表示性能越好。

    (源码)基于物联网的地震预警系统.zip

    # 基于物联网的地震预警系统 ## 项目简介 随着自然灾害如风暴、地震、热浪和洪水等事件频率的增加,对这些事件的预测和了解的需求也日益凸显。本项目专注于地震预警系统,旨在利用物联网技术提供及时预警,对于保障安全和减少财产损失具有重要意义。 ## 项目目标 主要目标是开发一个能够检测地震早期预警信号的原型系统。该系统旨在通过可靠且高效的预警系统在地震多发区域提高安全性和应急准备。 ## 项目的主要特性和功能 1. 显示机制使用0.96英寸OLED显示屏和Adafruit NeoPixel Stick来展示地震数据。 2. 音频输出集成蜂鸣器以提供可听警告。 3. 电源来源采用Arduino Uno REV3作为电源。 4. 地震检测使用SW420振动传感器。 5. 时间保持引入DS3231实时时钟以准确记录事件。 6. 多级预警根据振动强度,系统能够触发不同级别的视觉和听觉警告。 ## 安装使用步骤 1. 硬件连接

    keil5.26开发编译环境

    keil5.26开发编译环境

    (源码)基于TensorFlow的中文文本分类系统.zip

    # 基于TensorFlow的中文文本分类系统 ## 项目简介 本项目是一个基于TensorFlow的中文文本分类系统,使用卷积神经网络(CNN)和循环神经网络(RNN)进行文本分类。项目涵盖了从数据预处理、模型训练、模型评估到模型预测的全流程,旨在提供一个高效的中文文本分类解决方案。 ## 主要特性和功能 数据预处理包括读取文件数据、构建词汇表、转换分类目录、将文本数据转换为ID序列表示等。 模型构建实现了基于CNN和RNN的文本分类模型,支持LSTM和GRU作为RNN的单元。 模型训练提供了详细的训练配置,包括学习率、批次大小、迭代轮次等参数的设置。 模型评估在验证集上评估模型的性能,输出准确率、损失等信息,并生成混淆矩阵。 模型预测加载训练好的模型,对新的文本消息进行分类预测,并输出预测类别。 ## 安装使用步骤 1. 环境准备 安装Python 23 安装TensorFlow 1.3以上

    基于springboot的智慧医疗采购系统源码数据库文档.zip

    基于springboot的智慧医疗采购系统源码数据库文档.zip

    【重磅,更新!】上市公司绿色专利等绿色发展数据合集(1991-2022年)

    1、资源内容地址:https://blog.csdn.net/abc6838/article/details/143896285 2、数据特点:今年全新,手工精心整理,放心引用,数据来自权威,且标注《数据来源》,相对于其他人的控制变量数据准确很多,适合写论文做实证用 ,不会出现数据造假问题 3、适用对象:大学生,本科生,研究生小白可用,容易上手!!! 4、课程引用: 经济学,地理学,城市规划与城市研究,公共政策与管理,社会学,商业与管理

    基于SpringBoot+Vue的志愿者招募管理系统源码数据库文档.zip

    基于SpringBoot+Vue的志愿者招募管理系统源码数据库文档.zip

    Ruby 学习教程(入门到实践)

    本教程介绍了 Ruby 的基础语法、面向对象特性和高级功能(如代码块、异常处理和元编程),并提供了练习任务及其答案,帮助您快速入门并熟悉 Ruby 的强大功能。通过完成这些任务,您可以轻松掌握 Ruby 编程的核心技能。

    (源码)基于C++的日志数据管理系统.zip

    # 基于C++的日志数据管理系统 ## 项目简介 本项目是一个基于C++的日志数据管理系统(DMS),主要用于在Linux环境下采集、处理和发送日志数据。系统通过读取日志文件、处理登录记录、匹配登录和登出记录,并将处理后的数据发送到服务器。项目结合了多线程技术,确保数据处理的效率和系统的响应性。 ## 项目的主要特性和功能 1. 日志读取与处理 读取日志文件并处理其中的登录记录。 匹配登录和登出记录,保存匹配和未匹配的记录。 处理字节序问题,确保数据准确性。 2. 日志数据发送 向服务器发送处理后的日志数据。 处理发送失败的情况,保存未成功发送的日志记录。 3. 多线程支持 使用多线程技术处理日志读取和发送,提高系统的并发处理能力。 通过线程间通信实现界面更新和数据处理。 4. 用户界面 提供基于Qt的客户端界面,用于显示数据和控制客户端操作。

    376大神asp.net城市出租车状态查询网站毕业课程源码设计

    编号:463 开发软件: Vs2008以上版本 数据库: sqlserver2005以上版本 开发语言和技术: C#结合三层开发模式 系统功能: 出租车管理查询系统开发设计要求能根据出租车的特点,时刻记录着车的实际位置,如经纬度、车速、方向,载客等情况,根据该系统可以方便用户快速的查询到车辆的状态位置等。因此要求系统具有录入、修正、查询、统计、分析等功能。采用asp.net和sqlserver来完成 出租车辆管理 出租车公司 驾驶员管理 模拟真实数据给一个录入模块根据时间查询其当时位置 前台可以查看车辆信息 驾驶员信息 出租公司信息 出租车运行路线查询 可以留言

    基于springboot的招聘求职系统源码数据库文档.zip

    基于springboot的招聘求职系统源码数据库文档.zip

    (源码)基于Arduino的温湿度监测显示系统.zip

    # 基于Arduino的温湿度监测显示系统 ## 项目简介 该项目旨在设计一个基于Arduino的温湿度监测显示系统。通过DHT11温湿度传感器采集数据,并通过LCD显示屏展示温度和湿度信息。此外,项目还包含一个简单的状态图标显示功能。整个系统采用Arduino Uno作为主控板,操作简单,便于用户随时查看当前环境的温湿度情况。 ## 项目的主要特性和功能 1. 温湿度监测使用DHT11温湿度传感器实时监测环境温湿度。 2. LCD显示通过LCD显示屏展示温度和湿度信息,支持两行显示,每行最多显示16个字符。 3. 状态图标根据当前温度展示不同的状态图标,用于快速了解当前环境状况。 4. 简单易懂界面简洁明了,操作方便,适合各种用户群体使用。 ## 安装使用步骤 1. 硬件准备准备Arduino Uno、LCD显示屏、DHT11温湿度传感器、i2c模块等硬件。 2. 连接硬件按照项目中的Pinout图连接各硬件组件。

    基于springboot高校创新创业课程体系源码数据库文档.zip

    基于springboot高校创新创业课程体系源码数据库文档.zip

    NS3中CSMA模型介绍和数据收发流程代码分析

    文档讲述了NS3中CSMA模型介绍(包括信道模型、网络设备、MAC和PHY等),并对CSMAHelper代码中数据收发处理流程、CSMA退避机制和状态机切换进行分析。

    IEEE 14节点标准模型的柴油发电机、光伏模型、电池储能系统、电弧炉等非线性负载复合微电网模型Simulink仿真.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    (源码)基于C语言的服务器集群健康检测系统.zip

    # 基于C语言的服务器集群健康检测系统 ## 项目简介 本项目是一个基于C语言的服务器集群健康检测系统。它通过客户端和服务器端的通信,实现服务器集群的健康状态监控。客户端定期向服务器发送心跳信号,服务器则接收并响应客户端的请求,以确保集群节点的可用性。同时,该系统还具备数据交互功能,允许客户端向服务器发送数据,服务器接收数据后进行处理并返回响应。此外,系统还包含恶意进程监控功能,以防范可能的恶意行为。 ## 项目的主要特性和功能 1. 心跳检测客户端定期向服务器发送心跳信号,以检测服务器集群的健康状态。 2. 数据交互客户端可以向服务器发送数据,服务器接收数据并处理,然后返回响应。 3. 恶意进程监控系统能够监控可能的恶意进程,确保服务器的安全。 4. 共享内存管理客户端和服务器使用共享内存进行通信和同步。 5. 日志记录系统的关键操作,如心跳检测、数据交互等,都会记录到日志文件中,以便于问题的追踪和调试。 ## 安装使用步骤

    (源码)基于C++的图书馆管理系统.zip

    # 基于C++的图书馆管理系统 ## 项目简介 本项目是一个基于C++开发的图书馆管理系统,旨在提供一个高效、易用的平台来管理图书馆的图书和用户。系统支持管理员、普通用户和游客三种用户模式,每种模式都有其特定的功能和操作权限。通过该系统,用户可以进行图书的借阅、归还、搜索以及查看借阅历史等操作,管理员则可以进行图书和用户的全方位管理。 ## 项目的主要特性和功能 ### 后端功能 用户管理包括用户的添加、删除、修改密码、查找等功能。 图书管理包括图书的添加、删除、修改信息、查找等功能。 借阅管理用户可以借阅和归还图书,系统会记录每本书的借阅历史。 排行榜提供图书借阅次数排行榜、读者借阅次数排行榜和最新出版图书排行榜。 ### 前端功能 用户交互通过终端命令行进行用户交互,支持多种操作选择。 数据读写系统启动时从CSV文件读取数据,退出时将数据写回CSV文件,确保数据实时更新。

Global site tag (gtag.js) - Google Analytics