最近在接触hadoop的项目,把总结出的配置方法写出来纪念一下,也方便后来人快速玩转hadoop。
首先在虚拟机中安装linux,我是用的redhad,然后装jdk:http://yushan.javaeye.com/blog/261148,接下来是关键部分:
一、hadoop安装:下载release版本hadoop0.20.1,解压到/home/hadoop/ 。
1.命令行下运行
#mkdir input cp conf/*.xml input
bin/hadoop jar build/hadoop-0.16.0-dev-examples.jar grep input output 'dfs[a-z.]+'
#cat output/*
2.修改conf/hadoop-site.xml文件
fs.default.name
localhost:9000
mapred.job.tracker
localhost:9001
dfs.replication
1
<!-- set to 1 to reduce warnings when <br /> running on a single node -->
3.修改ssh权限:
#ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
#cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
4.初始化并启动各节点:
#bin/hadoop namenode -format
#bin/start-all.sh
二、安装ant
ant为编译工具,用来编译hive源代码。
解压到/home/apache-ant1.7.1
修改/etc/profile文件添加如下行(各软件版本自行调整):
export ANT_HOME=/home/hadoop/apache-ant-1.7.1
export JAVA_HOME=/usr/java/jdk1.6.0_10
export HADOOP_HOME=/home/hadoop/hadoop-0.20.1
export JAVA_BIN=/usr/java/jdk1.6.0_10/bin
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$ANT_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JAVA_HOME JAVA_BIN PATH CLASSPATH
运行#source /etc/profile
#ant
显示
Buildfile: build.xml does not exist!
Build failed
ant安装完毕!
三、安装hive
未完待续。。。
分享到:
相关推荐
"虚拟机Ubuntu+Hadoop+hive安装教程" 本文档旨在指导用户安装 Ubuntu 操作...本文档指导用户安装 Ubuntu 操作系统、Hadoop 分布式计算框架和 Hive 数据仓库管理系统于虚拟机中,旨在帮助用户快速搭建大数据处理环境。
这个教程详细地指导了在虚拟机中搭建Hadoop和Hive环境的全过程,涵盖了从虚拟机的创建到软件的安装、配置和启动。对于学习和实验Hadoop和Hive的初学者来说,这是一个非常实用的指南。通过这个过程,你可以了解分布式...
- **解压Java包**:将Java安装包`jdk-7u51-linux-x64.tar`解压至`/opt`目录下,重命名为`java`。 - **配置环境变量**:编辑`/etc/profile`文件,添加Java环境变量: ```bash export JAVA_HOME=/opt/java export ...
根据提供的文件信息,本文将详细解析CentOS 7环境下Java 8、MySQL 8.0、Hadoop 3.2.4集群以及Hive 3.1.2的搭建过程。这一系列操作对于构建大数据处理平台至关重要。 ### 1. VMware虚拟机软件简介 - **概述**: - ...
在每台服务器上安装Java开发工具包,并设置JAVA_HOME环境变量,确保Hadoop可以找到JDK路径。 **9. Hadoop集群环境搭建** 解压Hadoop安装包,修改配置文件,包括core-site.xml,hdfs-site.xml,mapred-site.xml,...
在Windows环境下,我们经常通过虚拟机技术来搭建Linux环境,以便更好地运行和管理Hadoop集群。下面将详细介绍如何在Windows下的虚拟机内安装并使用Hadoop。 首先,你需要准备一个虚拟机软件,如VMware或VirtualBox...
- **硬件环境**:准备五台虚拟机服务器作为搭建环境: - `172.168.0.2`:主节点(NameNode) - `172.168.0.3`、`172.168.0.4`、`172.168.0.5`、`172.168.0.6`:从节点(DataNode) ##### 2. 配置SSH无密码登录...
在资源和环境准备阶段,需要下载CentOS 7.2的ISO镜像,Java的JDK(推荐1.8版本),以及Hadoop的压缩包(这里提到的是2.7.3版本,注意与Hive的兼容性)。了解Java基础知识对学习Hadoop非常重要,因为Hadoop框架主要由...
搭建Hadoop大数据处理环境涉及到多个步骤,包括安装和配置Linux操作系统、设置网络环境、安装Java、配置SSH、安装时间服务器以及部署HTTPD服务。以下是对这些知识点的详细说明: 1. **Linux基础**: - CentOS7是...
本教程旨在指导读者快速搭建一个基于Hadoop的大数据处理环境。适用于新手快速入门,节省时间和精力。在开始之前,请确保具备以下条件: - 已安装VMware Workstation或类似虚拟机软件 - 已安装CentOS 6.7 x64位操作...
对于零基础的学习者来说,Hadoop的学习可以划分为几个主要步骤:了解Hadoop基本概念、学习相关技术、搭建环境以及实操练习。 首先,了解Hadoop基本概念是入门的基础。Hadoop的主要组成部分包括HDFS(Hadoop ...
这篇文章将带领大家一步一步完成Hive的部署,从搭建Linux操作系统开始,到部署JDK、Zookeeper、Hadoop和Hive,详细讲解每一步的操作步骤。 首先,让我们来了解一下Linux环境的搭建。Linux环境的搭建是非常重要的,...
根据给定文件的信息,我们可以总结出以下几个重要的知识点: ...综上所述,通过本次实验,学生不仅能够学会如何在Linux虚拟机中搭建Hadoop集群,还能掌握Hadoop的基本使用技巧,为进一步学习大数据分析打下坚实基础。
将Hadoop安装包上传到Linux,解压缩后在`/home/hadoop/hadoop-3.3.5/etc/hadoop`目录下修改`hadoop-env.sh`文件,设置JAVA_HOME和HADOOP_HOME。 6. **配置Hadoop**: 除了`hadoop-env.sh`,还需要配置其他Hadoop...
2. 操作系统:Hadoop通常运行在Linux环境下,如Ubuntu、CentOS等。 3. Java环境:确保安装了JDK 8或更高版本,因为Hadoop是用Java编写的。 4. 网络配置:所有节点之间需要能互相通信,并且NameNode和DataNode间的...
因此,建议使用虚拟机或者Docker等解决方案来模拟Linux环境,以获得更稳定和兼容的Hadoop运行环境。 此外,Hadoop的核心组件包括: - **HDFS**: 分布式文件系统,提供了高容错性和高吞吐量的数据访问。 - **YARN**...
在Windows 10环境下搭建Hadoop 2.6.4分布式文件系统时,经常会遇到一些特有的挑战,因为Hadoop最初是为Linux环境设计的。不过,通过特定的工具和配置,我们可以在Windows上运行Hadoop。这个压缩包“win10下hadoop...
Hadoop2.7.7是Apache Hadoop发行的版本之一,专为Windows 7操作系统设计,使得用户在Windows环境下也能方便地搭建和运行Hadoop分布式文件系统(HDFS)和MapReduce计算框架。Hadoop是一个开源项目,由Apache软件基金...