看了很多博客,发现了一个最适合新手的,而且本人已经验证安装成功,链接如下:
http://www.powerxing.com/install-hadoop/
对安装过程中遇到的一些问题的补充
1. 将文件放入虚拟机中
不能直接将jdk安装包复制粘贴到虚拟机中,要先安装了vmware tools才可以,步骤如下
1.1点击工具栏中的 虚拟机(M),在弹出的下拉框中再点击设置(s)
1.2,在设置中选择选项面板,并点击共享文件夹,在右边选择总是启用(E),然后点击确定
1.3安装vmware tool 选择共享的磁盘或者文件夹,安装成功后,就可以直接将jdk安装包从外面复制粘贴(paste)到虚拟机中了
2. 启动伪分布式的时候报错
Error: JAVA_HOME is not set and could not be found.
解决方法:
输入 gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh 打开文件
更改 export JAVA_HOME=$JAVA_HOME (将相对路径改成绝对路径)
变成 export JAVA_HOME=/usr/java/jdk1.6.0_45(根据你安装的路径来填写)
3.用eclipse开发hadoop程序
链接如下:http://www.powerxing.com/hadoop-build-project-using-eclipse/
问题1:在/usr/local/hadoop目录下输入 ./sbin/start-dfs.sh 后,出现permission denie
原因:权限问题,用sudo ./sbin/start-dfs.sh 也会失败
解决方法: 先切换为root用户 输入命令 su
然后输入 ./sbin/start-dfs.sh
再切换回普通用户 su hadoop
问题2:Exception in thread "main" ExitCodeException exitCode=1:
chmod: 无法访问"/usr/local/hadoop/tmp/mapred/staging/bo806358276/.staging/job_local806358276_0001
原因:权限问题
解决办法: 1.切换到root用户 输入命令 su
2.输入命令 chmod -R 777 /usr/local/hadoop (/usr/local/hadoop是hadoop的安装目录,根据你自己的安装目录修改)
问题3:org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permission denied: user=DrWho, access=WRITE, inode="hadoop":hadoop:supergroup:rwxr-xr-x
解决方法:
- 找到WordCount工程下的src中的hdfs-site.xml
- 找到/user/local/hadoop/etc/hadoop/hdfs-site.xml (根据你的hadoop安装目录进行查找)
都打开,并且在其中添加一段代码
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
有篇文章透彻的讲解这个问题的根源,链接如下:http://www.huqiwen.com/2013/07/18/hdfs-permission-denied/
最后,如果原作者的文章真的对你帮助很大,那么最好微信赞助,因为对别人的有效付出给予回报,既是对别人的尊重,也是对自己的尊重。
相关推荐
虚拟机Ubuntu下hadoop2.6.0的安装与配置 (单机模式,伪分布式,完全分布式)非常详细的安装配置指南
通过上述步骤,您应该能够在单台虚拟机上成功搭建Hadoop CDH版本的伪分布式集群。这不仅有助于初学者理解Hadoop的工作原理,也为后续进行更复杂的大数据项目打下了坚实的基础。在整个过程中,注意细节非常重要,特别...
本文由汪庆发表,介绍了如何在单机环境中使用VMware虚拟机和Hadoop框架搭建伪分布式大数据实验平台,以满足轻量化学习需求。 1. **Hadoop基础** Hadoop是一个开源的分布式计算框架,设计用于处理和存储大量数据。...
本指南将详细介绍如何在基于 Hadoop 2.6.0 的环境中搭建 Spark 1.3.1 平台,以实现高效的数据处理。 首先,我们需要进行虚拟化环境的准备。这里推荐使用 VMware Workstation 11 作为虚拟化软件,它为开发和测试提供...
描述中提到的“虚拟机中用CentOS 6.6的32位系统编译的”,意味着这些本地库是在32位Linux环境下构建的,特别是CentOS 6.6,这是一个常用的服务器操作系统,因其稳定性和兼容性而受到欢迎。由于32位系统对内存管理的...
根据给定的信息,本文将详细解释如何在CentOS 6.5 上通过 VMware 虚拟化环境构建 Hadoop 2.6.0 的完全分布式集群。这涉及到多个步骤,包括虚拟机的准备、网络配置、SSH 免密码登录设置以及 Hadoop 的安装与配置。 #...
这意味着用户无需在虚拟机或Linux环境下就可以在Windows上使用Hadoop。只需将提供的bin目录中的文件覆盖到本地系统中的相应位置,即可启用Hadoop功能。 安装和使用Hadoop winutils的步骤通常包括以下几点: 1. ...
- **硬件环境**:准备五台虚拟机服务器作为搭建环境: - `172.168.0.2`:主节点(NameNode) - `172.168.0.3`、`172.168.0.4`、`172.168.0.5`、`172.168.0.6`:从节点(DataNode) ##### 2. 配置SSH无密码登录...
在Windows 7操作系统中搭建Hadoop开发环境,你需要遵循一系列步骤,这通常涉及到安装和配置Hadoop,以及集成Eclipse IDE。以下是一个详尽的指南,涵盖了标题和描述中提到的关键知识点。 首先,Hadoop是一个分布式...
这个压缩包包含了运行Hadoop在CentOS环境下所需的本机库,以确保Hadoop组件能够高效、稳定地执行。Hadoop是一个开源分布式计算框架,CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司提供的一个...
Hadoop是Apache软件基金会开发的一个开源分布式计算框架,它允许在大规模集群中高效处理和存储海量数据。在Hadoop 2.6.0版本中,引入了许多改进和新特性,以增强性能、稳定性和易用性。CDH(Cloudera Distribution ...
Hadoop Eclipse Plugin 2.6.0是一款专为Eclipse集成开发环境设计的插件,它使得开发者能够在熟悉的Eclipse环境中直接操作和管理Hadoop集群,极大地提升了Hadoop应用的开发效率。这款插件在Hadoop生态系统中扮演着...
这个编译的Windows版本Hadoop-2.6.0-cdh5.14.4对于开发者来说是一大福音,因为它简化了在Windows上的Hadoop环境搭建,方便进行开发和测试工作。同时,用户可以通过这个环境更好地理解Hadoop的工作原理,学习分布式...
在这个实验中,学生被要求在Linux环境下安装Hadoop,以模拟分布式计算环境。 实验的目的分为两个主要部分: 1. 掌握在Windows操作系统上安装Linux虚拟机或双操作系统的方法。由于Hadoop在Linux环境下运行效率更高...
7. 云计算虚拟化技术应用:云计算虚拟化技术能够在 Hadoop 平台上实现云计算虚拟化,提高数据处理效率和降低成本。 8. Hadoop 集群:使用虚拟化技术创建 Hadoop 集群,模拟出一个拥有大规模节点的 Hadoop 集群。 9...
本文将详细解析这两个概念及其在Windows环境下使用Hadoop开发工具Eclipse时的重要性。 首先,Hadoop是一个开源的大数据处理框架,最初设计用于Linux环境,但随着Hadoop的发展,它也逐渐支持Windows操作系统。在...
7. Java 环境配置:Hadoop 需要 Java 环境来运行,因此需要安装 Java Development Kit(JDK)。 8. hadoop 集群安装:Hadoop 集群安装包括安装、配置和验证三个步骤。安装完成后,需要配置 Hadoop 集群的参数,最后...
在压缩包文件名列表中提到的“hadoop2.6.0插件64位包含eclipse插件”,意味着这个压缩包不仅包含了Hadoop 2.6的WinUtils,还提供了适用于64位Windows系统的Eclipse插件。这意味着开发者可以在64位的Windows环境下,...