- 浏览: 18982 次
-
最新评论
在Windows下安装Hadoop遇到的几个问题
2010年12月01日
Hdoop的荐部署环境是linux,但是我们想要在windows体验一下还是可以的,尤其是对我这样不是经常使用Linux系统的人。Windows下安装配置Hadoop的教程还是挺多的,这里可以下载。
下面我说说安装配置过程中遇到的一些问题吧,给自己以后提供借鉴。
我的操作系统是Windows 7,使用的Cygwin版本是1.7.7-1,hadoop版本是0.20.2。 1. SSH服务的安装 在安装SSH服务的过程中,如果按照网络教程上的步骤,在Win7下会有问题,安装完成后测试ssh localhost,遇到connection closed by ::1的问题,通过网上搜索,搜索到一片E文的解决方法,里面详细讲解了从卸载已经安装的服务到成功安装的各个步骤,比较详细,我也上传到了这里,其中的vista-cygwin.txt。有些不爽的是经过这些步骤,会给系统增加一个用户。当然SSH服务安装成功的就好啦。 2. SSH连接REMOTE HOST IDENTIFICATION HAS CHANGED解决方法 说到SSH连接,我想到了以前使用SSH连接时候遇到的一个问题,远程一台机器被我重装了,虽然IP地址和用户名都没有变,但是用其他客户端连接就出现上述提示,这里需要将 ~/.ssh/know-hosts文件中和该机器相关的rsa信息删除,然后再添加一下。删除命令:ssh-keygen R XXX.XXX.XXX.XXX。当然也可以手动去删除。 3. Java SDK路径配置的问题--hadoop-env.sh配置 在Hadoop的配置文件,hadoop-env.sh中,需要添加Java SDK的路径。要知道,Cygwin中并没有安装Java,那么只能使用Windows下安装的JDK。看了网上的文章,只是提到说export后面的路径需要用双引号括起来,因为一般JDK都是安装在"Program Files"下的。但是我这么添加以后,就是不行,报错"JAVA_HOME is not set"还是"…Program cannot found"来着,不太记得了,反正就是启动Hadoop的时候报错。经过研究后知道,首先Cygwin下不能使用windows的路径直接访问,需要是Linux风格的目录,如果是访问C盘下安装的JDK的话,不能使用"C:\Program Files\Java\jdk1.6.0_22",而需要使用这样"/cygdrive/c/Program Files/Java/jdk1.6.0_22";其次是hadoop好像不能识别带空格的目录路径,那怎么办呢,想到了符号链接,通过在Cygwin下创建一个符号链接,指向我的JDK安装目录,使用这样的命令:ln "C:\Program Files\Java\jdk1.6.0_22" /usr/local/jdk1.6.0_22. 这样就在/usr/local/下创建了一个Windows下JDK目录的符号链接,如果使用:cd /usr/local/jdk1.6.0_22, 然后ls下,就会发现已经在jdk的安装目录下了。然后在hadoop-env.sh中export JAVA_HOME=/usr/local/jdk1.6.0_22,这样就OK了。 4. hadoop-env.sh:line 2:$'\r':command not found错误 如果将hadoop-env.sh用Windows下的编辑软件编辑以后,再使用的话可能出现上述错误,使用dos2unix工具修正下,在conf/目录下执行"dos2unix hadoop-env.sh"就OK了。 5. Hadoop启动的问题--process information unavailable 好不容易配置好了hadoop,很兴奋,于是在赶紧启动hadoop,"start-all.sh",启动好像没有什么问题。使用jps列举下本机的java进程,发现怎么有几个进程显示"process information unavailable",这是怎么回事?突然想起为什么要安装SSH呢,于是SSH连接到本机,然后再启动hadoop,在jps,OK这下所有进程信息都列举出来了。具体是什么原因,我现在还不太清楚。 6. Hadoop启动的问题--Server at localhost/127.0.0.1:8888 not available yet 经过上面的步骤,好像Hadoop运行没有问题了,TaskTracker、JobTrack、DataNode、NameNode都启动了,好像没有问题了,但是执行"./hadoop fs ls /"命令是,会出现"Retrying connect to server: localhost/127.0.0.1:8888. Already tried X time(s). … Server at localhost/127.0.0.1:8888 not available yet",这又是为什么呢?查找后发现原来是HDFS在第一次用的时候需要初始化,安装完后就直接启动了,使用命令:./hadoop namenode format, 进行文件系统的格式化,然后再"./start-all.sh",再执行"./hadoop fs ls /",看到"Found 1 items
drwxr-xr-x - huangzhtao-pc\cyg_server supergroup 0 2010-11-27 17:26 /tmp",总算成功了。 7. 浏览器访问的说明
浏览器下查看Hadoop系统情况的地址。 配置hadoop真是一个充满挑战的过程,遇到了很多问题,记录下来,供以后参考。
附件:附件是一份Windows上安装hadoop的教程和Vista/Win7上安装sshd服务的说明。
发表评论
-
Windows PowerShell 2.0语言开发之脚本签名
2012-01-20 01:54 1074Windows PowerShell 2.0语言开 ... -
1.7 --1.8 SDK-RMIOS
2012-01-20 01:53 13421.7 --1.8 SDK-RMIOS 2011年01月06 ... -
vs2008安装失败解决办法
2012-01-20 01:53 1193vs2008安装失败解决办法 2011年04月22日 由 ... -
Windows环境下设置Qt编译环境 - 关于Qt的静态链接库的配置和生成方法
2012-01-20 01:53 2305Windows环境下设置Qt编译环境 - 关于Qt的静态链接库 ... -
清晨随笔
2012-01-19 09:40 677清晨随笔 2011年12月28日 连做两个梦,都是关 ... -
这孩子,太有才了
2012-01-19 09:40 766这孩子,太有才了 19小时前 ... -
开心一笑
2012-01-19 09:40 587开心一笑 2010年01月15日 星期一到了……小英在交 ... -
一言既出,驷马难追
2012-01-19 09:40 643一言既出,驷马难追 2012年01月12日 ... -
Windows SDK笔记-2
2012-01-17 02:15 840Windows SDK笔记-2 2011年04月25日 ... -
Windows SDK
2012-01-17 02:15 975Windows SDK 2010年08月13日 微软每 ... -
Windows Phone 7 SDK 正式版本RTW
2012-01-17 02:15 865Windows Phone 7 SDK 正式版本RTW 20 ... -
Windows Phone 7 SDK
2012-01-17 02:15 924Windows Phone 7 SDK 2011年01月28 ... -
Ⅱ 留 拒绝酱油
2012-01-17 02:15 696Ⅱ ... -
C++加载位图和SOCKET通信的编写
2012-01-15 21:52 1427C++加载位图和SOCKET通信的编写 2010年06月02 ... -
C++ socket编程基础(理论篇)[转]
2012-01-15 21:52 776C++ socket编程基础(理论 ... -
C# Socket网络编程学习(1-->3)
2012-01-15 21:52 1415C# Socket网络编程学习(1-- ... -
C# Socket多线程编程实例
2012-01-15 21:52 818C# Socket多线程编程实例 ... -
java socket连接c/s (转)
2012-01-15 21:51 739java socket连接c/s (转) 2010年07月0 ...
相关推荐
在安装Hadoop时,至少需要包含以下几个包:`openssh`(用于SSH服务),`curl`(网络工具,有时在Hadoop配置中需要用到),`grep`,`sed`,`tar`,`unzip`,`zlib-devel`等。 2. **安装Java开发工具**: - Hadoop...
为了测试 Hadoop 的 MapReduce 功能,需要先创建一个输入目录,如 `input-dir`,并在其中放置几个测试文件(如 `input-a.txt`、`input-b.txt` 和 `input-c.txt`)。这些文件中的数据可以随意编写。 #### 步骤七:...
描述中提到的“HADOOP在window环境下,不可执行的问题”可能源于几个原因: 1. **环境变量问题**:Hadoop的可执行文件需要被添加到系统的PATH环境变量中,以便从任何目录下都能执行。如果未正确设置环境变量,...
具体配置Hadoop中的几个核心配置文件的知识点如下: - core-site.xml:在此文件中配置Hadoop的默认文件系统(fs.defaultFS)和I/O设置等。 - hdfs-site.xml:配置HDFS相关的参数,例如NameNode和DataNode的持久化...
在安装过程中,我们经常会遇到需要替换特定文件的情况,以确保系统的正确运行。我们将详细介绍安装步骤、可能遇到的问题以及解决方案。 首先,Hadoop 2.7.3的安装通常涉及以下几个关键步骤: 1. **下载Hadoop**: ...
在Windows上开发Hadoop程序,你需要关注以下几个知识点: 1. **JDK安装**:Hadoop是用Java编写的,因此首先确保你已经安装了Java Development Kit(JDK),并且`JAVA_HOME`环境变量设置正确。通常需要JDK版本与...
在Windows上安装Hadoop 2.7.4通常涉及到以下几个关键知识点: 1. **Hadoop架构**:Hadoop由两个主要组件构成,HDFS(Hadoop Distributed File System)和MapReduce。HDFS是分布式文件系统,它将大文件分割成块并...
在Windows 10 64位系统上部署Hadoop 2.8.3时,需要确保以下几个关键步骤: 1. **安装Java环境**:Hadoop需要Java运行时环境(JRE)或Java开发工具包(JDK)来运行。确保安装了兼容Hadoop版本的Java,并将`JAVA_HOME...
配置Hadoop在Windows上运行主要包括以下几个关键步骤: 1. **配置环境变量**:将Hadoop的bin目录添加到系统的PATH环境变量中,以便在命令行中直接运行Hadoop命令。 2. **修改配置文件**:主要涉及`hadoop-env.cmd`...
在安装Hadoop时,你需要做以下几步: 1. **下载Hadoop**:首先,访问Apache官方网站或可靠的镜像站点下载适合你操作系统的Hadoop版本。通常,这会是一个`.tar.gz`或`.zip`压缩包。 2. **解压Hadoop**:将下载的...
在`bin`目录下还有其他几个重要的命令脚本,如`yarn.cmd`、`hadoop.cmd`、`hdfs.cmd`和`mapred.cmd`。这些脚本是Windows下的批处理文件,用于启动和管理Hadoop的不同服务和组件。例如,`hadoop.cmd`用于执行Hadoop的...
首先,Hadoop的安装和配置涉及几个关键步骤。在这个压缩包中,包含了必要的组件,如`winutils.exe`和`hadoop.dll`,这些文件对于在Windows上运行Hadoop至关重要。`winutils.exe`是一个实用程序,类似于Linux环境下的...
在Windows环境下搭建Hadoop时,会遇到一些与Linux系统不同的挑战,其中配置环境变量是关键步骤之一。"windows下面的hadoop环境变量"这个标题暗示了我们正在解决Hadoop在Windows上的安装和配置问题,特别是关于`...
在Windows下,用户通常会遇到与路径长度限制、文件权限和依赖库不兼容等问题,这个预编译版本可能已经解决了这些问题,使得在Windows环境中部署Hadoop更加方便。 总的来说,这个压缩包提供了一个在Windows上快速...
然而,通过一些特定的配置和补丁,我们可以在Windows 7上进行单机部署,这就是"Hadoop 2.7.6在Windows7下单机部署时的补丁文件包"所解决的问题。 Hadoop 2.7.6是一个稳定版本,它包含了多项改进和修复,使得大数据...
在搭建Hadoop环境的过程中,经常会遇到一些特定的依赖问题,比如缺少`hadoop.dll`和`winutils.exe`这两个关键组件。本文将详细介绍这两个文件及其在Hadoop生态系统中的作用,以及如何解决它们缺失的问题。 首先,`...
安装和配置Hadoop 2.7.2在Windows上的步骤通常包括以下几个关键点: 1. 下载Hadoop二进制发行版,解压缩到指定目录。 2. 设置环境变量,包括`HADOOP_HOME`指向Hadoop安装目录,`PATH`添加`%HADOOP_HOME%\bin`以便...
在Windows环境下搭建Hadoop 2.7.3集群时,会遇到一些特有的挑战,因为Hadoop主要是为Linux设计的。然而,通过一些调整和安装特定的组件,我们可以在Windows上运行Hadoop。在这个过程中,`hadoop.dll` 和 `winutils....
在Windows 7环境下,配置Eclipse来开发Hadoop项目,我们需要安装特定的插件并进行一系列设置。本文将详细介绍如何在Eclipse中配置Hadoop 2.6的插件,以便于进行分布式计算开发。 首先,我们要理解Hadoop是Apache...