错误信息:
Exception in thread "main" java.io.IOException:Failed to set permissions of path:\tmp\hadoop-ysc\mapred\staging\ysc-2036315919\.staging to 0700
官方BUG参考:
https://issues.apache.org/jira/browse/HADOOP-7682
解决方法:
1、下载并解压http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-1.1.2/hadoop-1.1.2.tar.gz
2、修改hadoop-1.1.2\src\core\org\apache\hadoop\fs\FileUtil.java,搜索 Failed to set permissions of path,找到689行,把throw new IOException改为LOG.warn
3、修改hadoop-1.1.2\build.xml,搜索autoreconf,移除匹配的6个executable="autoreconf"的exec配置
4、下载解压ant,将ant目录下的bin目录加入环境变量path
5、在Cygwin命令下行切换到hadoop-1.1.2目录,执行ant
6、用新生成的hadoop-1.1.2\build\hadoop-core-1.1.3-SNAPSHOT.jar替换nutch的hadoop-core-1.0.3.jar
7、对于eclipse开发来说,替换C:\Users\ysc\.ivy2\cache\org.apache.hadoop\hadoop-core\jars\hadoop-core-1.1.2.jar
附件中的JAR是对hadoop1.2.1修改后的JAR,可用于Nutch1.7,其他Nutch版本没测试过。
相关推荐
在Cygwin中安装完vim后 进入vim,发现上下左右键和退格键都无法正常使用 问题分析: 首先考虑到的就是缺少vim的配置文件,首先查看/etc路径下是否有vim的配置文件 admin@ThinkPad /etc $ cd /etc admin@ThinkPad /...
很不错的缓存代理服务器Squid教程 很不错的缓存代理服务器Squid教程
Cygwin是一个在Windows上模拟Linux环境的开源软件,它提供了许多在Linux环境下才能运行的命令行工具,使得我们能够在Windows系统上执行类似Linux的操作,这对于需要在Windows系统中运行Nutch这样的基于Unix/Linux的...
- **错误提示**:“Failed to start ssh.service: Unit ssh.service not found.” - **原因**:`sshd_config` 配置文件出错。 - **解决方法**:检查 `/etc/ssh/sshd_config` 文件,确保所有配置项正确无误,并...
本包是为了解决在windows下通过cygwin运行hadoop时,执行tasktracker模块时报错Failed to set permissions of path: \mapred\local\ttprivate to 0700,通过修改源代码来解决的包。希望能该问题困扰的童鞋们,提供...
本文将详细介绍 Apache Nutch 1.7 在 Windows 和 Linux 下的安装过程,包括安装前的准备工作、安装 Cygwin、安装 Nutch 1.7、测试 Nutch 1.7 以及与 Solr 结合使用等内容。 1. 准备工作 在安装 Apache Nutch 1.7 ...
cygwin1.dll cygwin 运行库 1.7.5版本
Nutch需要Cygwin来运行某些Unix命令。从Cygwin官网http://www.cygwin.com/下载setup.exe,安装时选择默认选项,然后添加CYGWIN_HOME到系统的PATH环境变量中。 5. **安装Nutch 1.4**: 从Apache Nutch官网...
在介绍Windows下Nutch的安装过程之前,首先需要了解Nutch和Cygwin这两个工具的基本概念和作用。Nutch是一个开源的Web搜索引擎框架,基于Java编写,它使用Lucene作为搜索引擎核心。Nutch能够抓取网站并建立索引,实现...
64位版本的Cygwin是为了在Windows 64位平台上更好地运行Linux或Unix兼容的应用程序和工具而设计的。在安装Hadoop这样的分布式文件系统之前,Cygwin是必不可少的,因为它提供了在Windows上模拟Linux环境的基础设施。 ...
因为 Nutch 原生设计在 Linux 环境下运行,所以在 Windows 上配置 Nutch 需要一些额外的步骤。主要有两种方法: - **在 Eclipse 中使用 Nutch**: - 创建一个新的 Java 项目。 - 导入 Nutch 源码,将 `src\java`...
### Nutch 的安装方法详解 #### 一、前言 Nutch是一款开源的网络爬虫项目,基于Hadoop实现,可以抓取整个互联网,并且能够根据网页内容进行索引和检索。本文将详细介绍如何在Windows环境下安装配置Nutch,使初学者...
5. **文件系统**:Cygwin有自己的文件系统视图,它将Windows路径映射成Linux风格的路径,例如"C:\path\to\file"会显示为"/cygdrive/c/path/to/file"。 6. **应用范围**:Cygwin适用于跨平台开发、系统管理、自动化...
3. **Cygwin 环境**:由于 Nutch 是基于 Linux 环境开发的,因此在 Windows 下运行 Nutch 需要通过 Cygwin 来模拟 Linux 命令行环境。 #### 三、导入 Nutch 1.2 源码到 MyEclipse 8.5 1. **创建新项目**: - 打开...
3. **配置环境变量**:在Windows系统中,需要设置`HADOOP_HOME`环境变量指向Hadoop的安装目录,并在`PATH`变量中添加`%HADOOP_HOME%\bin`,这样就可以在命令行中直接运行Hadoop命令了。 4. **配置Hadoop**:打开`C:...
2. **运行Nutch**:使用Cygwin命令行进入到Nutch的bin目录下,执行相应的Nutch脚本。 #### 九、总结 本文详细介绍了在Windows系统下搭建Nutch检索工具的步骤。通过这些步骤,可以成功地安装并配置好Nutch检索工具,...