`

重新配置nutch1.2 报 Exception in thread "main" java.io.IOException: Job failed!

阅读更多

重新配置nutch1.2 报 Exception in thread "main" java.io.IOException: Job failed!

 

网上解决的办法都不行,原来是配置:

nutch-default.xml

 

//自己添加的时没有认真的原因造成的。

<property>
  <name>plugin.folders</name>
  <value>./src/plugins </value>
  <description>Directories where nutch plugins are located.  Each
  element may be a relative or absolute path.  If absolute, it is used
  as is.  If relative, it is searched for on the classpath.</description>
</property>

 

修改成:

<property>
  <name>plugin.folders</name>
  <value>./src/plugin</value>
  <description>Directories where nutch plugins are located.  Each
  element may be a relative or absolute path.  If absolute, it is used
  as is.  If relative, it is searched for on the classpath.</description>
</property>

 

分享到:
评论

相关推荐

    解决nutch在window系统安装问题

    解决nutch在window系统安装报错问题Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-tom\mapred\staging\tom1698089073\.staging to 0700,替换jar包OK!

    javax.net.ssl.SSLException: java.lang.RuntimeException: Could not generate DH keypair 解决方法总结

    然而,当你遇到“javax.net.ssl.SSLException: java.lang.RuntimeException: Could not generate DH keypair”的错误时,这意味着在建立SSL/TLS连接时,Diffie-Hellman(DH)密钥交换算法遇到了问题。DH是一种非对称...

    nutch1.2 java的project

    Nutch 1.2 是一个开源的Web爬虫项目,基于Java开发,它主要用于抓取互联网上的网页并进行索引。这个项目是Apache Lucene的一部分,提供了完整的搜索引擎解决方案。Eclipse 是一个流行的Java集成开发环境(IDE),在...

    nutch1.2 java project

    Nutch 1.2 是一个开源的网络爬虫项目,基于 Java 编写,用于抓取互联网上的网页并建立索引。这个项目是 Apache Software Foundation 的一部分,它为大规模的数据采集提供了强大的工具。Nutch 1.2 版本相对于早期版本...

    Nutch 1.2源码阅读

    ### Nutch 1.2 源码阅读深入解析 #### Crawl类核心作用与流程概览 在深入了解Nutch 1.2源码之前,我们先明确Nutch的架构和工作流程。Nutch作为一款开源搜索引擎框架,其功能涵盖网页抓取、索引构建以及查询处理。...

    hadoop-core-1.2.2-SNAPSHOT.jar

    windows下搭建nutch会遇到Hadoop下FileUtil.java问题,所以我们一般的做法是找到Hadoop-core-1.2.0源码中的org.apache.hadoop.fs下的FileUtil.java修改其中的CheckReturnValue方法,注释掉其中的内容这时运行会遇到...

    myeclipse8.5导入nutch1.2源码

    - `job failed` 错误:检查 JVM 版本是否符合 Nutch 要求,并确认配置文件正确无误。 #### 六、总结 通过上述步骤,开发者可以在 MyEclipse 8.5 中成功导入 Nutch 1.2 源码,并进行简单的测试。这种方式为开发者...

    nutch_1.4在windows下安装配置.pdf

    - **异常**: 若遇到 “Exception in thread "main" java.io.IOException: Job failed!” 错误,通常是因为 Cygwin 的编码问题。 - **解决方案**: 修改 Cygwin 安装目录下的 `.bashrc` 文件,将 `LANG` 变量值设为 ...

    nutch1.2源码

    要使用Nutch 1.2,你需要先安装Hadoop环境,然后编译Nutch源码,配置相应的参数,设置爬取种子,启动爬虫,最后进行索引和搜索。这个过程涉及的文件包括`conf`目录下的配置文件,如`nutch-site.xml`,以及`bin`目录...

    nutch 初学文档教材

    Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。 目 录 1. nutch简介...1 1.1什么是nutch..1 1.2研究nutch的原因...1 1.3 nutch的目标..1 1.4 nutch VS lucene.....2 2....

    Nutch入门.rar

    Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。 目 录 1. nutch简介...1 1.1什么是nutch..1 1.2研究nutch的原因...1 1.3 nutch的目标..1 1.4 nutch VS lucene.....

    nutch-1.2.war

    nutch官方简单案例,请版本是nutch-1.2.war

    nutch1.2测试文档

    nutch1.2测试文档

    apache-nutch-2.3.1-src.tar.gz

    1. **src**: 这是 Nutch 的源代码存放位置,分为多个子目录,如 `src/java` 存放 Java 代码,`src/test` 包含测试用例,`src/bin` 存放可执行脚本,`src/conf` 有配置文件等。 2. **build.xml**: Ant 构建文件,...

    nutch_1.4配置

    - 遇到`Exception in thread "main" java.io.IOException: Job failed!`错误时,可能是Cygwin的编码问题导致。解决方法是在Cygwin安装目录下的`.bashrc`文件中,将`LANG`和`LC_ALL`变量值设为`en_US.GBK`,重启...

    nutch-1.2.part02

    nutch Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降。 并且这很有可能进一步演变成为一个公司垄断了几乎...

    Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0

    ### Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0 本文旨在详细介绍如何在Windows环境下搭建基于cygwin、MyEclipse 8.5、Nutch 1.2及Tomcat 6.0的开发环境,并对每个步骤进行深入解析。 #### 一、Cygwin的...

    Linux下Nutch分布式配置和使用.rar

    这是本人在完全分布式环境下在Cent-OS中配置Nutch-1.1时的总结文档,但该文档适合所有Linux系统和目前各版本的nutch。 目 录 介绍 ............................................................... 2 0 集群...

    apache-nutch-1.4-bin.tar.gz

    在这个"apache-nutch-1.4-bin.tar.gz"压缩包中,包含了运行 Nutch 的所有必要组件和配置文件,适合初学者和开发者快速部署和实验。 **Nutch 的核心组成部分:** 1. **爬虫(Spider)**:Nutch 的爬虫负责在网络中...

    如何通过java程序获得Nutch中网页的详细信息

    在Java编程环境中,获取Nutch中的网页详细信息是一项常见的任务,尤其对于那些处理大量网络数据的项目来说。Nutch是一个开源的Web爬虫框架,它能够抓取互联网上的网页并进行索引,非常适合用于大数据分析和搜索引擎...

Global site tag (gtag.js) - Google Analytics