配置完成nutch容易出现的错误

p_x1984

浏览: 1189251 次
性别:
来自: 北京

最近访客更多访客>>

u012363178

清风_秋雨

sun80264629

shaoaj

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

nutch

Java Hadoop Apache Eclipse thread

1.1.2   运行crawl报错Job failed

Exception in thread "main" java.io.IOException: Job failed!

        at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:604)

        at org.apache.nutch.indexer.DeleteDuplicates.dedup(DeleteDuplicates.java

:439)

        at org.apache.nutch.crawl.Crawl.main(Crawl.java:135)

问题解决：

此多为crawl-urlfilter.txt：MY.DOMAIN.NAME的修改不正确

1.1.3   又一个Job failed

Exception in thread "main" java.io.IOException: Job failed!

        at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:604)

        at org.apache.nutch.indexer.DeleteDuplicates.dedup(DeleteDuplicates.java

:439)

        at org.apache.nutch.crawl.Crawl.main(Crawl.java:135)

问题解决：

多为crawl-urlfilter.txt的MY.DOMAIN.NAME修改不正确

1.1.4   Eclipse中运行nutch：Job failed

Exception in thread "main" java.io.IOException: Job failed!

       at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:604)

       at org.apache.nutch.crawl.Injector.inject(Injector.java:162)

       at org.apache.nutch.crawl.Crawl.main(Crawl.java:115)

问题解决：

此问题是eclipse的java版本设置问题，解决方法：

如原来使用java1.4，需要改为1.6

project-》properties-》java compiler

右 jdk compliance

compiler compliance level：改为6.0

分享到：

nutch如何才能抓取到动态的url | 在eclipse中如何配置nutch1.0

2009-11-25 11:50
浏览 2495
评论(4)
论坛回复 / 浏览 (4 / 7893)
查看更多

4 楼 jsproy 2010-10-23

Exception in thread "main" java.io.IOException: Job failed!
        at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1232)
        at org.apache.nutch.indexer.Indexer.index(Indexer.java:72)
        at org.apache.nutch.crawl.Crawl.main(Crawl.java:147

我也遇到此问题.
可能的问题:
1.中断过正在抓取的程序
2.刚集合了庖丁分词

3 楼 p_x1984 2010-01-22

你这个问题我这两天也经常碰见，在做测试的时候，我是现把合并索引的几行代码注释掉了，在单机上测试没有什么问题。在多台机子上跑的时候也出现这个问题。我在网上看到一篇文章说是：在nutch-site.xml中加上（你可以现试试）----------
http.agent.name、http.agent.description、http.agent.url、http.agent.email。这个几个选项。在试试吧！

2 楼 yaweja 2010-01-21

1 楼 comsci 2009-11-26

NUTCH对磁盘空间的使用有什么特点吗？比如说最大可以使用多大的空间？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论