锁定老帖子 主题:配置完成nutch容易出现的错误
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2009-11-25
1.1.2 运行crawl报错Job failed 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2009-11-26
NUTCH对磁盘空间的使用有什么特点吗? 比如说最大可以使用多大的空间?
|
|
返回顶楼 | |
发表时间:2010-01-21
Exception in thread "main" java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1232) at org.apache.nutch.indexer.Indexer.index(Indexer.java:72) at org.apache.nutch.crawl.Crawl.main(Crawl.java:147 请教 这个是哪的问题呢? |
|
返回顶楼 | |
发表时间:2010-01-22
你这个问题我这两天也经常碰见,在做测试的时候,我是现把合并索引的几行代码注释掉了,在单机上测试没有什么问题。在多台机子上跑的时候也出现这个问题。我在网上看到一篇文章说是:在nutch-site.xml中加上 (你可以现试试)----------
http.agent.name、http.agent.description、http.agent.url、http.agent.email。这个几个选项。在试试吧! |
|
返回顶楼 | |
发表时间:2010-10-23
Exception in thread "main" java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1232) at org.apache.nutch.indexer.Indexer.index(Indexer.java:72) at org.apache.nutch.crawl.Crawl.main(Crawl.java:147 我也遇到此问题. 可能的问题: 1.中断过正在抓取的程序 2.刚集合了庖丁分词 |
|
返回顶楼 | |
浏览 7887 次