`

在windows平台下Eclipse调试Hadoop/Nutch

阅读更多

即让碰到这个问题说明 准备工作都做好了,软件包,环境什么的这里都不说了

 

安装jdk与环境变量配置

安装cygwin   

安装和启动ssd服务


安装后,配置环境变量,将cygwin的bin目录配置到path中

内存溢出导致job失败

解决方案:Eclipse -> Window -> Preferences -> Java -> Installed JREs -> edit -> Default VM arguments

 

黑体部分做了,就可以在eclipse中运行了,但是是单机模式的。

 

分享到:
评论

相关推荐

    eclipse配置nutch,eclipse配置nutch

    因此,利用Eclipse作为开发工具,可以简化Nutch的配置流程,提供一个友好的图形界面来管理项目和代码,同时利用其强大的调试功能,帮助开发者快速定位和解决问题。 ### 二、Eclipse配置Nutch的步骤详解 #### 步骤1...

    在 Windows 平台下部署 Hadoop 开发环境.docx

    Hadoop 开发环境,需要安装 Cygwin 和 Eclipse Europa 3.3.2,Cygwin 是一个 Unix 模拟环境,可以在 Windows 平台下运行 Unix 命令,而 Eclipse Europa 3.3.2 是一个集成开发环境,可以用来编写、调试和运行 ...

    nutch Eclipse

    总之,Eclipse 提供了一个方便的平台来管理和调试 Nutch 项目。通过正确配置 Eclipse、解决授权问题以及修复源代码中的错误,你可以顺利地在本地环境中编译和运行 Nutch,从而进一步理解和定制这个强大的网络爬虫...

    Hadoop开发者入门 pdf

    1 Hadoop介绍 2 Hadoop在国内应用情况 3 Hadoop源代码eclipse编译教程 7 在Windows上安装Hadoop教程 13 在Linux上安装Hadoop教程 19 在Windows上使用eclipse...31 在Windows eclipse上单步调试Hive教程 38 Hive应用介绍

    nutch爬虫+java+eclipse

    在Java环境下结合Eclipse IDE,我们可以轻松地开发和调试Nutch爬虫项目。下面将详细介绍Nutch爬虫、Java语言在爬虫开发中的应用以及如何在Eclipse中配置和运行Nutch。 一、Nutch爬虫 Nutch 是Apache软件基金会的一...

    nutch1.2 java的project

    6. **监控和调试**:在Eclipse中,你可以设置断点、查看日志,以便于调试和优化爬虫行为。 Nutch 1.2 对于学习搜索引擎工作原理和进行大数据分析项目非常有用。如果你打算深入研究,还需要了解Hadoop,因为Nutch...

    Eclipse中编译运行Hadoop-0.20.1源码

    在Eclipse中编译和运行Hadoop-0.20.1源码是理解Hadoop工作原理和进行源代码级调试的重要步骤。以下是一个详细的过程,涵盖了从环境准备到源码编译和运行的全部环节。 首先,确保你的开发环境满足必要的前提条件。在...

    apache-nutch-1.16.rar 已编译好的版本,可以直接导入eclipse、idea

    5. **调试和扩展**:利用IDE的调试功能,你可以对Nutch的代码进行逐行分析,理解其工作原理,或者在需要的地方添加断点。你还可以根据需要创建和添加新的插件。 **总结** Apache Nutch 1.16是一个强大的网络爬虫和...

    Hadoop开发者第一期入门专刊

    - **Windows环境下安装Hadoop**:在Windows平台上安装Hadoop相对复杂一些,因为Hadoop原本是为Linux系统设计的。主要步骤包括配置Java环境、设置Hadoop环境变量、配置Hadoop核心文件等。 - **Linux环境下安装Hadoop*...

    Nutch_插件深入研究

    虽然Nutch插件可以通过命令行工具构建,但在Eclipse中使用Ant构建插件具有一定的优势,如错误检查、调试便利等。为了在Eclipse中使用Ant构建Nutch插件,需要确保Eclipse已安装Ant插件,然后按照以下步骤操作: 1. *...

    nutch安装开发环境的配置

    你需要在 Eclipse 工程目录下找到 `build.xml`,然后通过 `Run As` -> `Ant Build` 来编译源代码。这将生成必需的 `nutch.jar` 文件。 2. **java.lang.RuntimeException: org.apache.nutch.plugin....

    nutch1.3在myclipse部署工程源码

    - 在"Libraries"选项卡中,添加Nutch1.3所需的依赖库,这通常包括Hadoop、Lucene等相关库。可以手动添加JAR文件,或者通过Maven或Gradle构建工具自动管理依赖。 步骤4:配置Web服务 - 在"Properties" -> "Web ...

    Nutch 安装ppt

    Cygwin 可以提供类似于 Linux 的环境,使得 Nutch 能够在 Windows 下正常运行。 **Cygwin 安装地址**:[http://www.cygwin.com/](http://www.cygwin.com/) **导入步骤**: 1. **下载 Nutch 源码**:首先需要从...

    Nutch1.7二次开发培训讲义

    - **目的:** 若计划在Hadoop集群上测试Nutch的功能,则需搭建Hadoop集群,可以选择伪分布模式或全分布模式。 - **共享:** 开发团队可以共用一个集群来降低成本和资源消耗。 #### 二、代码获取与项目配置 **1. SVN...

    基于hadoop的海量文本处理系统

    该系统基于Hadoop平台构建,旨在处理大规模文本数据。它不仅能够处理静态文件,还支持动态的数据流处理。系统通过Eclipse插件支持用户开发,并可通过Web界面进行管理和维护。 ##### 1.2 硬件配置 - **服务器配置**...

Global site tag (gtag.js) - Google Analytics