`

nutch1.4 环境变量设置

 
阅读更多
Exception in thread "main" java.io.IOException: Job failed!
	at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1252)
	at org.apache.nutch.crawl.Injector.inject(Injector.java:217)
	at org.apache.nutch.crawl.Crawl.main(Crawl.java:124)

解决办法:在cygwin中输入:export LANG="zh_CN.GBK"
,而后回车
其实就是设置下linux的环境变量 
分享到:
评论

相关推荐

    nutch_1.4配置

    1. **Java JDK 1.7**:Nutch基于Java开发,因此需要安装JDK,并设置相应的环境变量。 2. **Cygwin**:由于Nutch的脚本采用Linux Shell编写,故在Windows环境中需使用Cygwin作为Shell解释器,模拟Linux系统环境。 3. ...

    nutch_1.4在windows下安装配置.pdf

    - **用途**: Nutch 为 Java 应用程序,需先安装 JDK 并设置环境变量。 2. **Cygwin** - **下载地址**: [http://www.cygwin.com/](http://www.cygwin.com/) - **用途**: 由于 Nutch 的脚本采用 Linux Shell 编写,...

    Nutch1.4_windows下eclipse配置图文详解.docx

    - 设置 `ANT_HOME` 环境变量,变量值指向 Ant 的安装目录。 - 在 `PATH` 环境变量中添加 `%ANT_HOME%\bin` 和 `%ANT_HOME%\lib`。 **1.4 Cygwin 安装** - **下载地址**:文档中提供的下载地址为 [Cygwin 官方...

    Nutch配置环境\Nutch1[1].4_windows下eclipse配置图文详解.docx

    下载后解压,配置环境变量ANT_HOME和PATH。 4. **安装Cygwin**: Nutch需要Cygwin来运行某些Unix命令。从Cygwin官网http://www.cygwin.com/下载setup.exe,安装时选择默认选项,然后添加CYGWIN_HOME到系统的PATH...

    关于Nutch的安装

    在Windows环境下,你需要设置环境变量`NUTCH_JAVA_HOME`指向JDK的安装路径,例如:`NUTCH_JAVA_HOME=c:\jdk1.5`。 - **操作系统**:推荐使用Linux,如Sun或IBM的Linux发行版。若在Windows环境下,需安装Cygwin以获得...

    nutch入门教程

    这包括下载Tomcat,设置CATALINA_HOME环境变量,以及配置Tomcat的server.xml文件以支持Nutch应用。 #### 3. Nutch初体验 **3.1 爬行企业内部网** 初次使用Nutch时,可以先尝试爬行企业内部网络,熟悉Nutch的抓取...

    Nutch使用指南(英文)

    设置 `NUTCH_JAVA_HOME` 变量指向 Java 安装根目录。 2. **Apache Tomcat 4.x**:用于支持 Web 应用程序运行环境。 3. **Win32 平台上的 Cygwin**:用于提供 shell 支持(如果计划在 Win32 上使用 Subversion,则在...

    nutch安装在windows下配置

    1. **配置 Cygwin 环境变量** - 编辑 `E:\Program Files\cygwin\etc\profile` 文件: ```bash PATH="/usr/local/bin:/usr/bin:/bin:$PATH:/cygdrive/f/project/java/jdk5" export NUTCH_JAVA_HOME=/cygdrive/f/...

    nutch入门学习

    - **Nutch的安装与配置**:下载Nutch源码或预编译版本,配置相关环境变量,设置爬虫参数。 - **Tomcat的安装与配置**:部署Nutch的web界面,需配置Tomcat服务器。 #### 3. nutch初体验 在初步接触Nutch时,用户...

    nutch tutorials0.8

    1. **Java 1.4.x**:推荐使用Sun或IBM提供的Java环境,确保在Linux系统上安装并设置`NUTCH_JAVA_HOME`环境变量指向JVM根目录。 2. **Apache Tomcat 4.x**:作为Nutch运行时的服务器平台。 3. **Cygwin**(仅Windows...

    Hadoop环境下基于Lick线指数的恒星光谱分类与参数测量

    **核偏最小二乘回归** (Kernel Partial Least Squares Regression, KPLSR) 是一种非线性回归方法,用于建立输入变量与输出变量之间的关系。在天文学领域,KPLSR可用于估计恒星的物理参数,如温度、金属丰度等。 ###...

Global site tag (gtag.js) - Google Analytics