windows 在eclipse 下run wordcount;
需要:
1. 安装cygwin
2. 把 cygwin/bin 放到 windows 环境变量 path
hadoop start up
1。下载 ,tar
2。修改 con/hadoop-env.sh , java_home
3. bin/hadoop 显示帮助
4。运行 word count
mkdir testinput
cp conf/*.xml testinput
bin/hadoop jar hadoop-*-examples.jar grep testinput testoutput 'dfs[a-z.]+'
cat testoutput/*
bin/hadoop jar hadoop-streaming.jar -input input -output output -mapper /bin/cat -reducer /bin/wc
bin/hadoop pipes -conf src/examples/pipes/conf/word.xml -input input -output cppwordcount
hadoop contrib 开发环境
1。 装 ant:
设置 ant_home
2. svn checkout
svn checkout http://svn.apache.org/repos/asf/hadoop/core/trunk/ hadoop-core-trunk
3. ant
9. 执行unit test
ant -Dtestcase=TestConfiguration test-core
太慢
6. ssh 准备 (linux)
ssh-keygen -t rsa -P ‘’
cat ~/。ssh/id_rsa.pub >> ~/.ssh/authorized_keys
8. 启动eclipse : ,new java project
9. 把ant.jar ,搞过来
9.1 <property>
<name>hadoop.job.ugi</name>
<value>user,users</value>
</property>
10。run wordCount , program parameter : input ,output
jvm -Xms256m -Xmx256m
run
配置cluster:
配置 conf/hadoop-env.sh , java_home
conf/core-site :
8 <property>
9 <name>hadoop.tmp.dir</name>
10 <value>/home/jianqi/usep/tmp</value>
11 </property>
12 <property>
13 <name>fs.default.name</name>
14 <value>hdfs://localhost:54310</value>
15 </property>
conf/hdfs-site:
6 <configuration>
7 <property>
8 <name>dfs.replication</name>
9 <value>1</value>
10 </property>
conf/mapreduce-site
8 <property>
9 <name>mapred.job.tracker</name>
10 <value>hdfs://localhost:54311</value>
11 </property>
5. format hdfs
bin/hadoop namenode -format
linux eclipse 也放弃了。
分享到:
相关推荐
以上就是在Windows 10环境下使用Eclipse开发Hadoop 2.7.3的基本步骤,特别是关于`hadoop.dll`和`winutils.exe`的使用。需要注意的是,配置过程中可能会遇到一些问题,如权限问题、端口冲突等,解决这些问题通常需要...
hadoop基于linux开发和布署运行,故不能将hadoop环境原始运行在windows上。 操作系统环境差异说明 因为模拟linux环境,所以在linux原生环境中就不需要他了 在windows环境中需要配置 如何配置: 配置到运行环境当前目录...
最后,开发工具方面,Eclipse IDE是一个广泛使用的Java开发环境,也可以用来进行Hadoop项目的源码编译。无论是Linux还是Windows,开发者都需要掌握源码编译技术,以便于调试和优化Hadoop程序。 在搭建Hadoop环境的...
由于Hadoop是为Unix/Linux环境设计的,当在Windows环境下进行开发时,需要一些特殊的配置来使得Hadoop能够在Windows上运行。这包括将winutils.exe、hadoop.dll文件复制到宿主机的Hadoop安装目录下的bin目录中。这些...
- 下载`Hadoop-eclipse-Plugin-2.5.2.jar`插件,并将其放置在MyEclipse安装目录下的`plugins`文件夹内。 - 重启MyEclipse后,在“Project Explorer”窗口中可以看到新增的“DFS Locations”项,表明插件已成功加载...
Eclipse 的核心理念是“平台无关性”,它可以在多种操作系统上运行,包括Windows、Mac OS X和各种Linux发行版。 **Eclipse 的主要组件和功能** 1. **工作台(Workbench)**: Eclipse 的工作台是用户交互的主要界面...
本文将详细介绍如何在 Windows 环境下通过 Java API 来操作 HDFS。 #### 二、搭建开发环境 ##### 1. 安装与配置 Eclipse - **解压 Eclipse**:首先需要下载 Eclipse 的压缩包,并将其解压到硬盘上的任意位置...
例如,在某些特定环境下,可能既需要使用JDK1.5(Java Development Kit 1.5)也需要使用JDK1.6。本文档将详细介绍如何在同一台机器上安装JDK1.6,并实现它与已存在的JDK1.5版本共存。 #### 二、准备工作 1. **下载...
### 零基础学Java Web开发 #### 一、Java语言概述 **1.1 Java语言简介** ...通过学习Java语言的基础及其在Web开发中的应用,不仅可以提高自身的编程技能,还能更好地适应当前快速变化的技术环境。
通过Java虚拟机(JVM),Java实现了“Write Once, Run Anywhere”(WORA)的理念,允许开发者编写一次代码就能在不同的操作系统(如Windows、Linux、Mac OS等)和硬件平台上运行,大大降低了开发成本和维护难度。...
Java编程语言在计算机软件开发中的应用广泛且深入,它的出现极大地推动了软件工程的发展。本文将深入探讨Java在软件开发中的重要性、特点、优势以及实际应用案例。 首先,Java是一种面向对象的编程语言,由Sun ...
14. 大数据处理:Apache Hadoop和Spark等大数据处理框架大量使用Java,使得Java在大数据领域也有广泛应用。 15. 微服务架构:随着微服务概念的流行,Java的Spring Boot和Spring Cloud框架成为构建分布式微服务的...