hadoopMapReduce小例子 -

qihuiyong6

浏览: 41361 次
性别:
来自: 北京

最近访客更多访客>>

victor036

沉默的水

sqh123456

dongqdong

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

hadoopMapReduce小例子

博客分类：

编程

今天做了一个简单的mapreduce小程序，目的是熟悉一下怎么在真实的集群上跑自己的mr程序，之前写的都是在单机模拟运行的。功能很简单就是求一个key对应值里面最大的。

开发环境：

hadoop2.5

jdk1.6

eclipse3.7

1、创建一个java工程，加入如下jar包：

hadoop-common-2.5.2.jar

hadoop-mapreduce-client-common-2.5.2.jar

hadoop-mapreduce-client-core-2.5.2.jar

hadoop-mapreduce-client-jobclient-2.5.2.jar

2、主要类

MaxNumberDriver.java用于启动mapreduce程序的入口

[code="java"]package org.qhy.mapreduce.maxnumber;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class MaxNumberDriver extends Configured implements Tool{

    @Override
    public int run(String[] arg0) throws Exception {
        if(arg0.length {

    @Override

    protected void map(LongWritable key, Text value, Mapper.Context context)

            throws IOException, InterruptedException {

        String lineVal = value.toString();

        String[] arrayVal = lineVal.split(",");

        String year= arrayVal[0],number=arrayVal[1];

        context.write(new Text(year), new IntWritable(Integer.parseInt(number)));

    }

}

MaxNumberReducer.java reducer实现类

package org.qhy.mapreduce.maxnumber;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

import org.apache.commons.lang3.math.NumberUtils;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Reducer;

public class MaxNumberReducer extends Reducer {

//    @Override

//    protected void reduce(Text year, java.lang.Iterable numbers,

//            org.apache.hadoop.mapreduce.Reducer.Context context)

//            throws java.io.IOException, InterruptedException {

//        int maxValue = Integer.MIN_VALUE;

//        for(IntWritable value: numbers){

//                 maxValue = Math.max(maxValue,value.get());

//        }

//        context.write(year, new IntWritable(maxValue));

//    }





    /**

     * {@inheritDoc}使用第三方Apache Lang包

     * @see org.apache.hadoop.mapreduce.Reducer#reduce(KEYIN, java.lang.Iterable, org.apache.hadoop.mapreduce.Reducer.Context)

     */

    @Override

    protected void reduce(Text year, java.lang.Iterable numbers,

            org.apache.hadoop.mapreduce.Reducer.Context context)

            throws java.io.IOException, InterruptedException {

        Iterator itr = numbers.iterator();

        int length=0;

        List list = new ArrayList();

        while(itr.hasNext()){

            IntWritable iwVal = itr.next();

            list.add(iwVal.get());

            length++;

        }

       int[] array = new int[length];

       for(int i=0;iexport->jar->选择导出路径（一路next）-> 记得选一下main函数类

4、运行

将jar放到系统上linux上

./hadoop jar ~/testData/MRMaxNumber.jar hdfs://hdp01nn:9000/maxnumber hdfs://hdp01nn:9000/testOut/maxnumber4

分享到：

jdk1.7安装之后切换不回去 | VMware虚拟机搭建Hadoop集群

2015-03-28 21:08
浏览 495
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoopMapReduce小例子

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoopMapReduce小例子

评论

发表评论

相关推荐

Java实现SPI基础工具类

javassi实现t动态代理模式

JSP COOKIE使用

Jedis事务用法

zookeeper笔记

jdk1.7安装之后切换不回去

VMware虚拟机搭建Hadoop集群

Hibernate代码生成插件(eclipse)

eclipse文件同步插件

修改WAS(WebSpehre)默认编码和jvm内存申请

Apache HttpClient 代理、登陆访问百度开放平台

windows下编写mapreduce程序

RMI随机生成端口解决方法(结合spring)

WAS(WebSphere)修改端口

最近访客更多访客>>