package com.bjsxt.qq;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
/*
*
* QQ推荐好友
* 处理方案:在mapper中将key和value分别对调输出;在reduce中将mapper输出的集合进行笛卡尔输出
*/
public class QqMapper extends Mapper<LongWritable, Text, Text, Text>{
protected void map(LongWritable key, Text value,Context context) throws java.io.IOException ,InterruptedException {
String line =value.toString();
String[] ss=line.split(" ");
context.write(new Text(ss[0]), new Text(ss[1]));
context.write(new Text(ss[1]), new Text(ss[0]));
};
}
package com.bjsxt.qq;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
/*
*
* QQ推荐好友
*/
public class QqReduce extends Reducer<Text, Text, Text, Text>{
protected void reduce(Text key, java.lang.Iterable<Text> iterable,Context context) throws java.io.IOException ,InterruptedException {
Set<String> set=new HashSet<String>();
for (Text t: iterable) {
set.add(t.toString());
}
if(set.size() >1){
for (Iterator j=set.iterator();j.hasNext();) {
String name=(String)j.next();
for (Iterator k=set.iterator();k.hasNext();) {
String other=(String)k.next();
if(!name.equals(other)){
context.write(new Text(name), new Text(other));
}
}
}
}
};
}
package com.bjsxt.qq;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class QqJobRun {
public static void main(String[] args) {
Configuration conf=new Configuration();
conf.set("fs.default.name", "hdfs://192.168.0.200:9000");
conf.set("mapred.job.tracker", "192.168.0.200:9001");
try {
Job job=new Job(conf,"QQ-Job1");
job.setJarByClass(QqJobRun.class);
job.setMapperClass(QqMapper.class);
job.setReducerClass(QqReduce.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
FileInputFormat.addInputPath(job, new Path("/opt/input/qq/"));
FileOutputFormat.setOutputPath(job, new Path("/opt/output/qq/"));
System.exit(job.waitForCompletion(true)?0:1);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
分享到:
相关推荐
该资源包里面包含eclipse上的hadoop-1.2.1版本插件的jar包和hadoop-1.2.1.tar.gz,亲测可用~~请在下载完该包后解压,将hadoop-1.2.1放置于Eclipse\plugins目录下,然后重启eclipse,将hadoop-1.2.1.tar.gz放到D:\...
hadoop-eclipse-plugin-1.2.1hadoop-eclipse-plugin-1.2.1hadoop-eclipse-plugin-1.2.1hadoop-eclipse-plugin-1.2.1
在给定的压缩包文件“hadoop-1.2.1-jar(全)”中,包含了Hadoop 1.2.1版本的多个重要组件的JAR包,这对于开发者和系统管理员在搭建、理解和使用Hadoop环境时非常关键。 1. **hadoop-core-1.2.1.jar**:这是Hadoop的...
这个名为“hadoop-1.2.1-bin.tar.gz”的文件是Hadoop 1.2.1版本的二进制发行版,适用于Linux操作系统。在Linux环境下,这种.tar.gz格式的文件通常被称为归档文件,可以通过解压缩命令轻松提取。 Hadoop由两个主要...
ERROR security.UserGroupInformation: PriviledgedActionException as:Administrator cause:java.io.IOException: Failed to set permissions of path:)重新编译了hadoop-core-1.2.1,注释了包中org.apache.hadoop....
首先,Hadoop-Eclipse-Plugin 1.2.1是针对较早期的Hadoop版本设计的。这个版本的插件支持Hadoop 1.x系列,适配的是Hadoop MapReduce的旧版API(即MapReduce v1,也称为Classic MapReduce)。它允许开发者在Eclipse中...
### Hadoop-1.2.1 运行WordCount实例详解 #### 一、环境准备与搭建 在开始运行WordCount实例之前,首先确保已经按照之前的步骤完成了Hadoop-1.2.1环境的搭建。这包括但不限于安装JDK、配置Hadoop环境变量以及设置...
hadoop-core-1.2.1在maven中央仓库中没有源码,此源码包是在hadoop的svn上打的包,包含hadoop1.2.1的所有源文件
该Jar包是用来替换Nutch1.7在windows下执行因权限报错的问题。 替换掉原来的Hadoop-core-1.2.0.jar
hadoop-examples-1.2.1.jar
- 将`hadoop-1.2.1.tar.gz`及`jdk-6u35-linux-x64.bin`文件上传至服务器。 - 解压Hadoop安装包: ```bash [root@testdbhadoop]# tar -zxf hadoop-1.1.2.tar.gz ``` 2. **设置Hadoop用户目录权限**: - 调整...
hadoop-eclipse-plugin-1.2.1.jar,给 Eclipse 用的 Hadoop 插件,1.2.1 版本。可以自己编译,请参考: http://blog.iamteer.com/archives/hadoop-eclipse-plugin.html 嫌麻烦可以直接下载,放到 Eclipse 的 ...
搭建Hadoop-1.2.1环境是一项关键任务,它涉及到多步骤的配置和安装,以便在集群中运行分布式计算任务。在这个过程中,我们将使用VMware9和Debian7作为基础操作系统,创建三台虚拟机(vmDebA、vmDebB、vmDebC)来构建...
### Hadoop-1.2.1安装与配置详解 #### 一、背景介绍 Hadoop是一款开源的大数据处理框架,能够高效地存储和处理大规模的数据集。本文档旨在提供一个详细的Hadoop-1.2.1版本的安装教程,特别针对Red Hat Enterprise ...