- 浏览: 41225 次
- 性别:
- 来自: 深圳
最新评论
-
Wuaner:
体积小巧,文字却很清晰,不错的版本。谢谢lz分享!
Hadoop权威指南(第二版)pdf中文版 -
laserdance:
command type python3.2
在Linux下安装Python
MapReduce应用开发
1. MapReduce程序开发步骤
编写map 和 reduce 程序–> 单元测试 -> 编写驱动程序进行验证-> 本地数据集调试 -> 部署到集群运行
用到的工具:
Junit、Mockito、Ant
2. 使用Configuration
关键点:
1、 Configuration类可以加载配置文件,包括系统的和自定义的
2、 addResource方法后面的配置文件会覆盖前面的
3、 配置文件的几个特性:name、value、description、final、${} 引用
4、 系统属性(System.setProperty)中的优先级高于源文件中的优先级
代码:
其中,添加配置文件最好使用 Path对象的方法,否则会找不到配置文件。注意黄色背景内容
public static void main(String[]args) {
// TODO Auto-generatedmethod stub
String baseDir = Thread.currentThread().getContextClassLoader()
.getResource("").getPath().substring(1)+ "demo/chp5/conf-1.xml";
String fileStr = newFile(baseDir).getAbsolutePath();
Path filePath = newPath(baseDir);
System.out.println("filePath="+filePath);
Configuration conf = new Configuration();
conf.addResource(filePath);
//conf.addResource("conf-2.xml"); //后面添加的会覆盖前面的
System.out.println(conf.get("color"));
System.out.println(conf.get("fs.default.name"));
}
3. 环境准备
1、 尽量保证运行和程序分离,也就是运行环境、运行程序、运行数据、配置文件之间的分离存放。
2、 Hadoop.job.ugi (用户标识)
辅助类:GenericOptionsParser,Tool 和 ToolRunner
GenericOptionsParser:解释常用命令选项
Tool接口,ToolRunner:运行应用程序,内部调用GenericOptionsParser
通过上面的方式,构建一个任务的执行框架,代码样例如下:
public classConfigurationPrinter extends Configured implements Tool {
//静态构造函数
static{
Configuration.addDefaultResource("hdfs-default.xml");
}
/* (non-Javadoc)
* @seeorg.apache.hadoop.util.Tool#run(java.lang.String[])
*/
@Override
public int run(String[] arg0) throws Exception{
// TODO Auto-generated method stub
Configuration conf = getConf();
for(Entry<String,String> entry :conf){
System.out.printf("%s=%s\n",entry.getKey(),entry.getValue());
}
return 0;
}
/**
* @paramargs
* @throwsException
*/
public static void main(String[] args) throwsException {
// TODO Auto-generated method stub
int exitCode = ToolRunner.run(newConfigurationPrinter(), args);
System.exit(exitCode);
}
}
4. 程序开发及测试
a) 编写单元测试
使用Mockito框架模拟进行测试。
b) 运行的代码框架包括:
驱动程序:XXXDriver,运行的主程序
Mapper:XXXMapper,mapper的程序
Reducer:XXXReducer,reducer的程序
-------------------------------------------------------------------------------------------------------------------
作者:CNZQS|JesseZhang 个人博客:CNZQS(http://www.cnzqs.com)
版权声明:除非注明,文章均为原创,可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
--------------------------------------------------------------------------------------------------------------------
发表评论
-
Hadoop正式发布1.0版本
2011-12-30 23:46 992作者:JesseZhang (CNZQS|JesseZh ... -
hadoop运行报错: java.lang.ClassNotFoundException解决方法
2011-12-11 23:10 2433作者:JesseZhang (CNZQS|JesseZh ... -
网友分享的《Hadoop实战》中文版 pdf
2011-12-08 20:50 2116作者:JesseZhang (CNZQS ... -
《权威指南》笔记十 管理Hadoop
2011-12-07 00:29 1655作者:JesseZhang (CNZQS|JesseZh ... -
《权威指南》笔记九 构建Hadoop集群
2011-12-05 22:03 1610作者:JesseZhang (CNZQS|JesseZh ... -
《权威指南》笔记八 MapReduce的特性
2011-12-05 00:25 1513作者:JesseZhang (CNZQS|JesseZh ... -
《权威指南》笔记七 MapReduce的类型和格式
2011-12-04 00:30 1733作者:JesseZhang (CNZQS|JesseZh ... -
Google三大论文中文版 pdf
2011-11-30 11:43 1904作者:JesseZhang (CNZQS|Jess ... -
Hadoop的五个典型应用场景
2011-11-08 11:18 1698本文为转载,原始地址为:http://blog.nosq ... -
Hadoop权威指南(第二版)pdf中文版
2011-11-03 11:29 2888今天终于找到 hadoop权威指南第二版的中文pdf版本 ... -
利用Ant构建Hadoop高效开发环境
2011-10-23 23:10 935最近Hadoop的研究中,都是利用Mockito ... -
chp6_MapReduce工作机制_20111016
2011-10-16 19:42 1047MapReduce工作机制 1. ... -
hadoop的应用(摘自itpub论坛)
2011-09-23 22:44 1088在itpub的hadoop论坛中看到一则hadoop的应用说明 ... -
Hadoop的Namenode的容灾处理
2011-08-17 21:48 1658Hadoop的namenode是关键节点,虽然业务尽量单一,减 ... -
HDFS系统学习笔记
2011-08-14 23:19 1067HDFS系统 1. 读 ... -
hadoop开发环境配置(伪分布)
2011-08-14 10:44 1020Hadoop开发环境 安装插件 0.20.0 ... -
Hadoop安装总结
2011-08-13 13:07 871Hadoop安装总结 安装JDK 1 ... -
Hadoop及子项目介绍
2011-08-13 12:26 1542Hadoop及子项目介绍 H ... -
Google的三大基石
2011-07-20 13:58 1086Google的三大基石,也是云计算的几个重点论文的来源: ...
相关推荐
CCNAS_Chp3_PTActA_AAA.pka章节作业满分,加油自己配置
《C++编程实践:从Chp4_code.rar解密编程艺术》 在计算机科学的世界里,C++是一种强大且广泛应用的编程语言,以其高效、灵活和面向对象的特性深受程序员喜爱。当我们打开"Chp4_code.rar"这个压缩包,我们即将踏上一...
pta_chp5_78.py
有限质点法的练习4,丁承先向量式结构力学
chp5_MPEG视像.ppt
在本压缩包文件“chp5_ex2.zip_质点法2”中,我们主要关注的是丁承先教授提出的向量式结构力学的源代码实践。这个练习二旨在帮助学习者深入理解质点法的基本概念和实现过程。 质点法的核心思想是将连续体(如结构或...
标题“CHP014_SH.7z”表明这是一个压缩文件,使用了7z压缩格式。7z是一种高效且开源的文件压缩格式,由7-Zip软件创建,它提供了比传统ZIP或RAR更高的压缩率,尤其对于文本和源代码文件。这种格式支持多种不同的压缩...
chp5_上海市行政区划图制作.doc
本实例中的"chp5_ex2_fy.rar_vfife_向量式有限元"是一个Matlab程序,设计用于平面二维杆单元的变形计算。 在二维杆单元的有限元分析中,通常涉及的问题是求解结构在受到外力作用下的应变、应力和位移。VFIFE通过...
本实验报告主要涵盖了四个任务,涉及了网络安全中的认证、授权与审计(AAA,Authentication, Authorization, Accounting)的概念及其在路由器设备上的应用。实验目的是通过配置本地AAA认证、基于服务器的TACACS+和...
chp6_多媒体存储.ppt
chp4_数字图像编码.ppt
chp3_数字声音编码.ppt
chp2_数据无损压缩.ppt
chp1_多媒体技术概要.ppt
+Chp10_学生数据读写.cpp
chp6_多媒体文件格式与流媒体技术.ppt
C语言课件(王曙燕)chp3_算法和基本程序设计.ppt
质点法源代码练习一的相关内容,是丁承先的向量式结构力学的代码
有限质点法的练习3,丁承先向量式结构力学