系统
从CDH3b3开始不支持hadoop.job.ugi参数,请使用UserGroupInformation.doAs()方法代替。详细见我博客:http://heipark.iteye.com/blog/1178810
其它见:https://ccp.cloudera.com/display/CDHDOC/Incompatible+Changes
安装
- cloudera CDH3基于hadoop稳定版0.20.2,并集成很多补丁(patch)
- CDH提供rpm包和tar两种方式(cloudera更推荐使用rpm方式,下文所述CDH默认为rpm安装方式),hadoop0.20.2只提供了tar包安装方式,
- cloudera CDH3 自动设置JAVA_HOME环境变量,apache hadoop需要手工配置
- apache hadoop使用start/stop-dfs.sh start/stop-all.sh脚本维护集群,CDH通过root身份运行/etc/init.d/hadoop-0.20-* 脚本启动、关闭服务,这种方式只可以管理当前服务器,如果希望实现类似start/stop-all.sh需要自己写脚本(详细见我博客:http://heipark.iteye.com/blog/1182223)
- CDH3安装成功后会添加两个用户:hdfs(hdfs文件系统相关), mapred(mapreduce相关),而apache hadoop大家通常的做法是添加一个hadoop用户来做所有的事情。
- CDH通过alternatives切换多个配置文件,而apache hadoop配置文件只保存在$HADOOP_HOME/conf下面
eclipse插件
cloudera CDH默认没有提供eclipse插件,需要自己编译,而且它的插件和apache hadoop插件不兼容
安全
CDH3支持Kerberos安全认证,apache hadoop则使用简陋的用户名匹配认证
参考:
https://groups.google.com/a/cloudera.org/group/cdh-user/browse_thread/thread/cacad7f7091b5332
https://groups.google.com/a/cloudera.org/group/cdh-user/browse_thread/thread/cd036b7483b32bbc
https://groups.google.com/a/cloudera.org/group/cdh-user/browse_thread/thread/c30a91068d912015
https://groups.google.com/a/cloudera.org/group/cdh-user/browse_thread/thread/0cfbc35d87e23233
-- end --
分享到:
相关推荐
Hadoop-0.20.2-cdh3u6是Cloudera公司基于Apache Hadoop的发行版CDH3的更新版本,它针对企业级应用进行了优化,包含了多个关键改进和修复。 CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera提供的...
"hadoop-0.20.2-cdh3u6"是Cloudera公司基于Hadoop的一个发行版本,名为CDH(Cloudera Distribution Including Apache Hadoop)。这个版本在Hadoop的原始基础上进行了优化和增强,提供了企业级的功能和稳定性,适用于...
"hadoop-0.20.2-cdh3u4"是Cloudera公司基于Hadoop 0.20.2版本的一个发行版,称为CDH3u4,其中"CDH"代表Cloudera Distribution Including Apache Hadoop,"u4"则是该发行版的第四个更新版本。 Hadoop的核心组件主要...
《Hadoop 0.20.2-CDH3B4:解压缩后的技术解析与应用》 Hadoop,作为Apache软件基金会的重要项目之一,是大数据处理领域中的核心框架,其分布式存储系统HDFS(Hadoop Distributed File System)和分布式计算模型...
Hadoop Eclipse插件,经测试在Eclipse3.7下能正常使用。在Windows下连接远程Hadoop集群时,注意本地要安装cygwin...另,Hadoop Eclipse插件只能连接相应版本的Hadoop集群,例如,本插件只能连接hadoop-0.20.2-cdh3u4。
- 特定版本:[http://archive.cloudera.com/cdh/3/hadoop-0.20.2-cdh3u6/](http://archive.cloudera.com/cdh/3/hadoop-0.20.2-cdh3u6/) #### 总结 在选择Hadoop及生态系统的组件时,应根据实际项目需求来确定所需...
- **PatchLevel划分**:Cloudera采用PatchLevel来标识每个版本中的修补程序数量,如PatchLevel为923.142表示基于Apache Hadoop 0.20.2添加了1065个Patch,其中923个是在最后一个Beta版本中添加的,142个是在稳定版...
- Cloudera提供了CDH(CentOS Data Hub)版本,对应不同的Apache Hadoop版本。例如,CDH3对应0.20.2,CDH4基于2.0。 - CDH的优势在于简化了安装和升级流程,提供yum、tar、rpm和Cloudera Manager等多种安装方式,...
CDH至今共发布了四个版本,其中前两个版本已停止更新,最新两个版本CDH3和CDH4分别基于Apache Hadoop 0.20.2和2.0.0版本,对应Apache的Hadoop 1.0和2.0版本。 Hadoop生态圈由多个与Hadoop核心功能相关的项目组成,...
市场上有许多基于Hadoop的商业发行版,如Cloudera公司的CDH(Cloudera Distribution Including Apache Hadoop),目前最新的版本为CDH4,它是基于Apache Hadoop 0.20.2版本进行演化的。 #### 二、Hadoop的核心组件 ...
本文将详细介绍如何在运行CentOS 5.5且安装了Hadoop 0.20.2-CDH3B4的环境中配置和安装LZO。 **一、环境准备** 首先,确保你的系统已经安装了以下软件包: 1. GCC:C语言编译器,用于编译源代码。 2. Ant:Apache的...