hadoop有两个分支:0.20.x 和0.23.x。其中0.20.x是比较稳定的版本,0.23.x中新特性更多,但相对不稳定。
其中从0.20.x 分支发展出来的是:hadoop1.0,CDH3
从0.23.x 分支发展出来的是:hadoop-alpha,CDH4
下面具体说hadoop1.0、2.0 和CDH3、CDH4:
Apache Hadoop 2012年10月02日发布了 2.0 的第二个 Alpha 版本,版本号 2.0.2。该版本在 2000 个节点的集群上进行测试,目前开发团队的主要工作是处理无共享存储下的 HDFS HA ,还包括 YARN ResourceManager 以及调度方面的改进(YARN 是下一代的 MapReduce 实现)。
2011年12月27日顶级Apache开源项目Hadoop发布了1.0.0版。Hadoop是前雅虎开发者Doug Cutting开发的分布式计算平台,名字源于玩具象,至今已被数千家公司用于分析大容量数据。Hadoop 1.0.0主要是修正了bug,改进了性能和兼容性。它的上一个版本是0.20.205.0,新版的版本号原是 0.20.205.1,但开发者表示,Hadoop已经成熟几年前就做好了应用于生产的准备,但有些客户在采用前希望看到版本号是1.0,所以他们决定直接跳到了1.0。
cloudera CDH3基于hadoop稳定版0.20.2,并集成很多补丁(patch)
CDH4是基于Hadoop0.23的,但是它采用新的MapReduce,即MapReduce2.0,又叫Yarn。
CDH4的安装要求:64位的Red Hat Enterprise Linux5.7,CentOS5.7,Oracle Linux5.6,32位或64位的Red Hat Enterprise Linux6.2和CentOS6.2等
相关推荐
而hadoop-2.6.0-cdh5.16.2.tar.gz则是Cloudera公司推出的基于Hadoop 2.6.0的CDH(Cloudera Distribution Including Apache Hadoop)版本。CDH是业界广泛采用的企业级Hadoop发行版,它不仅集成了Hadoop的核心组件,还...
4. **CDH**: CDH是Cloudera对Hadoop生态的商业发行版,它包含了经过测试和优化的Hadoop组件,包括HDFS、MapReduce、YARN等,同时也包含了其他如Hive(SQL查询工具)、Pig(数据流编程工具)、Oozie(工作流调度器)...
Hadoop-0.20.2-cdh3u6是Cloudera公司基于Apache Hadoop的发行版CDH3的更新版本,它针对企业级应用进行了优化,包含了多个关键改进和修复。 CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera提供的...
首先,"hadoop-0.20.2-CDH3B4.tar.gz"是一个针对CDH3(Cloudera Distribution Including Apache Hadoop)3B4版本的Hadoop发行版。CDH是由Cloudera公司提供的一个企业级Hadoop发行版,包含了多个Apache项目,如Hadoop...
标题中的"hadoop-2.6.0-cdh5.14.2.tar.gz"是一个针对Apache Hadoop的软件包,具体来说是CDH(Cloudera Distribution Including Apache Hadoop)5.14.2版本,它基于Hadoop 2.6.0。CDH是由Cloudera公司提供的一个开源...
CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司对Hadoop生态系统的商业发行版,CDH5.7.0则是这个发行版的一个特定版本,它集成了多个开源组件,如HDFS、MapReduce、YARN等,并且进行了优化和...
Cloudera CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司提供的一款开源大数据平台,它包含了Hadoop生态系统中的多个组件,如HDFS、MapReduce、YARN、Hive、HBase等,为企业级大数据处理提供...
这个压缩包“hadoop-2.6.0-cdh5.14.0-with-centos6.9.tar.gz”是针对CDH(Cloudera Distribution Including Apache Hadoop)版本5.14.0的Hadoop 2.6.0安装包,特别优化以适应CentOS 6.9操作系统。在大数据领域,...
CDH4(Cloudera's Distribution Including Apache Hadoop)是Cloudera公司提供的一款基于Apache Hadoop的发行版,它集成了众多大数据处理组件,如HDFS、MapReduce、Hive、Pig、HBase等,为企业级大数据分析提供了...
CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司提供的一个企业级Hadoop发行版,包含多个开源大数据组件,如HBase、Hive、Pig等,提供了一整套数据管理解决方案。 接着,我们来看看JDK。Java ...
特别是Hadoop的商业化版本——CDH(Cloudera Distribution Including Apache Hadoop),它为企业提供了更加稳定、安全且易用的大数据解决方案。本文将重点解析Hadoop CDH 2.6.0-cdh5.9.3这一版本的核心技术和应用...
CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司对Hadoop生态系统的商业发行版,版本号5.14.0则是这个发行版的一个特定迭代。 本压缩包文件"hadood-2.6.0-cdh5.14.0 64位 native文件库"包含了...
在本文中,我们将深入探讨如何在CentOS 6.2环境下安装Cloudera's Hadoop Distribution (CDH) 4.3版本。CDH是Cloudera公司提供的一款开源大数据处理平台,它集成了Hadoop生态系统中的多个组件,如Hadoop、Zookeeper和...
Hadoop是一个开源分布式计算框架,CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司提供的一个商业化Hadoop发行版,它包含了多个相关的开源项目,如HDFS、MapReduce、YARN等。 描述中提到,...
Hadoop 2.0.0-cdh4.2.1是Cloudera公司发布的一个稳定版本,它基于Apache Hadoop的核心组件,提供了更为完善的生态系统,为海量数据处理提供了强大支持。本文将深入探讨Hadoop的这一重要版本及其核心组件。 首先,...
这个版本的Hadoop由Cloudera公司作为CDH(Cloudera Distribution Including Apache Hadoop)的一部分进行打包和维护,CDH是一个企业级的大数据平台。 在Hadoop 2.x系列中,最重要的改进是引入了YARN(Yet Another ...
这个特定的版本号2.6.0对应于CDH(Cloudera Distribution Including Apache Hadoop)的5.14.2发行版,这是Cloudera公司对Hadoop进行企业级优化的一个版本。 描述中提到,Hadoop是一个由Apache基金会开发的分布式...
在CDH 5.14.0版本中,Cloudera对Hadoop进行了优化和增强,以满足企业级需求。 本压缩包文件“hadoop-2.6.0-cdh5.14.0.tar.gz”正是针对Linux系统编译的CDH Hadoop 2.6.0-cdh5.14.0版本,其特色在于集成了对Snappy...
首先,我们来了解CDH,它是Cloudera Distribution Including Apache Hadoop的简称,是Cloudera公司提供的一款开源大数据平台,包含了Hadoop生态系统中的多个组件,如HDFS、MapReduce、YARN等。CDH5.16.2是其中的一个...