HA配置
安装Cloudera CDH4 官方文档配置,还算顺利,地址如下:
http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/latest/CDH4-High-Availability-Guide/CDH4-High-Availability-Guide.html
集群环境
我没有配置fencing和自动failover,试用了一下Quorum-based Storage和手动切换,基本配置如下:
- NameNode两台:nn1(active)、nn2(standby)
- JournalNode三台:JN1、JN2、JN3
测试过程
测试方法:使用hadoop put 命令上传一个2GB文件,中途使用kill -9 杀掉nn1,然后使用如下命令将nn2修改为active,查看上传文件是否完整。
sudo -u hdfs hdfs haadmin -transitionToActive nn2
看到的现象如下:
- kill -9 nn1后,上传文件的hadoop客户端不停打印retry日志
- 切换nn2为active后,hadoop上传客户端停止打印retry日志,继续传输文件,最后传输完毕
- 查看本地文件和hdfs文件,发现文件完整,没有因为nn1强制退出导致损坏
脑裂测试
此外我还特地搞出了脑裂的效果,如下图,两个NN都是active,读取和写入居然都正常...... 官方文档提到如果出现脑裂将可能导致数据丢失。为了避免脑裂,CDH通过pencing脚本来控制。
总结
CDH4(Hadoop2.0)HA功能已经可以解决集群单点问题,试用过程非常稳定。
相关推荐
cloudera CDH4.4安装文档,支持集群
在大数据处理领域,Cloudera Distribution Including Apache Hadoop (CDH) 是一个广泛使用的平台,它不仅包含Hadoop的核心组件,还提供了丰富的附加服务。为了确保系统的稳定性和可靠性,采用CDH进行HA(高可用性)...
CDH最新版本CDH4.4版本,Mapreduce1插件,用于hadoop的开发!便于Mapreduce程序的编写和开发! 基于Linux下eclipse-jee-juno-SR2-linux-gtk-x86_64编译。
- **ResourceManager的状态存储**:通常使用MySQL或Derby数据库来存储RM的状态,以实现HA。 配置过程中,你需要修改`hdfs-site.xml`和`yarn-site.xml`等配置文件,设置HA相关的参数,如Zookeeper地址、故障转移...
4.4.4.4 cdh4 ``` 3. **设置 root 用户密码:** - 命令:`sudo passwd root` 4. **允许 root 用户通过 SSH 登录:** - 编辑 `/etc/ssh/sshd_config` 文件。 - 添加 `PermitRootLogin yes` 行。 - 重启 SSH ...
本篇文章将详细介绍如何使用IDEA连接到CDH(Cloudera Distribution Including Apache Hadoop)集群中的Hive组件,以便进行Hive SQL的编写、测试和执行。 首先,我们需要创建一个Java工程。在IDEA中,点击“File” -...
在Cloudera Manager中,可以指定使用本地仓库安装CDH组件,以避免在线安装时的网络问题。这涉及选择本地仓库路径,配置CM以使用该仓库,然后按照提示安装所需的CDH组件。 **6. HDFS启用HA高可用性(基于Quorum-...
CDH7及以上版本已经更名为CDP 本资源打包了CDH7.1.5 搭建所需要的各种安装文件,包括: cm7.2.4-redhat7.tar.gz manifest.json cloudera-manager.repo RPM-GPG-KEY-cloudera CDH-7.1.5-1.cdh7.1.5.p0.7431829-el7....
CDH6.3.2完整安装包网盘下载,包含 CDH-6.3.2-1.cdh6.3.2.p0.1605554-bionic.parcel、CDH-6.3.2-1.cdh6.3.2.p0.1605554-bionic.parcel.sha1、CDH-6.3.2-1.cdh6.3.2.p0.1605554-bionic.parcel.sha256、CDH-6.3.2-1....
在某些情况下,如果开发环境已经配置了CDH6.3.2的类路径,可以使用这个版本。 使用这些JDBC驱动,开发者可以通过标准的JDBC接口连接到Hive,执行查询并获取结果。例如,你可以创建一个Java程序,使用`java.sql....
本篇文章将详细介绍如何在Linux环境中搭建CDH环境,并使用C++进行开发。 首先,你需要准备以下软件包,这些是搭建CDH环境的基础: 1. Cloudera Manager的安装包:cloudera-manager-el6-cm5.5.1_x86_64.tar.gz 2. ...
由于CSDN上传文件大小限制,大家可以下载《CDH6.3.2下载.txt》获取网盘地址进行下载,我打包了CDH6.3.2 搭建所需要的各种安装文件,包括: manifest.json cloudera-manager.repo RPM-GPG-KEY-cloudera cm6.3.1-...
在大数据处理领域,CDH(Cloudera Distribution Including Apache Hadoop)是一款广泛使用的开源大数据平台,它包含了Hadoop生态系统中的多个组件,如HDFS、YARN、MapReduce、Hive等。而Phoenix是一个针对HBase的SQL...
* 安装CDH Parcel:下载CDH Parcel安装包,使用rpm命令安装。 * 配置CDH Cluster:使用Cloudera Manager配置CDH集群。 4. 生产环境配置 在CDH安装完成后,需要配置生产环境。包括: * 时间同步服务器:使用chrony...
cdh7.1.7包括: CDH-7.1.7-1.cdh7.1.7.p0.15945976-el7.parcel CDH-7.1.7-1.cdh7.1.7.p0.15945976-el7.parcel.sha1 CDH-7.1.7-1.cdh7.1.7.p0.15945976-el7.parcel.sha256 manifest.json cm7.4.7包括: cloudera-...
- 备份现有ZooKeeper Jar包:`cp /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/jars/zookeeper-3.4.5-cdh6.3.2.jar /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/jars/zookeeper-3.4.5-cdh...
### CDH 6.3.2 安装包与下载指南 #### 一、背景介绍 自2021年1月31日起,Cloudera宣布其所有软件产品(包括Cloudera Data Hub,简称CDH)均需有效的订阅才能获取。这意味着用户无法再像以往那样免费下载CDH的各种...
hive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-0.13.1-cdh5.3.6.rarhive-...