一、不使用HA场景
1.1 获取FileSystem(下称FS)方法一:
FileSystem fs = FileSystem.get(URI.create("hdfs://<nn_ip>:<nn_port>"), new Configuration());
1.2 获取FS方法二(★推荐):
Configuration conf = new Configuration(); conf.set("fs.default.name", "hdfs://<nn_ip>:<nn_port>"); FileSystem fs = FileSystem.get(conf);
二、Hadoop2.x(CDH4)不配置HA场景
2.1 连接单台NN
使用方式和1.2的代码是完全一样的,不需要任何代码变更。
三、Hadoop2.x(CDH4)使用HA场景
3.1 连接单台NN
使用方式和1.2的代码是完全一样的,不需要任何代码变更。
3.2 使用nameservices,并支持自动切换,这里有两种方法:
方法一:使用配置文件
- 使用1.2配置,"fs.default.name"配置为你的nameservices名称,如:"hdfs://venice"
- 将线上core-site.xml和hdfs-site.xml放到你项目配置文件目录,如conf,确保程序运行后,这个目录会被加载到classpath,特别注意,要添加如下配置到你的hdfs-site.xml文件,否则NN失败不会切换:
<property> <name>dfs.client.failover.proxy.provider.<your_nameservices></name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property>
方法二:代码嵌入配置
- 使用1.2配置方式,并设置如下值:
- fs.default.name(hadoop2.0兼容1.0该配置项名称,也可使用"fs.defaultFS")
- dfs.nameservices
- dfs.ha.namenodes.<your_nameservices>
- dfs.namenode.rpc-address.<your_nameservices>.xxx
- dfs.namenode.rpc-address.<your_nameservices>.yyy
- dfs.client.failover.proxy.provider.<your_nameservices>
HA配置总结
方法一的优点是不需要修改代码,缺点是要维护配置文件,方法二要修改系统代码,但不需要维护配置文件
-end
相关推荐
因为CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel命令生成的CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1文件hash不匹配,自己找到官网上的parcel.sha1文件解决了这个问题,共享给大家
### CDH 6.3.2 升级 Hive 至 3.x 后登录 HiveServer2 连接失败问题分析及解决方法 #### 一、问题背景与现象 在将 Cloudera Data Hub (CDH) 6.3.2 版本中的 Hive 升级到 3.x 版本后,用户在尝试通过 JDBC 连接到 ...
".parcel"文件是Cloudera的部署单位,包含可分发的软件组件,"SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el6.parcel"即是Spark 2.4.0的 parcel 文件,用于在CDH集群中安装和管理Spark。".parcel.sha"文件是...
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha
cdh7.1.7包括: CDH-7.1.7-1.cdh7.1.7.p0.15945976-el7.parcel CDH-7.1.7-1.cdh7.1.7.p0.15945976-el7.parcel.sha1 CDH-7.1.7-1.cdh7.1.7.p0.15945976-el7.parcel.sha256 manifest.json cm7.4.7包括: cloudera-...
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1 CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256 cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm ...
Docker 容器部署 CDH6.X 一、Docker 容器部署 CDH6.X 概述 Docker 容器部署 CDH6.X 是一种基于 Docker 容器的 CDH 集群部署解决方案,旨在提供一个高效、灵活和可扩展的大数据集群环境。该解决方案通过使用 Docker...
SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7 SHA下载
kudu的rpm安装包,包含以下六个资源: kudu-1.4.0+cdh5.12.2+0-1.cdh5.12.2.p0.8.el7.x86_64.rpm kudu-client0-1.4.0+cdh5.12.2+0-1.cdh5.12.2.p0.8.el7.x86_64.rpm kudu-client-devel-1.4.0+cdh5.12.2+0-1.cdh...
CDH6.3.2完整安装包网盘下载,包含 CDH-6.3.2-1.cdh6.3.2.p0.1605554-bionic.parcel、CDH-6.3.2-1.cdh6.3.2.p0.1605554-bionic.parcel.sha1、CDH-6.3.2-1.cdh6.3.2.p0.1605554-bionic.parcel.sha256、CDH-6.3.2-1....
从2021年1月31日开始,所有Cloudera软件都需要有效的订阅,并且只能通过付费墙进行访问。也就是说CDH各版本都不能免费获取了。 安装教程中详细说明了安装过程中遇到...CentOS7.6下CDH6.3.2离线安装教程(正式环境).docx
由于CSDN上传文件大小限制,大家可以下载《CDH6.3.2下载.txt》获取网盘地址进行下载,我打包了CDH6.3.2 搭建所需要的各种安装文件,包括: manifest.json cloudera-manager.repo RPM-GPG-KEY-cloudera cm6.3.1-...
大数据组件,官方版本:CDH5.9.0 操作系统:CentOS7/RHEL7 完整系列: CDH-5.9.0-1.cdh5.9.0.p0.23-el7.parcel(该文件被分割成三个压缩包,例如:.aa/.ab.ac) CDH-5.9.0-1.cdh5.9.0.p0.23-el7.parcel.sha 由于 ...
4. **配置CDH**:安装完成后,需要配置各个组件的配置文件,包括`core-site.xml`, `hdfs-site.xml`, `yarn-site.xml`, `mapred-site.xml`, `hive-site.xml`等,以适应你的集群环境。 5. **格式化NameNode**:首次...
CDH 大数据平台安装包,版本 6.3.1 本人亲测可以使用,如果安装有问题可以QQ沟通:417318838 CDH-6.3.1-1.cdh6.3.1.p0.1470567-el7.parcel CDH-6.3.1-1.cdh6.3.1.p0.1470567-el7.parcel.sha1 cm6.3.1-redhat7.tar.gz ...
CDH6.3.2 亲测可用 对应CM6.3.1
本资源打包了CDH7.1.5 搭建所需要的各种安装文件,包括: cm7.2.4-redhat7.tar.gz manifest.json cloudera-manager.repo RPM-GPG-KEY-cloudera CDH-7.1.5-1.cdh7.1.5.p0.7431829-el7.parcel CDH-7.1.5-1.cdh7.1.5.p0...
CDH 5.X版本安装手册,在安装CDH5.14.2的过程中整理的。
在大数据处理领域,Cloudera Distribution Including Apache Hadoop (CDH) 是一个广泛使用的平台,它不仅包含Hadoop的核心组件,还提供了丰富的附加服务。为了确保系统的稳定性和可靠性,采用CDH进行HA(高可用性)...
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1 CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256 manifest.json CentOS-7-x86_64-DVD-1611.iso cm6.3.1-redhat7....