Impala是Cloudra公司发布的实时查询开源项目,基于Hive但使用内存进行计算,是使用CDH的首选PB级大数据实时查询分析引擎。
Impala的安装方式有两种,CM方式和手动安装,手动安装比较麻烦,需要额外的步骤验证与其他组件的交互,这里采用CM的方式安装。
1、安装准备
MySQL5.6.17版本
[root@dnode2 lucl]# rpm -ivh MySQL-server-5.6.17-1.el6.x86_64.rpm
由于版本冲突,卸载之前的MySQL5.1.71版本
[root@dnode2 lucl]# yum -y remove mysql-libs-5.1.71*
再次安装MySQL就可以了。
[root@dnode2 lucl]# rpm -ivh MySQL-server-5.6.17-1.el6.x86_64.rpm
[root@dnode2 lucl]# rpm -ivh MySQL-client-5.6.17-1.el6.x86_64.rpm
目录 | 说明 |
/usr/bin | Client programs and scripts |
/usr/sbin | The mysqld server |
/var/lib/mysq | 数据文件 |
/usr/my.cnf | 配置文件 |
2、下载CM和CDH
CM当前最新版本为5.5.1,这里安装CM5.4.0和CDH5.4.0。
http://www.cloudera.com/content/www/en-us/downloads.html
在该网站能够找到CM和CDH的下载链接,下载时选定了相应的版本后,会有安装的帮助信息。
安装CM可以使用在线安装和离线安装两种方式,在线安装也需要将基础安装包下载到本地再进行安装,安装过程中自动下载需要安装的软件,但对于带宽要求较高,由于国内的网络环境下载境外的资源时容易受到限制,影响安装速度,可以通过在本地配置yum源进行安装。
http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.4.0/
实际需要使用的文件为RPMS/x86_64目录下的文件:
http://archive.cloudera.com/cdh5/parcels/
说明:我的虚拟机环境为Centos6.5,这里只需要下载el6版本的即可。
3、将软件发布成web服务
在nnode节点上启动HTTP服务,CM和CDH的介质需要放在HTTP服务器的root目录下。
[root@nnode ~]# service httpd start
验证Web服务:
查找httpd的根目录:
[hadoop@nnode html]$ cat /etc/httpd/conf/httpd.conf |grep var/www/html
DocumentRoot "/var/www/html"
<Directory "/var/www/html">
[hadoop@nnode html]$ ll /var/www/html
total 0
[hadoop@nnode html]$
将下载的cm及cdh目录下的文件拷贝到该根目录下:
[root@nnode html]# mv /lucl/Cloudera/cm5 .
[root@nnode html]# mv /lucl/Cloudera/cdh5 .
RPM-GPG-KEY-cloudera的下载地址为:
https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
目录结构:
[root@nnode html]# pwd
/var/www/html
[root@nnode html]# ll
total 12
drwxrwxr-x 3 hadoop hadoop 4096 Jan 10 04:27 cdh5
drwxrwxr-x 4 hadoop hadoop 4096 Jan 10 06:18 cm5
-rwxr-xr-x 1 root root 1690 Jan 10 04:15 RPM-GPG-KEY-cloudera
[root@nnode html]#
cm5的目录结构为:
[root@nnode x86_64]# pwd
/var/www/html/cm5/RPMS/x86_64
[root@nnode x86_64]# ls
cloudera-manager-agent-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-daemons-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-server-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-server-db-2-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
enterprise-debuginfo-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
jdk-6u31-linux-amd64.rpm
oracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm
[root@nnode x86_64]#
cdh5的目录结构为:
[root@nnode 5.4.0]# pwd
/var/www/html/cdh5/parcels/5.4.0
[root@nnode 5.4.0]# ll -h
total 1.2G
-rwxrwxr-x 1 hadoop hadoop 1.2G Jan 10 02:54 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel
-rwxrwxr-x 1 hadoop hadoop 41 Jan 10 02:54 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel.sha1
-rwxrwxr-x 1 hadoop hadoop 42K Jan 10 02:54 manifest.json
[root@nnode 5.4.0]#
分别在cm5和parcels目录下执行createrepo .命令,为rpm建立索引
[root@nnode cm5]# createrepo .
Spawning worker 0 with 7 pkgs
Workers Finished
Gathering worker results
Saving Primary metadata
Saving file lists metadata
Saving other metadata
Generating sqlite DBs
Sqlite DBs complete
[root@nnode cm5]#
# 执行后repodata目录会生成相应的文件。
[root@nnode parcels]# createrepo .
Saving Primary metadata
Saving file lists metadata
Saving other metadata
Generating sqlite DBs
Sqlite DBs complete
[root@nnode parcels]
4、配置yum源
通过cloudera网站下载repo资源文件
cloudera-manager的repo文件
https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo
cloudera-cdh的repo文件
https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/cloudera-cdh5.repo
说明:
[url]https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera[url]
和
[url]https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera[url]
内容实际是一样的,这里就使用了一份。
[root@nnode yum.repos.d]# cat cloudera-cdh5.repo
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://nnode/cdh5/parcels/
gpgkey=http://nnode/RPM-GPG-KEY-cloudera
gpgcheck = 1
[root@nnode yum.repos.d]# cat cloudera-manager.repo
[cloudera-manager]
# Packages for Cloudera Manager, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera Manager
baseurl=http://nnode/cm5/
gpgkey=http://nnode/RPM-GPG-KEY-cloudera
gpgcheck = 1
[root@nnode yum.repos.d]#
5、下载安装脚本
http://archive.cloudera.com/cm5/installer/5.4.0/cloudera-manager-installer.bin
6、执行安装
chmod u+x cloudera-manager-installer.bin
在图形界面下执行./cloudera-manager-installer.bin
7、访问验证
http://nnode:7180
- 大小: 221.4 KB
- 大小: 265 KB
- 大小: 390.4 KB
- 大小: 111.5 KB
- 大小: 71.8 KB
- 大小: 77 KB
- 大小: 44.7 KB
- 大小: 87 KB
- 大小: 66.9 KB
- 大小: 190.4 KB
分享到:
相关推荐
由于Impala的版本是CDH的,所以安装Impala的涉及到的Hive、Hadoop、Spark、Hbase等环境也要统一使用CDH版本。 本文档部署impala时所用到的Hive、Hadoop等环境的安装方式是使用tar包方式安装的(cdh版本的tar包安装...
通过以上介绍可以看出,Cloudera Impala 不仅是一款功能强大的实时查询引擎,而且其与 Hive 的高度集成特性也极大地简化了用户的学习曲线。对于需要处理大量结构化或半结构化数据的企业而言,Impala 的引入无疑是一...
7. **学习与参考**:参考提供的文档如"Impala安装文档.doc"、"Impala.doc"、"Impalaѧϰ.doc"以及"参考文档",这些文档会详细介绍安装过程中的细节、常见问题和解决方案,帮助你更好地理解和使用Impala。 通过以上...
2.3.0版本是在Impala发展过程中的一个重要里程碑,它引入了多项改进和新特性,如更优化的查询执行、增强的SQL支持以及与CDH(Cloudera Distribution Including Apache Hadoop)5.5.1版本的紧密集成。 CDH5.5.1是...
一、安装Cloudera Manager Server Cloudera Manager Server是大数据平台的核心组件,负责管理和监控大数据集群。安装Cloudera Manager Server需要使用yum install命令安装cloudera-manager-daemons、cloudera-...
- **统一数据访问**:Impala作为CDH的一部分,能够访问存储在HDFS、HBase等不同存储系统中的数据,为用户提供统一的数据访问接口。 - **资源管理**:通过YARN进行资源调度和管理,确保Impala能够在高负载下稳定运行...
此目录中的Docker脚本会生成CentOS 6 Docker VM并安装所有CDH组件(Hadoop,Spark,Hbase,Hive,Impala,Hue,Zookeeper,Oozie等)。 如何建立cdh容器? docker build -t docker-cdh54 . 如何运行cdh容器? ...
一、CDH5.12安装 CDH5.12是Cloudera在2017年发布的一个稳定版本,主要针对Hadoop 2.x系列进行优化。以下是CDH5.12在RHEL7.2上的安装步骤: 1. **系统准备**:确保操作系统为RHEL7.2,并更新所有软件包,安装必要的...
3. 安装CDH集群组件:安装CDH集群的各个组件,包括HDFS、MapReduce、YARN、Hive、Impala等。 4. 配置CDH集群:配置CDH集群的各个组件,包括配置HDFS、MapReduce、YARN、Hive、Impala等。 CDH集群组件安装 1. HDFS...
cdh6\6.3.0\redhat7\yum\RPMS\noarch cdh6\6.3.0\redhat7\yum\RPMS\x86_64 2个...包含hadoop hive hbase bigtop impala spark kudu zookeeper sqoop flume 等等全系列安装rpm包 cdh6\6.3.0\parcels 包含cloudera rpm包
《CDH安装手册》是大数据领域的一份重要参考资料,主要针对Hadoop的安装与部署进行详细阐述。CDH,全称Cloudera Distribution Including Apache Hadoop,是由Cloudera公司提供的一个开源大数据平台,它包含了多个...
Impala是Apache Hadoop生态系统中的一个高性能、实时查询系统,专为大数据分析设计。它能够直接在HDFS(Hadoop Distributed File System)和HBase上运行SQL查询,无需将数据移动到其他系统,大大提高了数据分析的...
CDH中的一些组件如Hue、Impala可能需要MySQL数据库服务,因此需要离线安装MySQL,并配置好相应的系统路径和环境变量。 3.5 **关闭防火墙** 为了方便服务间的通信,通常建议在所有节点上关闭防火墙或配置相应的端口...
在CDH(Cloudera Distribution Including Apache Hadoop)中,Impala是一个用于处理大数据的开源SQL查询引擎,它提供快速、交互式的分析能力。Impala与Hadoop生态系统中的其他组件如HDFS、HBase和Hive等紧密集成,...
这一步骤是安装Impala前的必要条件。 接着是Impala的安装步骤,这里以rpm包的安装为例进行说明。首先需要下载Impala的安装包,安装地址通常可以在Cloudera提供的URL中找到。然后在目标机器(例如node02和node03)上...
首先,CDH 5.11.2是Cloudera在2017年发布的一个稳定版本,它包含了多个大数据处理组件,如Hadoop、HBase、Spark、Impala等,为企业提供了一个全面的数据处理和分析环境。在开始安装之前,理解硬件和系统需求至关重要...
CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司提供的一个全面、经过优化且企业级的Hadoop发行版,包含了多个相关项目,如Hive、HBase、Impala和Spark等。CDH5是该发行版的一个版本,它提供了...
在本文中,我们将详细探讨在REDHAT7.2操作系统上安装Cloudera Distribution including Apache Hadoop(CDH)5.10版本以及Kudu1.2的过程。这个过程将分为几个关键步骤,从前期准备到集群的完整性检查,都包含在内。 ...
本人亲自安装测试通过后整理的的cdh5.16.2离线安装教程 CM安装及部署教程.md cloudera-manager-centos7-cm5.16.2_x86_64.tar.gz manifest.json CDH-5.16.2-1.cdh5.16.2.p0.8-el7.parcel.sha1 CDH-5.16.2-1.cdh5.16.2...
cdh6.3.0安装部署包,适合redhat7