`
wbj0110
  • 浏览: 1614520 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

Cloudera Manager 和 CDH 4 终极安

阅读更多

系统环境

操作系统:CentOS 6.5

Cloudera Manager 版本:4.8.1

CDH版本:4.5.0

各机器准备工作:

  yum -y groupinstall "Development tools"

  yum -y install wget 

Cloudera-manager压缩包地址:    http://archive.cloudera.com/cm4/cm/4/cloudera-manager-el6-cm4.8.1_x86_64.tar.gz 

CDH 下载地址:   http://archive.cloudera.com/cdh4/parcels/

IMPALA 下载地址:  http://archive.cloudera.com/impala/parcels/

Cloudera Search(SOLR)下载地址: http://archive.cloudera.com/search/parcels/latest/

官方安装参考 

http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/latest/Cloudera-Manager-Installation-Guide/cmig_install_path_C.html

官网介绍的安装方式有三种:

我们选择了第三种方法。

理由是第一种方法必须要求所有机器都能连网,而且外国网站不太稳定。一旦失败,重装非常痛苦。

第二种方法还没仔细研究,看上去要下载很多包。

第三种方法对系统侵入性最小,最大优点可实现全离线安装,而且重装什么的都非常方便。后期的集群统一包升级也非常好。

准备工作

以下所有操作都以root进行。

0 修改主机名

修改/etc/sysconfig/network文件

    NETWORKING=yes

    HOSTNAME=yc01

重启后生效:service  network  restart

修改/etc/hosts文件,类似

    192.168.1.191 yc01  
    192.168.1.192 yc02
    192.168.1.193 yc03
    192.168.1.194 yc04
    192.168.1.195 yc05

1 安装 salt (可忽略)

略。

2 打通 ssh 

所有机器,使用   ssh-keygen -t rsa    一路按回车就行了。

刚才都作甚了呢?主要是生成ssh的密钥和密钥的存放路径。 在 ~/.ssh下。

打开~/.ssh 下面至少有两个文件

在主结点上:

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

scp文件到其他机器:

scp ~/.ssh/authorized_keys root@yc02:~/.ssh/

现在登陆到其他机器就不用密码了。

3 安装 java

由于 CDH4 支持 JAVA7 ,考虑到 CDH5 只支持 JAVA7,果断上。(后面的Mysql也用了最新的5.6.16,后来发现悲剧了,不知道是哪个原因,于是JDK又改成了官方推荐版,还是不行,又把Mysql回退到5.1.X版本,最终可以了。个人猜测JDK还是可以用7的,Mysql只能用5.5,再往上就不行了。参考 http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/latest/CDH4-Requirements-and-Supported-Versions/cdhrsv_topic_2.html)

从Oracle官网下载解压JDK 。 tar zxvf jdk-7u51-linux-x64.gz 放到 /opt/java 下。

以前好像在哪看到过说,CDH 需要一个 /usr/java/default 的软链,才会识别。以防万一,建了一个,至少这样也更容易管理:

mkdir -p /usr/java ; cd /usr/java ;
ln -s /opt/java/jdk1.7.0_51 latest ; ln -s latest default

最后JAVA添加环境变量

export JAVA_HOME=/usr/java/default
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

  使配置生效

source /etc/profile

4 安装Mysql数据库 (安装过程后来直接跳过了,直接 yum -y install mysql-server  再建需要的数据库)

Cloudera Manager 自身的需要数据库,它现在支持 Mysql 、 PostgreSQL 和 Oracle ,本人没用过PostgreSQL ,Oracle 兴师动众,果断上 Mysql 。

Installing and Configuring a MySQL Database

官网上说了很多,总结起来三句话:

1) 安装一个 Mysql 

下载地址 http://dev.mysql.com/downloads/mysql/

下载了客户端和服务端

rpm -ivh MySQL-server-5.6.16-1.el6.x86_64.rpm

rpm -ivh MySQL-client-5.6.16-1.el6.x86_64.rpm

安装server是会提示 生成 root 的随机码。

SET PASSWORD = PASSWORD('ycmedia_2014');

默认mysql不会生成  /etc/my.cnf 文件,cp  /usr/my.cnf  /etc/my.cnf 

2) 配置MySql 自身的一些参数,和 CDH 没任何关系。只着重强调了一下 max_connections 的值。建议是 数据库数*100+50。大集群(50台以上)建议必须分开放。

过程: vi /etc/my.cnf ,修改哪些参数,参考上面那个链接。只为一般性目的的可直接跳过此步骤。 

3) 建数据库,授权。需要哪些库呢,免费版:amon、hmon、hive、smon、scm(Cloudera Manager 自身,我自己命名的)

 这些库的名字其实是可以自定义的。其它都是官网示例的名字,就这样吧。保持一致。只有最后一个库是我自己命名的。

create database hive   DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;    

create database smon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;   

create database hmon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;   

给用户授权,类似如下:

grant all on *.* to root@"%" Identified by "123456";

 5 关闭防火墙 和 SELinux

关闭防火墙:

service iptables stop (临时关闭)

chkconfig iptables off (重启后生效)

关闭SELINUX:

setenforce 0 (临时生效)

修改  /etc/selinux/config 下的  SELINUX=disabled (重启后永久生效)  

正式开工

1 安装 Cloudera Manager Server 和 Agents 

解压压缩包:

tar xzf /opt/package/cloudera-manager*.tar.gz -C /opt/; mv /opt/cm-4.8.1 /opt/cloudera-manager-4.8.1

添加 cloudera-scm 用户 

useradd --system --home=/opt/cloudera-manager-4.8.1/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

为了方便,下面称 /opt/cloudera-manager-4.8.1 为  <tarball root>

修改<tarball root>/ etc/cloudera-scm-agent/config.ini  下面的 server_port 和 server_host ,把server_port 改成ClouderaManager运行的主机名或ip, 默认server_port 端口是 7182

Cloudera Manager 会在下面目录保存一些玩意。

2 为Cloudera Manager 建立数据库

建立数据库前要下载 jdbc驱动,放到 <tarball root>/share/cmf/lib/ 下。

生成数据库

<tarball root>/share/cmf/schema/scm_prepare_database.sh mysql scm  -hlocalhost -uroot -p123456  --scm-host localhost scm scm scm

格式是:  scm_prepare_database.sh 数据库类型  数据库 服务器 用户名 密码  --scm-host  Cloudera_Manager_Server所在的机器  ....... 

后面那三个不知道代表什么,直接照抄官网的了。详细说明:

3 开启Cloudera Manager Server 端

在你上面安装的那台机器上开启Server端:

<tarball root>/etc/init.d/cloudera-scm-server start

设置成开机启动:

    cp <tarball root>/etc/init.d/cloudera-scm-server /etc/init.d/cloudera-scm-server
    chkconfig cloudera-scm-server on

4 开启Cloudera Manager Agents 端

先SCP <tarball root> 到所有机器上 ,然后在每台机器上开启Agents端:

sudo <tarball root>/etc/init.d/cloudera-scm-agent start

设置开机启动:

  cp <tarball root>/etc/init.d/cloudera-scm-agent /etc/init.d/cloudera-scm-agent
  chkconfig cloudera-scm-agent on

5 启动 Cloudera Manager 管理控制台

地址类似  http://example.com:7180/ ,默认端口是 7180,如果上面没改的话。

用户名密码都是 admin

 

至此:Cloudera Manager 安装完毕。

------------------------------------------------------------------------------------分割线不够华丽----------------------------------------------------------------------------------

----------------------------------------------------------------------------------此处需要华丽分割线--------------------------------------------------------------------------------

6  准备Parcels,用以安装 CDH

将前面下载的CDH 和 IMPALA 放到 /opt/cloudera/parcel-repo 下,再生成 sha 文件,

sha文件参照 http://archive.cloudera.com/cdh4/parcels/latest/manifest.json 里面,和每个文件是对应的。把 hash 值拿出来即可,最简单当然是直接计算一下就ok了。

     

 获取更多信息参阅:  Using Parcels

7 开始从界面安装 CDH4

从界面登陆后,选择版本

可以注意到,CDH以前的版本是有最大50个节点限制的,现在没有限制了。继续。

继续。

此处需要特别关注,我们明明有N台服务器的,现在只有一台,why ? 是因为我一开始在启动Cloudera Manager Agents 时没有修改 server_host=localhost ,

   vi ./etc/cloudera-scm-agent/config.ini  改成Cloudera Manager  server所在机器名。再重新启动agent( 在 <tarball root> 下  ./etc/init.d/cloudera-scm-agent restart)

  现在所有机器都有了。点击继续。

我们选择 Parcels  方式,继续。会安装cdh impala solr . 几分钟内应该就完成了。取决于你内网传输速度。

继续。

选择要安装的服务,特别注意,红框处【检查角色分配】,太不起眼啦!!! 曾经没注意,有点郁闷。点击分配角色。分配好后,继续,当然后期还是可以改的。。

测试连接的时候必须成功才能继续,这个地方,有可能会出现,在本地 root + 密码 是可以登陆上 mysql 的,这里测试时却会失败。主要还是因为对于root 的用户比较复杂。

因为你的root 帐户本质上可能是下图这样的,这个地方我对mysql理解的也不深,大意应该就是本地用的虽然也是root ,那是实质上并非同一个用户。

不管三七二十一,统统授权了。

grant all on *.* to root@"yc01" Identified by "123456"; 
grant all on *.* to root@"localhost" Identified by "123456"; 
grant all on *.* to root@"127.0.0.1" Identified by "123456";

另外此处有个备注,可观注下。比如说对于某个monitor,在前面我们分配角色时,分到了某一台机器,那么数据库最好也是在同一台机器。

点击继续。

修改成合适自己的配置。继续之前做下面两个操作。因为下一步HIVE的安装会失败,要提前把 jdbc包放到hive的各lib目录下。如

scp mysql-connector-java-5.1.28.jar root@yc02:/opt/cloudera/parcels/CDH-4.5.0-1.cdh4.5.0.p0.30/lib/hive/lib/

HUE也可能失败,报错如下:

不知道是什么包,所以一开始直接这么搞了: yum -y install libxslt.so.1 发现还是不行。

是缺少下面这个包:

yum -y install libxml2

耐心等待所有启动成功。 

http://www.cnblogs.com/thinkCoding/p/3567408.html

分享到:
评论

相关推荐

    cloudera manager 安装cdh 搭建大数据集群,详细讲解核心

    Cloudera Manager 安装 CDH 集群有多种方法,主要分为 Server 端和 Agent 端安装。 1. Server 端安装: * 使用 yum 安装 cm daemon 和 cm server,启动 server * 手动下载 packages,然后启动 server 2. Agent 端...

    CLOUDERA-Manager_中文手册(全 高清)+ CDH安装手册.pdf

    Cloudera Manager是一款基于大数据管理平台,用于管理Hadoop集群和CDH(Cloudera Distribution of Hadoop)集群。该手册详细介绍了Cloudera Manager的产品介绍、基本功能、监控功能等内容。 产品介绍 Cloudera ...

    ClouderaManager_CDH升级手册

    1. 本手册仅适用于 Cloudera Manager 5 以及 CDH5 以上的版本 2. Cloudera Enterprise 的是通过 parcel 包的形式进行安装的 3. Cloudera Enterprise 安装是基于外部数据库的 4. 若是由 CDH 5.3 升级至 CDH 5.4,则...

    Centos 7 离线安装Cloudera Manager6 和CDH6.3.1.docx

    CentOS 7 离线安装 Cloudera Manager 6 和 CDH 6.3.1 本文将指导您在 CentOS 7 环境中离线安装 Cloudera Manager 6 和 CDH 6.3.1。整个安装过程可以分为多个步骤,包括环境准备、系统配置、Java 环境配置、SSH 无...

    cdh7.5 cloudera manager 安装全套软件和视频推荐

    Cloudera Manager 是Cloudera提供的一款用于部署、管理和监控CDH集群的工具,它使得管理员能够更加高效地进行集群管理。在CDP时代,Cloudera Manager 依然扮演着重要的角色,它负责CDP集群的安装、配置、升级等操作...

    Cloudera Manager及CDH从5.4.8升级到5.12.1全过程&安装Spark2.2全过程

    本次升级的主要目的是将现有的 Cloudera Manager 和 CDH 版本从 5.4.8 更新至 5.12.1,并同时升级 JDK 至 1.8 版本,以及安装 Spark 2.2。此升级涉及多个组件和服务,因此需要进行详尽的规划和准备。 #### 集群现状...

    CLOUDERA-Manager-中文手册

    Cloudera Manager是CDH(Cloudera Distribution Including Apache Hadoop)的重要组成部分,CDH是一个全面的数据管理平台,集成了各种Hadoop组件,如HDFS、MapReduce、HBase等。作为市场领先的管理平台,Cloudera ...

    Cloudera Manager6.2.1及CDH最新版本安装全程记录

    Cloudera Manager6.2.1

    Cloudera-Manager3安装步骤

    以上步骤是安装Cloudera Manager 3和CDH3的基础流程,实际操作中可能还需要根据网络环境、安全策略和具体需求进行适当的调整。在后续的使用中,Cloudera Manager允许管理员轻松地扩展集群,管理数据流动,优化资源...

    Cloudera Manager 6.3.1 (文件1)

    cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm, cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm, cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm, cloudera-manager-server-db-2-6.3.1-...

    ubuntu完全分布式搭建CDH集群(Cloudera Manager)

    ### Ubuntu 完全分布式搭建 CDH 集群(Cloudera Manager) #### 搭建环境概述 本文档旨在详细介绍如何在 Ubuntu 14.04.3 系统下构建一个完整的 Cloudera Manager (CM) 管理的 CDH 集群。该集群将使用三台物理...

    Cloudera Manager API v14 中文

    Cloudera Manager API v14 是用于管理 Cloudera Data Platform (CDP) 和其他 Cloudera 产品的强大工具。它允许管理员通过 API 调用来监控、管理和配置集群。本文将详细介绍 API 中的关键端点及其功能。 #### 二、...

    ClouderaManager-中文手册-实战总结.pdf

    Cloudera Manager是CDH市场领先的管理平台,作为业界第一的端到端Apache Hadoop的管理应用,Cloudera Manager对CDH的每个部件都提供了细粒度的可视化和控制,从而设立了企业部署的标准。通过Cloudera Manager,运维...

    java调用Cloudera Manager Api实例

    Java调用Cloudera Manager API是一个复杂而关键的任务,它涉及到使用Java编程语言与Cloudera Manager服务器进行交互,以实现自动化管理和监控大数据集群。Cloudera Manager是管理Hadoop和其他Cloudera支持的数据处理...

    ClouderaManager运维_中文手册

    Cloudera Manager是CDH市场中领先的管理平台,由Cloudera公司开发,它是一个端到端的Apache Hadoop管理应用,提供了对CDH每个部件的细粒度可视化和控制功能。Cloudera Manager的目的是简化企业数据中心的管理,它...

    CLOUDERA-Manager_中文手册(全)

    文档将详细介绍如何安装和配置Cloudera Manager,以及如何通过其来安装和管理CDH。Cloudera Manager安装一般涉及数据库准备、服务器安装、Web界面配置和代理安装等步骤。 ### Cloudera Manager与Hadoop生态 文档中...

    cloudera manager的运行机制及目录

    Cloudera Manager是Cloudera公司提供的一套用于管理Apache Hadoop集群的软件,它简化了Hadoop集群的安装、部署和运维工作。Cloudera Manager使用C/S结构,包含一个Server端和若干Agent端。Server端负责集群的管理、...

    Cloudera Manager API v32.docx

    Cloudera Manager API v32 是一个针对 ...总的来说,Cloudera Manager API v32 是 Cloudera 管理工具箱中一个强大且灵活的组成部分,对于需要与 Cloudera 集群进行深度交互的开发和运维团队而言,它是不可或缺的。

Global site tag (gtag.js) - Google Analytics