开始学习Storm,本文主要记录Storm集群安装部署步骤,不包括对Storm的介绍。
安装storm集群,需要依赖以下组件:
- Zookeeper
- Python
- Zeromq
- Storm
- JDK
- JZMQ
故安装过程根据上面的组件分为以下几步:
- 安装JDK
- 安装Zookeeper集群
- 安装Python及依赖
- 安装Storm
另外,操作系统环境为:Centos6.4,安装用户为:root。
安装JDK
安装jdk有很多方法,可以参考文博客使用yum安装CDH Hadoop集群中的jdk安装步骤,需要说明的是下面的zookeeper集群安装方法也可以参考此文。
不管你用什么方法,最后需要配置JAVA_HOME并检测当前jdk版本:
$ java -version
java version "1.6.0_31"
Java(TM) SE Runtime Environment (build 1.6.0_31-b04)
Java HotSpot(TM) 64-Bit Server VM (build 20.6-b01, mixed mode)
安装Zookeeper集群
可以参考文博客使用yum安装CDH Hadoop集群中的Zookeeper集群安装步骤。
安装Python及依赖
一般操作系统上都安装了Python,查看当前Python版本:
$ python -V
Python 2.6.6
下载Zeromq
$ wget http://download.zeromq.org/zeromq-4.0.4.tar.gz
$ tar zxvf zeromq-4.0.4.tar.gz
$ ./configure
$ make & make install
安装Jzmq
$ git clone git://github.com/nathanmarz/jzmq.git
$ cd jzmq
$ ./autogen.sh
$ ./configure
$ make & make install
安装Storm
下载稳定版本的storm,然后解压将其拷贝到/usr/lib/storm目录:
$ wget https://github.com/downloads/nathanmarz/storm/storm-0.8.1.zip
$ unzip storm-0.8.1.zip
$ mv storm-0.8.1 /usr/lib/storm
接下来,配置环境变量:
export STORM_HOME=/usr/lib/storm export PATH=$PATH:$STORM_HOME/bin
建立storm存储目录:
$ mkdir /tmp/storm
修改配置文件/usr/lib/storm/conf/storm.yaml,修改为如下:
storm.zookeeper.servers: - "cdh1" - "cdh2" - "cdh3" ui.port: 8081 nimbus.host: "cdh2" storm.local.dir: "/tmp/storm" supervisor.slots.ports: - 6700 - 6701 - 6702 - 6703
其中,配置参数说明:
-
storm.zookeeper.servers
:Storm集群使用的Zookeeper集群地址,如果Zookeeper集群使用的不是默认端口,那么还需要storm.zookeeper.port
选项 -
ui.port
:Storm UI的服务端口 -
storm.local.dir
:Nimbus和Supervisor进程用于存储少量状态,如jars、confs等的本地磁盘目录 -
java.library.path
: Storm使用的本地库(ZMQ和JZMQ)加载路径,默认为"/usr/local/lib:/opt/local/lib:/usr/lib",一般来说ZMQ和JZMQ默认安装在/usr/local/lib
下,因此不需要配置即可。 -
nimbus.host
: Storm集群Nimbus机器地址 -
supervisor.slots.ports
: 对于每个Supervisor工作节点,需要配置该工作节点可以运行的worker数量。每个worker占用一个单独的端口用于接收消息,该配置选项即用于定义哪些端口是可被worker使用的。默认情况下,每个节点上可运行4个workers,分别在6700、6701、6702和6703端口
更多配置参数,请参考Storm配置项详解。
最后,启动Storm各个后台进程:
主控节点上启动nimbus:
$ storm nimbus >/dev/null 2>&1 &
在Storm各个工作节点上运行:
$ storm supervisor >/dev/null 2>&1 &
在Storm主控节点上启动ui:
$ storm ui >/dev/null 2>&1 &
然后,你可以访问http://cdh2:8081/查看集群的worker资源使用情况、Topologies的运行状态等信息。
相关推荐
Storm集群的部署和配置是构建实时大数据处理系统的关键步骤,本文将详细讲解这一过程。Storm是一个分布式实时计算系统,能够处理大规模数据流,确保每个事件都得到正确的处理。以下是搭建Storm集群的详细步骤: 1. ...
这将在本地模拟一个Storm集群。若要部署到生产环境,需要配置多节点集群,包括Nimbus(主控节点)、Supervisor(工作节点)和UI(用户界面)。 **配置和运行拓扑** 创建Storm拓扑是实现具体实时计算任务的关键。...
本文档主要介绍如何在多台服务器上部署一个完整的Storm集群,其中包括JDK安装、Zookeeper集群安装以及Storm集群的搭建。整个过程分为三个主要部分:Java环境(JDK)的安装、Zookeeper集群的配置以及Storm集群的具体...
#### 三、Storm集群部署步骤 ##### 1. 创建并配置Storm目录 - 使用`sudo mkdir /export/servers`命令创建`/export/servers`目录。 - 赋予`/export`目录可读写执行权限:`sudo chmod -R 777 /export`。 - 在`/...
本文将详细介绍Storm集群环境搭建的步骤,包括集群规划、前置条件、集群搭建、安装包分发、启动集群和高可用验证等方面。 一、集群规划 Storm集群环境搭建需要考虑多台服务器的规划,以确保高可用和负载均衡。在...
### storm集群部署手册知识点梳理 #### 一、安装虚拟机 **知识点1:虚拟机软件与操作系统准备** - **软件需求:** - VMware Workstation 12:虚拟机管理软件。 - CentOS-6.5-x86_64-bin-DVD1.iso:64位操作系统...
以下是详细的部署步骤: 1. **安装JDK**:在所有节点上安装JDK,设置好环境变量`JAVA_HOME`,并确保`java`命令可被全局调用。 2. **安装Zookeeper**:下载Zookeeper的RPM包,使用`rpm -ivh`命令安装。配置`zoo.cfg...
通过上述步骤,我们可以完成Storm集群的基础安装与配置工作。值得注意的是,在实际部署过程中还需要考虑网络环境、硬件配置等因素对性能的影响,并根据具体需求调整配置参数以达到最佳效果。此外,持续监控集群状态...
### 从零开始搭建Storm集群 #### 一、概述 Apache Storm 是一款开源的大规模实时计算系统,类似于Hadoop处理批量数据,Storm处理的是实时数据流。它支持各种编程语言,能够实现高吞吐量、低延迟的数据处理,并且...
以下是详细的部署步骤: 一、安装介质准备 首先,你需要访问 Apache Storm 的官方网站 http://storm.apache.org/downloads.html 下载对应版本的发行包,这里我们选择的是 1.1.0 版本。下载完成后,使用 `tar` 命令...
CDH的安装与配置是大数据集群部署的关键步骤,手册会详细介绍如何规划硬件资源、安装CDH软件栈、配置集群节点以及进行性能调优。此外,还会涉及数据安全、监控和备份恢复等企业级应用的关键环节。 Storm则是实时...
由于Zookeeper在Storm集群中扮演着协调角色,因此首先需要安装Zookeeper。步骤包括下载、配置环境变量、设置配置文件等。 **2.3 安装Storm** - **下载**:从官方网站下载Storm的安装包。 - **解压**:将安装包解压...
总结,Apache Storm 1.2.1单机部署涉及以下步骤:安装JDK、下载并解压Storm、配置环境变量、启动Nimbus和Supervisor服务、编写和打包拓扑代码、提交拓扑到Storm集群以及监控和管理拓扑。通过这个过程,你可以在本地...
这个实例可能是为了演示如何在Storm集群上部署和运行一个简单的数据处理任务。 描述中提到,“命令在里面cmd.txt”,这意味着cmd.txt文件包含了运行该实例所需的命令。用户需要根据自己的环境修改words111.txt的...
### 二、ZooKeeper集群部署 ZooKeeper是Storm集群的核心组件,用于协调各个节点的状态和元数据管理。以下步骤介绍了ZooKeeper的安装和配置: 1. **JDK安装**:所有服务器都需要安装Java开发环境(JDK),这里是JDK...
7. **storm部署**:这部分内容可能详细介绍了如何在不同的环境下部署Storm集群,包括单机模式、本地模式和生产模式。理解这些部署方式有助于在不同场景下灵活运用Storm。 8. **wordCount**:WordCount是大数据处理...