`

storm 安装

 
阅读更多
--------------------------------------------strom set up-------------------------------------

1.set up a zookeeper cluster

2.set up ZeroMQ 2.1.7
 
 
tar -xzf zeromq-2.1.7.tar.gz
  cd zeromq-2.1.7
  ./configure
  make
  make install


  configure: error: cannot link with -luuid, install uuid-dev.
  #yum install libuuid-devel

3.set up jzmq

 
unzip jzmq-master.zip
  cd jzmq-master
  ./autogen.sh
  ./configure
  make
  make install


  autogen.sh: error: could not find libtool.  libtool is required to run autogen.sh.
  #yum install libtool

4.set up Java 6
5.set up Python 2.6.6
6.set up unzip

配置参考
http://www.cnblogs.com/panfeng412/archive/2012/11/30/how-to-install-and-deploy-storm-cluster.html
7.修改storm.yaml配置文件
Storm发行版本解压目录下有一个conf/storm.yaml文件,用于配置Storm。默认配置在这里可以查看。conf/storm.yaml中的配置选项将覆盖defaults.yaml中的默认配置。以下配置选项是必须在conf/storm.yaml中进行配置的:

1) storm.zookeeper.servers: Storm集群使用的Zookeeper集群地址,其格式如下:


storm.zookeeper.servers:
  - "111.222.333.444"
  - "555.666.777.888"


如果Zookeeper集群使用的不是默认端口,那么还需要storm.zookeeper.port选项。

2) storm.local.dir: Nimbus和Supervisor进程用于存储少量状态,如jars、confs等的本地磁盘目录,需要提前创建该目录并给以足够的访问权限。然后在storm.yaml中配置该目录,如:


storm.local.dir: "/home/admin/storm/workdir"

3) java.library.path: Storm使用的本地库(ZMQ和JZMQ)加载路径,默认为"/usr/local/lib:/opt/local/lib:/usr/lib",一般来说ZMQ和JZMQ默认安装在/usr/local/lib 下,因此不需要配置即可。

4) nimbus.host: Storm集群Nimbus机器地址,各个Supervisor工作节点需要知道哪个机器是Nimbus,以便下载Topologies的jars、confs等文件,如:


nimbus.host: "111.222.333.444"

5) supervisor.slots.ports: 对于每个Supervisor工作节点,需要配置该工作节点可以运行的worker数量。每个worker占用一个单独的端口用于接收消息,该配置选项即用于定义哪些端口是可被worker使用的。默认情况下,每个节点上可运行4个workers,分别在6700、6701、6702和6703端口,如:

supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703


2.5 启动Storm各个后台进程
最后一步,启动Storm的所有后台进程。和Zookeeper一样,Storm也是快速失败(fail-fast)的系统,这样Storm才能在任意时刻被停止,并且当进程重启后被正确地恢复执行。这也是为什么Storm不在进程内保存状态的原因,即使Nimbus或Supervisors被重启,运行中的Topologies不会受到影响。

以下是启动Storm各个后台进程的方式:

Nimbus: 在Storm主控节点上运行"bin/storm nimbus >/dev/null 2>&1 &"启动Nimbus后台程序,并放到后台执行;
Supervisor: 在Storm各个工作节点上运行"bin/storm supervisor >/dev/null 2>&1 &"启动Supervisor后台程序,并放到后台执行;
UI: 在Storm主控节点上运行"bin/storm ui >/dev/null 2>&1 &"启动UI后台程序,并放到后台执行,启动后可以通过http://{nimbus host}:8080观察集群的worker资源使用情况、Topologies的运行状态等信息。
DRPC: 在Storm主控节点上运行"bin/storm drpc >/dev/null 2>&1 &"启动drpc

注意事项:
   1.Storm后台进程被启动后,将在Storm安装部署目录下的logs/子目录下生成各个进程的日志文件。
   2.经测试,Storm UI必须和Storm Nimbus部署在同一台机器上,否则UI无法正常工作,因为UI进程会检查本机是否存在Nimbus链接。
   3.为了方便使用,可以将bin/storm加入到系统环境变量中。
至此,Storm集群已经部署、配置完毕,可以向集群提交拓扑运行了。


8.启动storm作业
 
/export/servers/storm-0.8.2-nimbus/bin/storm jar storm-starter-0.0.1-SNAPSHOT.jar storm.starter.trident.TridentWordCount wordcount


9. 2013-09-02 15:31:53 worker [WARN] Received invalid messages for unknown tasks. Dropping... 问题
修改host,即hostname 要和hostname -i 对应起来,不能出现127.0.0.1 ,修改方法如下:
a、设置hostname:
    $
hostname pc-name

b、$
sudo vim /etc/sysconfig/network

    设置 HOSTNAME=pc-name
c、$
sudo /etc/hosts

  
127.0.0.1 localhost localhost.localdomain
   ::1 localhost6 localhost6.localdomain6 
   10.12.117.78 pc-name 




   
分享到:
评论
1 楼 di1984HIT 2014-07-08  
写的很好啊。

相关推荐

    storm安装所需

    0-检查gcc,python版本:python -V,要有gcc-c++ 1-jdk安装 2-解压缩zk 3-安装zeromq configure: error: cannot link with -luuid, install uuid-dev rpm -ivh uuid-1.6.1-10.el6.x86_64.rpm ...修改/etc/hosts,storm.yaml

    zk-kafka-redis-storm安装

    在"zk-kafka-redis-storm安装"过程中,首先需要安装Zookeeper,确保集群的协调和数据一致性。接着是Kafka的部署,设置好broker配置、创建主题并配置消费者和生产者。安装Redis时要注意选择合适的版本,配置网络参数...

    大数据处理框架:Storm:Storm安装与配置.docx

    大数据处理框架:Storm:Storm安装与配置.docx

    项目1-Storm安装与编程实践1

    【Storm安装与编程实践】 Storm是一款强大的开源实时计算系统,由Twitter开发并开源,它在实时数据处理领域扮演着与Hadoop在批处理中的角色相似的重要地位。Storm的设计目标是简单、高效、可靠地处理流数据,支持...

    storm安装笔记.txt

    storm安装笔记

    storm安装软件包

    在"storm安装软件包"中,提供的"apache-storm-0.10.0"是Apache Storm 的一个特定版本,0.10.0 是其历史版本之一。这个版本可能包含了Storm的核心组件和相关的依赖库,使得用户能够快速地在本地或集群环境中搭建起...

    细细品味Storm_Storm简介及安装

    #### 二、Storm安装 **2.1 版本选择** 在安装之前,应先了解所需的Storm版本及其兼容性。通常建议使用最新的稳定版本。 **2.2 安装Zookeeper** 由于Zookeeper在Storm集群中扮演着协调角色,因此首先需要安装...

    storm0.9x安装所需所有包(全)

    【描述】中提到的"一直没找到真正齐全可用的storm安装所需包",表明了在安装Storm的过程中可能会遇到一些困难,因为完整的依赖包集合并不总是易于获取。这通常涉及到多个组件,包括Storm的核心库、依赖的JAR包、配置...

    storm1.1.0版本单节点部署

    Storm 1.1.0 单节点部署指南 Apache Storm 是一个开源的分布式实时计算系统,它能够处理大规模的数据流并进行实时分析。在单节点部署中,所有的 Storm 组件,包括 Nimbus、Supervisor 和 UI,都将运行在同一台机器...

    storm深入学习.pdf

    Storm安装过程主要包括安装ZeroMQ、jzmq、Python2.7.2和Storm四个步骤。 1. 安装ZeroMQ:首先,需要下载ZeroMQ的源代码,使用wget命令下载,然后解压缩并安装。 2. 安装jzmq:下载jzmq的源代码,使用git clone命令...

    flume,kafka,storm整合

    4. **Storm安装**: - 下载Apache Storm 0.9.7的tar.gz包。 - 解压。 5. **Zookeeper安装**: - 下载Zookeeper 3.4.5的tar.gz包。 - 解压。 为了防止端口冲突,需要修改配置文件: - **Zookeeper配置**: - ...

    批量下载】storm环境搭建v1等.zip

    8. **批量下载】storm环境搭建v1等.zip**:这部分可能包含不同版本的Storm安装和配置教程,每个版本可能有不同的注意事项和更新内容,帮助用户根据自己的需求选择合适的版本进行搭建。 总的来说,这个压缩包很可能...

    storm组件安装部署.doc

    【Storm组件安装部署】 Storm是一个开源的分布式实时流计算框架,它被广泛应用于实时日志分析、个性化推荐、实时监控等多个领域。这个文档主要聚焦于如何在单机环境下部署和运行Storm,尤其针对CentOS 6.4系统,...

    基于Storm构建实时热力分布项目实战.txt

    - **Apache Storm安装配置**:包括集群部署、配置参数优化等。 - **消息队列搭建**:选择Apache Kafka作为数据传输中间件,实现高效可靠的数据传输。 - **数据存储方案选择**:根据业务需求选择合适的数据存储技术,...

    Storm实战培训教程.pptx

    5. Storm安装部署: - 安装Storm通常涉及下载最新稳定版本的Storm发行包,配置环境变量,然后启动Nimbus、Supervisor和服务监控工具Zookeeper。 - 部署时,需要考虑集群规模、硬件配置和网络环境,以满足实时处理...

    基于Storm的分布式流计算集群详细配置

    1. **Storm安装**:下载Storm的tar包,解压并创建软链接。配置`conf/storm.yaml`,包括`nimbus.host`、`supervisor.slots.ports`、`storm.zookeeper.servers`等参数。 2. **Nimbus配置**:在Nimbus节点上,确保`...

    storm单本安装及集群安装配置

    storm单本安装及集群安装配置,详情见文档,另需要注意storm.yaml的配置。

    Storm实战构建大数据实时计算

    #### 三、Storm安装与配置 1. **环境准备**:安装Java环境,并确保版本满足Storm的要求。同时,还需要安装Zookeeper作为集群协调服务。 2. **下载与解压**:从Apache官方下载Storm压缩包,并解压到指定目录。 3. **...

    storm集群安装与运维.doc

    storm集群安装与运维.doc

Global site tag (gtag.js) - Google Analytics