`
bit1129
  • 浏览: 1070104 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【Storm二】Storm伪分布式安装

 
阅读更多

Storm运行依赖于如下软件

  • ZeroMQ
  • JzMQ
  • Zookeeper
  • Python
  • gcc编译环境

本文在Centos7上对Storm进行伪分布式安装,首先安装依赖的软件

 

安装Python和gcc

Centos7已经默认安装Python,在终端可以直接使用python命令查看版本

Centos7已经默认安装gcc,可终端可以使用gcc命令查看版本

 

安装Zookeeper3.4.6

1. 下载zookeeper3.4.6,http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz

2.  tar xzvf zookeeper-3.4.6.tar.gz

3.  sudo vim /etc/profile

 

export ZOOKEEPER_HOME=/home/hadoop/software/zookeeper-3.4.6
export $ZOOKEEPER_HOME:$PATH

 

4. cp /home/hadoop/software/zookeeper-3.4.6/conf/zoo_sample.cfg  /home/hadoop/software/zookeeper-3.4.6/conf/zoo.cfg

5. 编辑zoo.cfg,

    data_dir=/home/hadoop/software/zookeeper-3.4.6/data

 

安装ZeroMQ4.0.5

 

wget http://download.zeromq.org/zeromq-4.0.5.tar.gz
tar -zvxf zeromq-4.0.5.tar.gz
cd zeromq-4.0.5/
./configure
sudo make
sudo make install

 

安装JzMQ

 

 

sudo yum install git
git clone git://github.com/nathanmarz/jzmq.git
cd jzmq/

##没有touch这一步有可能在make的时候报如下错:*** No rule to make target `org/zeromq/ZMQException.class, needed by `all'.  Stop.
touch src/classdist_noinst.stamp 

sudo make
sudo make install

##如果在make install的时候报找不到org/zeromq/ZMQ$Context.class则需要编译java类
cd src/org/zeromq
javac *.java

###重新make和install
sudo make
sudo make install

 

 

 安装Storm

 

wget http://mirror.bit.edu.cn/apache/storm/apache-storm-0.9.3/apache-storm-0.9.3.tar.gz
tar xzvf apache-storm-0.9.3.tar.gz
sudo vim /etc/profile
export STORM_HOME=/home/hadoop/software/apache-storm-0.9.3
export PATH=$STORM_HOME/bin
source /etc/profile 

 

 配置Storm

 

vim /home/hadoop/software/apache-storm-0.9.3/conf/storm.yaml 

 

在对文件进行配置时,要注意格式,高亮显示

 

1. 配置Zookeeper的服务器地址

 

storm.zookeeper.servers:
     - "127.0.0.1"

 

2. 配置nimbus的地址

 

nimbus.host: "127.0.0.1"

 

3. 配置storm.local.dir

 

storm.local.dir: /home/hadoop/software/apache-storm-0.9.3/stormlocaldir

 

4. 配置Supervisor slots ports

 

supervisor.slots.ports:
       - 6700
       - 6701
       - 6702
       - 6703

 

启动Storm

 

1. 启动Zookeeper

 

 

$ZOOKEEPER_HOME/bin/zkServer.sh start
 

 

2. 启动Storm nimbus

 

bin/storm nimbus

 

3. 启动Storm supervisor

 

bin/storm supervisor

 

Storm启动后,在$STORM_HOME/logs目录下会有生成两个日志文件,nimbus.log和supervisor.log,日志的最后一行分别显示Starting Storm Nimbus...和Staring Storm Supervisor,在启动中似乎意味着Storm并未启动,实际上Storm已经启动。可以通过jps查看可以看到两个进程

 

61308 supervisor
61124 nimbus

 

运行Storm实例

1. 在Storm的安装目录中自带了一系列的Storm例子代码和打包好的jar包,其中包括最著名的WordCount实例,将它cp到bin目录下

 

cp /home/hadoop/software/apache-storm-0.9.3/examples/storm-starter/storm-starter-topologies-0.9.3.jar /home/hadoop/software/apache-storm-0.9.3/bin/storm-starter-topologies-0.9.3.jar 

 

2. 使用如下命令启动storm版本的WordCount实例

 

./storm jar storm-starter-topologies-0.9.3.jar storm.starter.WordCountTopology WordCountTopology

 

3. 程序开始执行后,在logs目录下产生了三个日志文件

    worker-6701.log 

    worker-6702.log

    worker-6703.log

 

4. 使用tail -f 观察它们的输出,如下是输出片段

 

 

 

 

 

 

查看Storm任务运行情况

1. 使用如下命令查看当前正在运行的Topology

 

./storm list

 

结果如下:

 

Topology_name        Status     Num_tasks  Num_workers  Uptime_secs
-------------------------------------------------------------------
WordCountTopology    ACTIVE     28         3            431   

 

2. 强杀一个正在执行的Topology

 

./storm kill WordCountTopology

 

执行结果:

 

Topology_name        Status     Num_tasks  Num_workers  Uptime_secs
-------------------------------------------------------------------
WordCountTopology    KILLED     28         3            527       

 

 Storm命令参数集合

 

Commands:
	activate
	classpath
	deactivate
	dev-zookeeper
	drpc
	help
	jar
	kill
	list
	localconfvalue
	logviewer
	monitor
	nimbus
	rebalance
	remoteconfvalue
	repl
	shell
	supervisor
	ui
	version

 

 

 Storm UI

使用./storm ui启动UI进行后,可以访问http://localhost:8080来查看Storm的运行状态,部分截图如下图所示:

 



 

 

 

 

 

 

 

 

参考:http://shiyanjun.cn/archives/241.html

  • 大小: 173.5 KB
  • 大小: 80.7 KB
分享到:
评论

相关推荐

    基于storm实时热点统计的分布式并行缓存预热

    二、基于storm+kafka完成商品访问次数实时统计拓扑的开发 ================================ maven构建出的一些问题,直接从maven中央仓库可能下载不到jar包,自己去百度一下jar,下载下来 根据错误提示,拷贝到...

    伪分布式的Hadoop+Hive+HBase搭建记录[收集].pdf

    总结来说,伪分布式Hadoop搭建涉及了HDFS、MapReduce、Hive、HBase和Storm等多个组件,这些技术一起构建了一个完整的数据处理生态系统。HDFS提供存储,MapReduce负责计算,Hive提供数据分析的SQL接口,HBase满足实时...

    storm分布式实时计算

    storm分布式实时计算,集成durid,zookeeper,hadoop等

    Storm-是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop

    Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop

    基于Storm的分布式实时数据流密度聚类算法.pdf

    此外,DBS-Stream算法在实现分布式计算时,通过Storm平台能够有效处理数据流的高速性和实时性要求,同时通过DBSCAN算法降低了时间复杂度和空间复杂度,提高了处理数据流中噪声数据的能力。 总体而言,DBS-Stream...

    基于Storm的分布式流计算集群详细配置

    总结来说,基于Storm的分布式流计算集群配置涉及多个步骤,包括服务器角色分配、ZooKeeper集群的搭建、Storm服务的安装和配置,以及拓扑的构建和提交。正确配置这些组件,可以实现高效、稳定的数据流处理。

    基于Storm的分布式实时信号处理系统.pdf

    基于Storm的分布式实时信号处理系统是一种利用了Storm这一流式云计算系统进行实时数据处理的架构。Storm系统由Twitter公司开发,它是一个开源的分布式实时计算系统,提供了实时处理数据流的高效平台。Storm系统的...

    细细品味Storm_Storm简介及安装

    Storm分布式实时计算模式由Apache Storm 项目核心贡献者吉奥兹、奥尼尔亲笔撰 写,融合了作者丰富的Storm实战经验,通过大量示例,全面而系统地讲解使用Storm进行分布式实 时计算的核心概念及应用,并针对不同的应用...

    Storm分布式实时计算在物联网系统中的应用.pdf

    安装Storm涉及设置Nimbus主控节点、Supervisor工作节点和Worker进程,这些组件协同工作,保证数据流的高效处理。 Nimbus负责任务调度和资源分配,Supervisor接收Nimbus的任务并管理Worker进程,Worker则实际运行...

    基于Storm与Kafka集群的火电厂分布式流式数据建模与分析系统.pdf

    标题“基于Storm与Kafka集群的火电厂分布式流式数据建模与分析系统”指向了两个主要的技术组件:Apache Storm和Apache Kafka,以及它们在火电厂数据处理方面的应用。Apache Storm是一个分布式的、实时的计算系统,...

    storm组件安装部署.doc

    【Storm组件安装部署】 Storm是一个开源的分布式实时流计算框架,它被广泛应用于实时日志分析、个性化推荐、实时监控等多个领域。这个文档主要聚焦于如何在单机环境下部署和运行Storm,尤其针对CentOS 6.4系统,...

    论Storm分布式实时计算工具.pdf

    在探讨分布式实时计算工具时,Storm 是一个不可或缺的话题。分布式计算是信息技术领域的重要组成部分,它使得资源得以跨多个服务器或节点进行管理,提高了计算能力和数据处理的灵活性。Storm 是一个开源的分布式实时...

    storm入门.pdf

    搭建Storm开发环境需要安装Java运行环境和Apache Storm软件包,并配置相应的环境变量。此外,还需要搭建Zookeeper集群来协调Storm集群的工作。 除了书籍《Getting Started with Storm》之外,还有一些社区和网站...

    Storm入门到精通

    要开始使用 Storm,首先需要安装 Storm,然后创建一个新的工程。下面是一个简单的 Hello World 例子: * 首先,创建一个新的 Maven 工程,並添加 Storm 的依赖项。 * 然后,创建一个新的 Java 类,继承自 Storm 的 ...

    storm, 分布式和容错实时计算.zip

    storm, 分布式和容错实时计算 重要的笔记 !风暴已经转移到了 Apache 。 官方的Storm git仓库现在由Apache托管,并在github上镜像:https://github.com/apache/incubator-storm通过 sumittin

    zk-kafka-redis-storm安装

    在"zk-kafka-redis-storm安装"过程中,首先需要安装Zookeeper,确保集群的协调和数据一致性。接着是Kafka的部署,设置好broker配置、创建主题并配置消费者和生产者。安装Redis时要注意选择合适的版本,配置网络参数...

    分布式集群技术.pdf

    debug、Storm 事物处理、StormStorm 实时计算消息可靠性及容错原理等内容将为读者提供了 Storm 常用组件和编程 API 的基础知识。 Storm 结合消息队列 Kafka 是分布式集群技术的基础,消息队列基本概念(Producer、...

    storm的jar包

    Storm是一个开源的分布式实时计算系统,由Twitter开发并开源,其设计目标是让实时处理变得简单、强大且可靠。在Storm中,数据流被抽象为持续不断的Tuple(元组)序列,这些Tuple在网络中的worker节点间进行分布式...

Global site tag (gtag.js) - Google Analytics