Storm运行依赖于如下软件
- ZeroMQ
- JzMQ
- Zookeeper
- Python
- gcc编译环境
本文在Centos7上对Storm进行伪分布式安装,首先安装依赖的软件
安装Python和gcc
Centos7已经默认安装Python,在终端可以直接使用python命令查看版本
Centos7已经默认安装gcc,可终端可以使用gcc命令查看版本
安装Zookeeper3.4.6
1. 下载zookeeper3.4.6,http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz
2. tar xzvf zookeeper-3.4.6.tar.gz
3. sudo vim /etc/profile
export ZOOKEEPER_HOME=/home/hadoop/software/zookeeper-3.4.6 export $ZOOKEEPER_HOME:$PATH
4. cp /home/hadoop/software/zookeeper-3.4.6/conf/zoo_sample.cfg /home/hadoop/software/zookeeper-3.4.6/conf/zoo.cfg
5. 编辑zoo.cfg,
data_dir=/home/hadoop/software/zookeeper-3.4.6/data
安装ZeroMQ4.0.5
wget http://download.zeromq.org/zeromq-4.0.5.tar.gz tar -zvxf zeromq-4.0.5.tar.gz cd zeromq-4.0.5/ ./configure sudo make sudo make install
安装JzMQ
sudo yum install git git clone git://github.com/nathanmarz/jzmq.git cd jzmq/ ##没有touch这一步有可能在make的时候报如下错:*** No rule to make target `org/zeromq/ZMQException.class, needed by `all'. Stop. touch src/classdist_noinst.stamp sudo make sudo make install ##如果在make install的时候报找不到org/zeromq/ZMQ$Context.class则需要编译java类 cd src/org/zeromq javac *.java ###重新make和install sudo make sudo make install
安装Storm
wget http://mirror.bit.edu.cn/apache/storm/apache-storm-0.9.3/apache-storm-0.9.3.tar.gz tar xzvf apache-storm-0.9.3.tar.gz sudo vim /etc/profile export STORM_HOME=/home/hadoop/software/apache-storm-0.9.3 export PATH=$STORM_HOME/bin source /etc/profile
配置Storm
vim /home/hadoop/software/apache-storm-0.9.3/conf/storm.yaml
在对文件进行配置时,要注意格式,高亮显示
1. 配置Zookeeper的服务器地址
storm.zookeeper.servers: - "127.0.0.1"
2. 配置nimbus的地址
nimbus.host: "127.0.0.1"
3. 配置storm.local.dir
storm.local.dir: /home/hadoop/software/apache-storm-0.9.3/stormlocaldir
4. 配置Supervisor slots ports
supervisor.slots.ports: - 6700 - 6701 - 6702 - 6703
启动Storm
1. 启动Zookeeper
$ZOOKEEPER_HOME/bin/zkServer.sh start
2. 启动Storm nimbus
bin/storm nimbus
3. 启动Storm supervisor
bin/storm supervisor
Storm启动后,在$STORM_HOME/logs目录下会有生成两个日志文件,nimbus.log和supervisor.log,日志的最后一行分别显示Starting Storm Nimbus...和Staring Storm Supervisor,在启动中似乎意味着Storm并未启动,实际上Storm已经启动。可以通过jps查看可以看到两个进程
61308 supervisor 61124 nimbus
运行Storm实例
1. 在Storm的安装目录中自带了一系列的Storm例子代码和打包好的jar包,其中包括最著名的WordCount实例,将它cp到bin目录下,
cp /home/hadoop/software/apache-storm-0.9.3/examples/storm-starter/storm-starter-topologies-0.9.3.jar /home/hadoop/software/apache-storm-0.9.3/bin/storm-starter-topologies-0.9.3.jar
2. 使用如下命令启动storm版本的WordCount实例
./storm jar storm-starter-topologies-0.9.3.jar storm.starter.WordCountTopology WordCountTopology
3. 程序开始执行后,在logs目录下产生了三个日志文件
worker-6701.log
worker-6702.log
worker-6703.log
4. 使用tail -f 观察它们的输出,如下是输出片段,
查看Storm任务运行情况
1. 使用如下命令查看当前正在运行的Topology
./storm list
结果如下:
Topology_name Status Num_tasks Num_workers Uptime_secs ------------------------------------------------------------------- WordCountTopology ACTIVE 28 3 431
2. 强杀一个正在执行的Topology
./storm kill WordCountTopology
执行结果:
Topology_name Status Num_tasks Num_workers Uptime_secs ------------------------------------------------------------------- WordCountTopology KILLED 28 3 527
Storm命令参数集合
Commands: activate classpath deactivate dev-zookeeper drpc help jar kill list localconfvalue logviewer monitor nimbus rebalance remoteconfvalue repl shell supervisor ui version
Storm UI
使用./storm ui启动UI进行后,可以访问http://localhost:8080来查看Storm的运行状态,部分截图如下图所示:
参考:http://shiyanjun.cn/archives/241.html
相关推荐
二、基于storm+kafka完成商品访问次数实时统计拓扑的开发 ================================ maven构建出的一些问题,直接从maven中央仓库可能下载不到jar包,自己去百度一下jar,下载下来 根据错误提示,拷贝到...
总结来说,伪分布式Hadoop搭建涉及了HDFS、MapReduce、Hive、HBase和Storm等多个组件,这些技术一起构建了一个完整的数据处理生态系统。HDFS提供存储,MapReduce负责计算,Hive提供数据分析的SQL接口,HBase满足实时...
storm分布式实时计算,集成durid,zookeeper,hadoop等
Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop
此外,DBS-Stream算法在实现分布式计算时,通过Storm平台能够有效处理数据流的高速性和实时性要求,同时通过DBSCAN算法降低了时间复杂度和空间复杂度,提高了处理数据流中噪声数据的能力。 总体而言,DBS-Stream...
总结来说,基于Storm的分布式流计算集群配置涉及多个步骤,包括服务器角色分配、ZooKeeper集群的搭建、Storm服务的安装和配置,以及拓扑的构建和提交。正确配置这些组件,可以实现高效、稳定的数据流处理。
基于Storm的分布式实时信号处理系统是一种利用了Storm这一流式云计算系统进行实时数据处理的架构。Storm系统由Twitter公司开发,它是一个开源的分布式实时计算系统,提供了实时处理数据流的高效平台。Storm系统的...
Storm分布式实时计算模式由Apache Storm 项目核心贡献者吉奥兹、奥尼尔亲笔撰 写,融合了作者丰富的Storm实战经验,通过大量示例,全面而系统地讲解使用Storm进行分布式实 时计算的核心概念及应用,并针对不同的应用...
安装Storm涉及设置Nimbus主控节点、Supervisor工作节点和Worker进程,这些组件协同工作,保证数据流的高效处理。 Nimbus负责任务调度和资源分配,Supervisor接收Nimbus的任务并管理Worker进程,Worker则实际运行...
标题“基于Storm与Kafka集群的火电厂分布式流式数据建模与分析系统”指向了两个主要的技术组件:Apache Storm和Apache Kafka,以及它们在火电厂数据处理方面的应用。Apache Storm是一个分布式的、实时的计算系统,...
【Storm组件安装部署】 Storm是一个开源的分布式实时流计算框架,它被广泛应用于实时日志分析、个性化推荐、实时监控等多个领域。这个文档主要聚焦于如何在单机环境下部署和运行Storm,尤其针对CentOS 6.4系统,...
在探讨分布式实时计算工具时,Storm 是一个不可或缺的话题。分布式计算是信息技术领域的重要组成部分,它使得资源得以跨多个服务器或节点进行管理,提高了计算能力和数据处理的灵活性。Storm 是一个开源的分布式实时...
搭建Storm开发环境需要安装Java运行环境和Apache Storm软件包,并配置相应的环境变量。此外,还需要搭建Zookeeper集群来协调Storm集群的工作。 除了书籍《Getting Started with Storm》之外,还有一些社区和网站...
要开始使用 Storm,首先需要安装 Storm,然后创建一个新的工程。下面是一个简单的 Hello World 例子: * 首先,创建一个新的 Maven 工程,並添加 Storm 的依赖项。 * 然后,创建一个新的 Java 类,继承自 Storm 的 ...
storm, 分布式和容错实时计算 重要的笔记 !风暴已经转移到了 Apache 。 官方的Storm git仓库现在由Apache托管,并在github上镜像:https://github.com/apache/incubator-storm通过 sumittin
在"zk-kafka-redis-storm安装"过程中,首先需要安装Zookeeper,确保集群的协调和数据一致性。接着是Kafka的部署,设置好broker配置、创建主题并配置消费者和生产者。安装Redis时要注意选择合适的版本,配置网络参数...
debug、Storm 事物处理、StormStorm 实时计算消息可靠性及容错原理等内容将为读者提供了 Storm 常用组件和编程 API 的基础知识。 Storm 结合消息队列 Kafka 是分布式集群技术的基础,消息队列基本概念(Producer、...
Storm是一个开源的分布式实时计算系统,由Twitter开发并开源,其设计目标是让实时处理变得简单、强大且可靠。在Storm中,数据流被抽象为持续不断的Tuple(元组)序列,这些Tuple在网络中的worker节点间进行分布式...