scp -r bigdata@gs-server-v-127:~/storm_eco bigdata@gs-server-v-128:~/storm_eco
scp -r bigdata@gs-server-v-127:~/storm_eco bigdata@gs-server-v-129:~/storm_eco
安装GCC
sudo yum install gcc*
# sudo yum install uuid*
# sudo yum install e2fsprogs*
# sudo yum install libuuid*
sudo yum install update-rc.d
1. 安装python2.7.2
============================
# wget http://www.python.org/ftp/python/2.7.2/Python-2.7.2.tgz
cd ~/storm_eco/python
# tar zxvf Python-2.7.2.tgz
# cd Python-2.7.2
# ./configure
# make
# make install
# sudo vi /etc/ld.so.conf
--
文件末尾追加
/usr/local/lib
--
#sudo ldconfig
============================
4. 安装storm
============================
# http://mirror.bit.edu.cn/apache/incubator/storm/apache-storm-0.9.2-incubating/
cd ~/storm_eco/storm
tar zxvf apache-storm-0.9.2-incubating.tar.gz
mv apache-storm-0.9.2-incubating storm-0.9.2
mkdir $STORM_HOME/workdir
vi storm.yaml
Storm 0.9.0.1版本的第一亮点是引入了netty transport。Storm网络传输机制实现可插拔形式,当前包含两种方式:原来的0mq传输,以及新的netty实现;在早期版本中(0.9.x之 前的版本),Storm只支持0mq传输,由于0MQ是一个本地库(native library),对平台的依赖性较高,要完全正确安装还是有一定挑战性。而且版本之间的差异也比较大;Netty Transport提供了纯JAVA的替代方案,消除了Storm的本地库依赖,且比0MQ的网络传输性能快一倍以上;
补充:之前写这篇文档的时候忘记把配置Netty Transport的方式写进来,所以可能很多朋友配置了之后会发觉后台会报一个错误;这里还是用的原来的方式,所以下面补充下storm使用netty配置的方式;
要配置Storm使用Netty传输需要添加以下配置和调整值到你的storm.yaml文件上,响应的配置值可根据你的需求自行调整
storm.messaging.transport: "backtype.storm.messaging.netty.Context" --指定传输协议
storm.messaging.netty.server_worker_threads: 1 --指定netty服务器工作线程数量
storm.messaging.netty.client_worker_threads: 1 --指定netty客户端工作线程数量
storm.messaging.netty.buffer_size: 5242880 --指定netty缓存大小
storm.messaging.netty.max_retries: 100 --指定最大重试次数
storm.messaging.netty.max_wait_ms: 1000 --指定最大等待时间(毫秒)
storm.messaging.netty.min_wait_ms: 100 --指定最小等待时间(毫秒)
vi $STORM_HOME/conf/storm.yaml
# vi ~/.bashrc
--
追加
export STORM_HOME=/usr/local/storm-0.9.2
export PATH=$PATH:$STORM_HOME/bin
--
============================
storm.zookeeper.servers:
- "10.200.200.56"
- "10.200.200.57"
- "10.200.200.58"
storm.local.dir: "$STORM_HOME/workdir"
nimbus.host: "10.200.200.56"
storm.local.dir: "/tmp/storm/data"
supervisor.slots.ports:
- 6700
- 6701
- 6702
- 6703
ui.port: 8081 # 我这里修改了storm的ui端口
将storm的目录复制到其它发服务器下去
scp -r bigdata@gs-server-v-127:~/storm_eco/storm/storm-0.9.2 bigdata@gs-server-v-128:~/storm_eco/storm/
scp -r bigdata@gs-server-v-127:~/storm_eco/storm/storm-0.9.2 bigdata@gs-server-v-129:~/storm_eco/storm/
scp -r bigdata@gs-server-v-127:/home/bigdata/storm_test/md.log bigdata@gs-server-v-128:/home/bigdata/storm_test/
scp -r bigdata@gs-server-v-127:/home/bigdata/storm_test/md.log bigdata@gs-server-v-129:/home/bigdata/storm_test/
scp -r bigdata@gs-server-v-128:/home/bigdata/profile bigdata@gs-server-v-127:/etc/profile
scp -r bigdata@gs-server-v-127:/etc/profile bigdata@gs-server-v-128:/home/bigdata/
================================================================
启动
Nimbus 在Nimbus机器上运行bin/storm nimbus&
Supervisor 在每台工作机器上运行bin/storm supervisor&, supervisor负责启动和终止工作机器上的工作进程。
UI storm UI是一个可以查看storm运行状态的的一个网站,通过bin/storm ui&运行,
访问地址: http://{nimbus.host}:8081/
执行jar:
提交Topologies
命令格式:storm jar 【jar路径】 【拓扑包名.拓扑类名】 【拓扑名称】
样例:storm jar /storm-starter.jar storm.starter.WordCountTopology wordcountTop
#提交storm-starter.jar到远程集群,并启动wordcountTop拓扑。
停止Topologies
命令格式:storm kill 【拓扑名称】
样例:storm kill wordcountTop
#杀掉wordcountTop拓扑。
启动nimbus后台程序
命令格式:storm nimbus
启动supervisor后台程序
命令格式:storm supervisor
启动drpc服务
命令格式:storm drpc
启动ui服务
命令格式:storm ui
启动REPL
REPL — read-evaluate-print-loop。
虽然clojure可以作为一种脚本语言内嵌在java里面,但是它的首选编程方式是使用REPL,这是一个简单的命令行接口,使用它你可以输入你的命令,执行,然后查看结果, 你可以以下面这个命令来启动REPL:
命令格式:storm repl
打印本地配置
命令格式:storm localconfvalue 【配置参数关键字】
举例:storm localconfvalue storm.zookeeper.servers
#根据指定参数打印本地配置的值。
打印远程配置
命令格式:storm remoteconfvalue 【配置参数关键字】
举例:storm remoteconfvalue storm.zookeeper.servers
#根据指定参数打印远程配置的值。
执行Shell脚本
命令格式:storm shell resourcesdir command args
打印CLASSPATH
命令格式:storm classpath
相关推荐
rpm安装: rpm -ivh curlftpfs-0.9.2-14.el7.x86_64.rpm 编译安装: tar xvzf curlftpfs-0.9.2.tar.gz cd curlftpfs-0.9.2 ./configure make make install
1. **解压文件**:使用命令`tar -zxvf apache-tez-0.9.2-bin.tar.gz`来解压压缩包,这将创建一个名为`apache-tez-0.9.2-bin`的目录。 2. **配置环境变量**:将Tez的bin目录添加到`PATH`环境变量中,这样可以在任何...
2. **解压压缩包**:使用解压工具打开"fasttext-0.9.2-cp38-cp38-win_amd64.whl.zip",解压后你会得到"fasttext-0.9.2-cp38-cp38-win_amd64.whl"这个文件。 3. **确认Python环境**:确保你的Python环境是3.8版本,...
本文将围绕"fasttext-0.9.2-cp36-cp36m-win_amd64.whl.zip"这个压缩包,讲解如何在Python环境中离线安装Fasttext以及使用说明。 首先,让我们了解下这个压缩包的组成部分。"fasttext-0.9.2-cp36-cp36m-win_amd64....
fasttext-0.9.2-cp38-cp38-win_amd64
3. 在终端中,运行`pip install fasttext-0.9.2-cp311-cp311-win_amd64.whl`命令,这里的`fasttext-0.9.2-cp311-cp311-win_amd64.whl`是你的轮子文件名,确保替换为实际的文件名。 4. 如果一切顺利,pip会成功安装...
本文将围绕"fasttext-0.9.2-cp39-cp39-win_amd64.whl.zip"这个压缩包文件,详细讲解FastText的基本概念、功能、安装以及在实际应用中的操作步骤。 一、FastText简介 FastText是基于词嵌入的模型,它不仅仅可以学习...
fasttext-0.9.2-cp37-cp37m-win_amd64
4. 在终端中,输入`pip install fasttext-0.9.2-cp37-cp37m-win_amd64.whl`,这个命令会指示pip安装该文件中的Fasttext库。 5. 如果一切顺利,pip将会安装Fasttext并将其添加到你的Python环境中。 Fasttext的基本...
下载并解压"Pig-0.9.2.tar.gz"后,开发者可以在本地或Hadoop集群上安装和运行Pig。这通常包括配置环境变量,设置Hadoop路径,然后通过Pig命令行或者脚本执行Pig Latin脚本。 5. **Pig的应用场景**: - 数据清洗:...
赠送原API文档:libthrift-0.9.2-javadoc.jar; 赠送Maven依赖信息文件:libthrift-0.9.2.pom; 包含翻译后的API文档:libthrift-0.9.2-javadoc-API文档-中文(简体)版.zip; Maven坐标:org.apache.thrift:libthrift...
本文将围绕“fasttext-0.9.2-cp310-cp310-win_amd64.whl.zip”这个压缩包,详细介绍如何离线安装Fasttext的Python模块,并探讨其主要功能和应用场景。 首先,我们要明确这个压缩包的组成部分。"fasttext-0.9.2-cp...
org.freeswitch.esl.client-0.9.2.jar org.freeswitch.esl.client-0.9.2.sources.jar org.freeswitch.esl.client-0.9.2.javadoc.jar
**c3p0-0.9.2-pre1:数据库连接池详解** c3p0是一个开源的JDBC连接池,它实现了数据源和JNDI绑定,支持JDBC3规范和JDBC2的标准扩展。c3p0-0.9.2-pre1是其在2007年发布的一个版本,尽管现在有更新的版本,但这个老...
【标题】"tez-0.9.2.tar.gz"是一个包含Tez 0.9.2版本的压缩包,该版本是针对Hadoop 3.2.1平台编译的。Tez是一个由Apache软件基金会开发的开源框架,它为Hadoop生态系统提供了一个灵活且高效的处理模型,尤其在大数据...
在给定的压缩包文件“fasttext-0.9.2-pp38-pypy38_pp73-win_amd64.whl.zip”中,我们可以找到Fasttext的一个离线安装版本,特别适合于没有网络或者网络环境不稳定的情况下进行安装。 Fasttext库是由Facebook AI ...
thrift-0.9.2.安装.
这个库由M-Fusion公司开发,版本号为0.9.2-pre5,是C3P0的一个预发布版本。C3P0的主要目标是提供一个高效且功能丰富的JDBC连接管理方案,以帮助提升应用程序的性能和稳定性。 C3P0连接池的工作原理是通过预先创建并...
c3p0-0.9.2-pre1.jar是c3p0数据库连接池的实现,它是一个开源的、轻量级的Java数据源实现,提供了对JDBC连接的管理。c3p0允许开发者有效地管理和复用数据库连接,避免了频繁创建和关闭连接导致的系统开销。其主要...