一、下载
[root@hadoop0 bigdata]# ls
apache-flume-1.6.0-bin apache-hive-2.0.1-bin.tar.gz hbase-1.1.5-bin.tar.gz jstorm-0.9.6.2.zip sqoop-1.4.6 stomr096 tomcat7
apache-flume-1.6.0-bin.tar.gz apache-tomcat-7.0.69.zip hbase-1.1.5 hive2.0 kafka sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz taokeeper-monitor.tar.gz zookeeper
二、解压缩
[root@hadoop0 bigdata]# unzip jstorm-0.9.6.2.zip
Archive: jstorm-0.9.6.2.zip
creating: jstorm-0.9.6.2/
creating: jstorm-0.9.6.2/data/
[root@hadoop0 jstorm-0.9.6.2]# ls
bin conf data example history.md jstorm-client-0.9.6.2.jar jstorm-client-extension-0.9.6.2.jar jstorm-server-0.9.6.2.jar jstorm-ui-0.9.6.2.war lib LICENSE logs README.md RELEASE
三、安装
1)安装Server
配置$JSTORM_HOME/conf/storm.yaml
[root@hadoop0 conf]# cat storm.yaml
########### These MUST be filled in for a storm configuration
storm.zookeeper.servers:
- "localhost"
storm.zookeeper.root: "/jstorm"
# %JSTORM_HOME% is the jstorm home directory
storm.local.dir: "%JSTORM_HOME%/data"
java.library.path: "/usr/local/lib:/opt/local/lib:/usr/lib"
supervisor.slots.ports:
- 6800
- 6801
- 6802
- 6803
# Default disable user-define classloader
# If there are jar conflict between jstorm and application,
# please enable it
topology.enable.classloader: false
# enable supervisor use cgroup to make resource isolation
# Before enable it, you should make sure:
# 1. Linux version (>= 2.6.18)
# 2. Have installed cgroup (check the file's existence:/proc/cgroups)
# 3. You should start your supervisor on root
# You can get more about cgroup:
# http://t.cn/8s7nexU
supervisor.enable.cgroup: false
### Netty will send multiple messages in one batch
### Setting true will improve throughput, but more latency
storm.messaging.netty.transfer.async.batch: true
### if this setting is true, it will use disruptor as internal queue, which size is limited
### otherwise, it will use LinkedBlockingDeque as internal queue , which size is unlimited
### generally when this setting is true, the topology will be more stable,
### but when there is a data loop flow, for example A -> B -> C -> A
### and the data flow occur blocking, please set this as false
topology.buffer.size.limited: true
### default worker memory size, unit is byte
worker.memory.size: 2147483648
# Metrics Monitor
# topology.performance.metrics: it is the switch flag for performance
# purpose. When it is disabled, the data of timer and histogram metrics
# will not be collected.
# topology.alimonitor.metrics.post: If it is disable, metrics data
# will only be printed to log. If it is enabled, the metrics data will be
# posted to alimonitor besides printing to log.
topology.performance.metrics: true
topology.alimonitor.metrics.post: false
# UI MultiCluster
# Following is an example of multicluster UI configuration
ui.clusters:
- {
name: "jstorm",
zkRoot: "/jstorm",
zkServers:
[ "localhost"],
zkPort: 2181,
}
配置项:
storm.zookeeper.servers: 表示zookeeper 的地址,
nimbus.host: 表示nimbus的地址
storm.zookeeper.root: 表示JStorm在zookeeper中的根目录,当多个JStorm共享一个zookeeper时,需要设置该选项,默认即为“/jstorm”
storm.local.dir: 表示JStorm临时数据存放目录,需要保证JStorm程序对该目录有写权限
java.library.path: Zeromq 和java zeromq library的安装目录,默认"/usr/local/lib:/opt/local/lib:/usr/lib"
supervisor.slots.ports: 表示Supervisor 提供的端口Slot列表,注意不要和其他端口发生冲突,默认是68xx,而Storm的是67xx
topology.enable.classloader: false, 默认关闭classloader,如果应用的jar与JStorm的依赖的jar发生冲突,比如应用使用thrift9,但jstorm使用thrift7时,就需要打开classloader。建议在集群级别上默认关闭,在具体需要隔离的topology上打开这个选项。
2)安装UI
mv jstorm-0.9.6.2/jstorm-ui-0.9.6.2.war tomcat7/webapps/
四、启动
[root@hadoop0 bigdata]# cd zookeeper/
[root@hadoop0 zookeeper]# ls
bin dist-maven LICENSE.txt src
build.xml docs NOTICE.txt zookeeper-3.4.6.jar
CHANGES.txt ivysettings.xml README_packaging.txt zookeeper-3.4.6.jar.asc
conf ivy.xml README.txt zookeeper-3.4.6.jar.md5
contrib lib recipes zookeeper-3.4.6.jar.sha1
[root@hadoop0 zookeeper]# cd bin/
[root@hadoop0 bin]# ./zkServer.sh start
JMX enabled by default
Using config: /opt/bigdata/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@hadoop0 bin]# cd ../../jstorm-0.9.6.2/bin/
[root@hadoop0 bin]# ./jstorm nimbus &
[1] 22494
[root@hadoop0 bin]# ./jstorm supervisor &
[2] 32600
[root@hadoop0 bin]# ./startup.sh
Using CATALINA_BASE: /opt/bigdata/tomcat7
Using CATALINA_HOME: /opt/bigdata/tomcat7
Using CATALINA_TMPDIR: /opt/bigdata/tomcat7/temp
Using JRE_HOME: /opt/jdk1.7.0_79
Using CLASSPATH: /opt/bigdata/tomcat7/bin/bootstrap.jar:/opt/bigdata/tomcat7/bin/tomcat-juli.jar
Tomcat started.
[root@hadoop0 bin]#
五、验证
进程
WEBUI刚启动
服务启动
相关推荐
jstorm-core-2.1.1.jar,maven中央仓库中没有,从官网上下载的
- 修改`/opt/jstorm-0.9.6.2/conf/jstorm.yaml`中的配置,包括ZooKeeper地址、Worker数量等。 **3.3.10 安装Tomcat** - 解压Tomcat压缩包: ``` cd /opt tar -xzf apache-tomcat-7.0.61.tar.gz ``` - 配置...
新版本2.4.0,最新编译的 jstorm2.4.0包,大数据流式计算必备工具。
综上所述,JStorm-0.9.4.1版本通过优化提升了传输性能,尤其是在适当参数配置下,性能可达到Storm的两倍。然而,增加worker并发度和拓扑层数可能会导致性能下降,因为这增加了进程间通信和任务调度的复杂性。因此,...
**JStorm-0.9.6.3改进** 虽然具体0.9.6.3版本的变更日志没有给出,但通常这个版本可能会包含以下改进: - 性能优化:可能对数据传输、调度或者内存管理进行了优化,提升了整体处理速度。 - Bug修复:解决了前一...
Jstorm 监控程序改造,官方是war ,已经升级成jar ,java -jar 启动。
0-检查gcc,python版本:python -V,要有gcc-c++ 1-jdk安装 2-解压缩zk 3-安装zeromq configure: error: cannot link with -luuid, install uuid-dev ...unzip jstorm-0.7.1.zip 修改/etc/hosts,storm.yaml
1. **Topology**:这是JStorm的基本工作单元,代表着数据处理的流程图。一个Topology由多个Bolt和Spout组成,Bolt负责数据处理,Spout负责产生数据流。 2. **Bolt**:Bolt是处理数据的逻辑单元,可以进行数据清洗、...
1. **Kafka基本概念**: - **主题(Topic)**:主题是Kafka中消息的分类,类似于数据库的表。 - **分区(Partition)**:每个主题可以分为多个分区,提供水平扩展能力,同时确保消息顺序。 - **生产者(Producer...
**JStorm介绍** JStorm是由阿里巴巴开发的分布式实时计算引擎,它是基于Apache Storm的一个增强版本。JStorm的设计目标是提供比Storm更高的稳定性、更强的功能和更快的计算性能。这个技术分享主要涵盖了JStorm的...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
新版本2.4.0,最新编译的 jstorm2.4.0包,大数据流式计算必备工具。
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...
【课程大纲】01.Storm项目实战课程大纲02.CDH5搭建之CM5安装部署03.CDH5搭建和CM界面化集群管理04.Hadoop、HBase、Zookeeper集群管理和角色分配05.Kafka基础知识和集群搭建06.Kafka基本操作和最优设置07.Kafka Java ...