`
liyonghui160com
  • 浏览: 778690 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Storm【配置项】 - 详细解释

阅读更多

 

配置项配置说明

storm.zookeeper.serversZooKeeper服务器列表

storm.zookeeper.portZooKeeper连接端口

storm.local.dirstorm使用的本地文件系统目录(必须存在并且storm进程可读写)

storm.cluster.modeStorm集群运行模式([distributed|local])

storm.local.mode.zmqLocal模式下是否使用ZeroMQ作消息系统,如果设置为false则使用java消息系统。默认为false

storm.zookeeper.rootZooKeeper中Storm的根目录位置

storm.zookeeper.session.timeout客户端连接ZooKeeper超时时间

storm.id运行中拓扑的id,由storm name和一个唯一随机数组成。

nimbus.hostnimbus服务器地址

nimbus.thrift.portnimbus的thrift监听端口

nimbus.childopts通过storm-deploy项目部署时指定给nimbus进程的jvm选项

nimbus.task.timeout.secs心跳超时时间,超时后nimbus会认为task死掉并重分配给另一个地址。

nimbus.monitor.freq.secsnimbus检查心跳和重分配任务的时间间隔.注意如果是机器宕掉nimbus会立即接管并处理。

nimbus.supervisor.timeout.secssupervisor的心跳超时时间,一旦超过nimbus会认为该supervisor已死并停止为它分发新任务.

nimbus.task.launch.secstask启动时的一个特殊超时设置.在启动后第一次心跳前会使用该值来临时替代nimbus.task.timeout.secs.

nimbus.reassign当发现task失败时nimbus是否重新分配执行。默认为真,不建议修改。

nimbus.file.copy.expiration.secsnimbus判断上传/下载链接的超时时间,当空闲时间超过该设定时nimbus会认为链接死掉并主动断开

ui.portStorm UI的服务端口

drpc.serversDRPC服务器列表,以便DRPCSpout知道和谁通讯

drpc.portStorm DRPC的服务端口

supervisor.slots.portssupervisor上能够运行workers的端口列表.每个worker占用一个端口,且每个端口只运行一个worker.通过这项配置可以调整每台机器上运行的worker数.(调整slot数/每机)

supervisor.childopts在storm-deploy项目中使用,用来配置supervisor守护进程的jvm选项

supervisor.worker.timeout.secssupervisor中的worker心跳超时时间,一旦超时supervisor会尝试重启worker进程.

supervisor.worker.start.timeout.secssupervisor初始启动时,worker的心跳超时时间,当超过该时间supervisor会尝试重启worker。因为JVM初始启动和配置会带来的额外消耗,从而使得第一次心跳会超过supervisor.worker.timeout.secs的设定

supervisor.enablesupervisor是否应当运行分配给他的workers.默认为true,该选项用来进行Storm的单元测试,一般不应修改.

supervisor.heartbeat.frequency.secssupervisor心跳发送频率(多久发送一次)

supervisor.monitor.frequency.secssupervisor检查worker心跳的频率

worker.childoptssupervisor启动worker时使用的jvm选项.所有的”%ID%”字串会被替换为对应worker的标识符

worker.heartbeat.frequency.secsworker的心跳发送时间间隔

task.heartbeat.frequency.secstask汇报状态心跳时间间隔

task.refresh.poll.secstask与其他tasks之间链接同步的频率.(如果task被重分配,其他tasks向它发送消息需要刷新连接).一般来讲,重分配发生时其他tasks会理解得到通知。该配置仅仅为了防止未通知的情况。

topology.debug如果设置成true,Storm将记录发射的每条信息。

topology.optimizemaster是否在合适时机通过在单个线程内运行多个task以达到优化topologies的目的.

topology.workers执行该topology集群中应当启动的进程数量.每个进程内部将以线程方式执行一定数目的tasks.topology的组件结合该参数和并行度提示来优化性能

topology.ackerstopology中启动的 acker任务数.Acker保存由spout发送的tuples的记录,并探测tuple何时被完全处理.当Acker探测到tuple被处理完毕时会 向spout发送确认信息.通常应当根据topology的吞吐量来确定acker的数目,但一般不需要太多.当设置为0时,相当于禁用了消息可靠 性,storm会在spout发送tuples后立即进行确认.

topology.message.timeout.secstopology中spout发送消息的最大处理超时时间.如果一条消息在该时间窗口内未被成功ack,Storm会告知spout这条消息失败。而部分spout实现了失败消息重播功能。

topology.kryo.register注册到Kryo(Storm底层的序列化框架)的序列化方案列表.序列化方案可以是一个类名,或者是com.esotericsoftware.kryo.Serializer的实现.

topology.skip.missing.kryo.registrationsStorm是否应该跳过它不能识别的kryo序列化方案.如果设置为否task可能会装载失败或者在运行时抛出错误.

topology.max.task.parallelism在一个topology中能够允许的最大组件并行度.该项配置主要用在本地模式中测试线程数限制.

topology.max.spout.pending一个spout task中处于pending状态的最大的tuples数量.该配置应用于单个task,而不是整个spouts或topology.

topology.state.synchronization.timeout.secs组件同步状态源的最大超时时间(保留选项,暂未使用)

topology.stats.sample.rate用来产生task统计信息的tuples抽样百分比

topology.fall.back.on.java.serializationtopology中是否使用java的序列化方案

zmq.threads每个worker进程内zeromq通讯用到的线程数

zmq.linger.millis当连接关闭时,链接尝试重新发送消息到目标主机的持续时长.这是一个不常用的高级选项,基本上可以忽略.

java.library.pathJVM启动(如Nimbus,Supervisor和workers)时的java.library.path设置.该选项告诉JVM在哪些路径下定位本地库.

 

 

 

 

 

 

分享到:
评论

相关推荐

    STORM-User-guide-V3.2

    - **XML文件结构**:XML文件由多个层级的标签组成,每个标签代表了不同的配置项。 - **硬件架构定义**:XML文件中的`<hardware>`标签下包含了所有硬件组件的定义,如处理器、内存等。 - **任务定义**:通过`<task>`...

    Storm配置项详解

    ### Storm配置项详解 #### 概述 Apache Storm是一款免费开源、分布式、高容错性的实时计算系统。Storm因其灵活性及高效性,在大数据处理领域占据了重要地位。本文将基于Storm 0.6.0版本,深入解析其核心配置项,...

    Storm配置项详解.docx

    以下是对文档中提及的一些主要配置项的详细解释: 1. **storm.zookeeper.servers**:这是ZooKeeper服务器的列表,Storm使用ZooKeeper作为集群的协调器,存储元数据和拓扑状态。确保这些服务器的正确配置至关重要。 ...

    AMQP_Storm-1.3.2-py2.py3-none-any.whl.zip

    前者可能是关于如何安装和使用AMQP_Storm的详细指南,而后者则是我们要关注的主要内容,它是AMQP_Storm的whl包,适用于Python 2和3,不依赖于特定的ABI和平台。 AMQP_Storm是一个Python库,它提供了对Advanced ...

    AMQP_Storm-1.3.3-py2.py3-none-any.whl.zip

    "使用说明.txt"很可能是AMQP_Storm库的安装指南或用户手册,提供了关于如何安装、配置和使用AMQP_Storm的详细信息。用户应阅读此文件以了解如何正确地将AMQP_Storm集成到他们的项目中。 综上所述,AMQP_Storm-1.3.3...

    storm1.2.1-wangzs-jms

    2. **配置文件**:可能包含了配置JMS连接的示例文件,如`storm.yaml`,其中可能有特定于JMS的配置项,如连接工厂、队列或主题名称等。 3. **示例拓扑**:为了展示如何使用这个JMS集成,可能会包含一个或多个示例...

    apache-storm-1.1.2.tar.gz

    7. **storm-site.xml**:这是另一个可自定义的配置文件,可以覆盖`storm.yaml`中的配置项,通常用于集群级别的配置。 在配置Storm时,你需要根据你的环境调整`storm.yaml`或`storm-site.xml`,例如指定Zookeeper的...

    storm入门到精通

    01.Storm基础知识、02.Storm集群安装-1-new 、03.Storm集群安装-2、04.starter打包运行测试、05.Storm配置文件配置项讲解。。。。。。15集全

    storm-debian-packaging:使用dpkg-buildpackage的Storm Debian包装

    风暴Debian包装 用于分布式实时计算系统的... 提供以下服务的软件包: storm-drpc storm-logviewer storm-nimbus storm-supervisor storm-ui 还有storm-common软件包,它是服务软件包的依赖项。 还有一个storm软件包,

    apache-storm-0.9.3.tar

    - **lib**目录:包含Storm的库文件和其他依赖项。 - **logs**目录:日志文件的默认存储位置。 - **examples**目录:可能包含一些示例topologies,帮助用户了解如何构建和部署自己的实时计算任务。 - **docs**目录:...

    Data-Storm-2.0--Access-Denied

    4. **配置文件**:检查Data Storm的相关配置文件,如`storm.yaml`,确认其中的配置项没有阻止你访问所需资源。 5. **日志分析**:查看系统和应用的日志文件,它们通常会记录详细的错误信息,有助于定位问题所在。 ...

    storm集群部署和配置过程详解

    以下是一些核心配置项: - **storm.zookeeper.servers**:配置Zookeeper集群的IP地址列表,例如`["111.222.333.444", "555.666.777.888"]`。如果Zookeeper非默认端口,还需设置`storm.zookeeper.port`。 - **storm...

    Storm-webservice接口调试工具

    在Web服务开发中,接口调试是一项至关重要的任务,它涉及到验证服务功能、检查数据传输格式、以及确保服务之间的通信无误。传统的接口调试方法通常涉及编写测试脚本或者使用专门的调试工具,如SOAP UI,这些方法虽然...

    大数据平台Storm入门到精通

    01.Storm基础知识02.Storm集群安装-1-new .avi.baiduyun.p05.Storm配置文件配置项讲解07.Storm基本API介绍08.Storm Topology的并发度09.Strom消息机制原理讲解10.Storm DRPC实战讲解

    Storm配置详解

    下面详细介绍在Storm配置文件中可以设置的一些核心配置项。 1. storm.zookeeper.servers:这个配置项指定了连接ZooKeeper集群的服务器地址列表。ZooKeeper是一个分布式协调服务,Storm使用它来进行集群状态管理、...

    如何自定义HDInsight Storm 日志文件大小-longfei1

    在 Ambari 界面中,找到相应的配置项,调整 `SizeBasedTriggeringPolicy` 的大小(例如,将其改为 50MB)和 `DefaultRolloverStrategy max` 的数值(例如,将其改为 5)。保存更改后,选择一个合适的时间重启与 ...

    基于Storm的分布式流计算集群详细配置

    在每个ZooKeeper节点上配置`conf/zoo.cfg`,包括`tickTime`、`initLimit`、`syncLimit`、`dataDir`、`dataLogDir`、`clientPort`、`maxClientCnxns`以及`server`配置项。 3. **日志级别调整**:通过修改`conf/log4j....

    03、storm项目实战课程-Kafka0.8Storm0.9.1Optr.rar

    这个压缩包"Kafka0.8Storm0.9.1Optr"很可能包含了课程的所有资料,如PPT课件、代码示例、配置文件和可能的练习数据,帮助学习者全面掌握这两项技术的整合应用。通过深入学习和实践这些内容,你将能够有效地处理实时...

    storm-kafak相关jar

    4. 其他依赖项:可能还包括其他相关库,如序列化库(如JSON或Avro),日志库,或者特定版本的Storm和Kafka所需的其他依赖。 在实际开发中,这些JAR包通常会被添加到Storm拓扑的类路径中,以便运行时能够找到并加载...

Global site tag (gtag.js) - Google Analytics