Storm的容错性

商人shang

浏览: 1472546 次
性别:
来自: 河北邯郸

最近访客更多访客>>

gary0416

noodless

u012363178

log_cd

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Storm
大数据架构

storm 高可用

Storm有几种不同的守护进程。Nimbus调度worker，Supervisor运行和杀死worker，log viewer 提供对于日志的访问方式，UI展示集群的状态。

一、问：如果一个Worker死掉了，那么会发生什么？

答：如果一个worker死掉了，那么supervisor会重启这个worker。如果这个worker在启动的时候持续失败，那么它将不能与Nimbus正常进行心跳通信，Nimbus将会重新调度这个worker。

二、问：如果一个Node死掉了，会发生什么？

答：分配到那台机器的任务将会超时，并且Nimbus会重新分配这些任务到其他的机器上面。

三、问：如果Nimbus或者Supervisor挂掉了，会怎么样？

答：Nimbus和Supervisor是被设计成快速失败fail-fast（无论何时发生任何异常的情形时会执行自毁），并且无状态的（所有的状态是被存储在zookeeper或者disk上的）。正如Setting up a Storm cluster中描述的，Nimbus和Supervisor必须运行在一个类似于daemontools or monit 的监控之下，这样可以在Nimbus或者Supervisor死掉以后，可以像什么也没有发生一样的重启他们。

更值得注意的是，Nimbus或者Supervisor的死掉不会对任何的worker处理产生影响。这个是与Hadoop大不相同的，如果JobTracker死掉，那么所有运行的job的信息会丢掉。

四、问：Nimbus是否有单点故障？

答：如果你失去了Nimbus节点，那么worker会继续工作。另外，supervisor会继续在worker死掉的时候重启他们。然而，如果没有Nimbus，worker将不会在需要的时候被重新分派到前天的机器上面（比如你失去了一个工作机器）。

Storm Nimbus在1.0.0 以后是高可用的。更多的信息请参看：Nimbus HA Design 文档。

五、问：Storm怎么能保证数据处理？

答：storm提供了机制来保证数据处理，即使节点死掉或者消息丢失。请参看：Guaranteeing message processing 文档。

0
顶

0
踩

分享到：

工作原则和技巧总结 | Spark系列文章列表

2017-12-19 21:46
浏览 1096
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论