背景: 5台机器, 部署storm计算节点, 2台机器drpc节点. 环境如下:
Storm: 0.7.1
Linux: CentOS 5.5
Java: jdk 1.6.37
问题:storm 集群总是在运行一段时间后某些节点停止工作, 工作进程退出.
解决过程:
1. 查看storm日志
发现storm抛出如下异常:
worker [ERROR] Error on initialization of server mk-workerjava.lang.RuntimeException: org.zeromq.ZMQException: Invalid argument(0x16)
at clojure.lang.LazySeq.sval(LazySeq.java:47)
at clojure.lang.LazySeq.seq …
1. 将ZeroMQ降级
通过Google搜索, 发现有很多人问这个问题,nathanmarz 的建议是将ZeroMQ的版本降级为2.1.7; 原来系统使用的3.0.2,降级为2.1.7后发现仍然存在这个问题, 基本可以排除是由于ZeroMQ导致的.
1. 升级Storm
2. Storm升级至0.7.2后, 仍然存在问题. 看来是安装部署的问题
3. 真正的原因
4. , 查看日志, 重新安装. 总算发现了问题出在DNS服务上, 5台计算节点使用内部的DNS服务, 但是这台DNS服务器不够稳定, 改成静态域名解析后问题不再出现。
这是做dayoou.com这个项目的时候遇到的问题,贡献出来供众看官批评啦。
分享到:
相关推荐
Zookeeper是一个分布式协调服务,用于管理Storm集群的元数据。Nimbus是Storm集群的主节点,负责任务分配和监控。Supervisor则是工作节点,每个节点上都运行一个Supervisor实例,管理worker进程。UI则提供了可视化...
- **配置文件**:如`storm.yaml`,用于配置Storm集群的参数。 - **Java或Python代码**:实现Spout和Bolt的业务逻辑。 - **测试脚本**:验证代码正确性的JUnit或PyTest等测试代码。 - **依赖库**:可能包含项目的...
- **nimbus**:Storm集群的主控节点,负责调度和监控拓扑。 - **supervisor**:在工作节点上运行,管理worker进程,确保任务的正常运行。 - **Zookeeper**:用于协调nimbus和supervisors之间的通信,提供分布式锁...
DRPC允许外部应用向Storm集群提交一个远程调用请求,请求执行一个特定的topology任务,然后返回结果。这种方式提供了灵活的交互式查询能力。 7. **Storm executor、worker、task之间的关系和调优** - **Executor...
6. **Zookeeper协调**:Storm通常与Zookeeper配合使用,后者提供分布式协调服务,帮助管理集群状态和任务分配。 7. **数据清洗和预处理**:在处理基站数据前,可能需要进行数据清洗,去除异常值,标准化格式等,...
5. 自动化策略同步:Ranger Storm插件会自动将Ranger Admin中的策略同步到Storm集群,确保最新的安全策略得以实施。 四、实战应用 在实际环境中,例如,你可能希望限制某个团队只能访问特定的Storm拓扑,或者只...
在与Storm的结合中,YARN提供了一个可靠的运行环境,使Storm拓扑能在集群中高效地分布和执行。 3. **Apache Pig**:Pig是一种基于Hadoop的数据分析平台,它提供了Pig Latin语言,使得用户可以通过简单脚本处理大...
文档中提到了360云盘Cassandra+Storm集群的规模和容量,例如单日新增台数、备份规模、数据规模等。这包括了不同大小的集群配置,如150台、300台、600台等,以及不同容量级别的配置。这展现了360云盘对于数据存储和...
尽管"storm事务详解"只有三页,但应该会深入讨论如何在实际项目中使用Transaction Topology,包括最佳实践、性能优化和常见问题的解决方案。理解并掌握这一机制对于在Storm上构建高可用、强一致性的实时处理系统至关...
Storm通过其独特的架构设计和数据处理机制,提供了强大的解决方案来应对这些挑战。例如,通过并行处理和数据复制,Storm能够实现实时处理的高可用性和容错性。 #### 结论 《Storm实时处理实战指南》是一本深入探讨...
此外,他推动了Storm集群的大版本升级至1.1.0,这通常涉及到大量兼容性测试和风险评估,体现了他的技术领导力和问题解决能力。同时,他还负责维护线上500多台执行机的日常运维工作。 5. **技术技能**:陈玉兆熟练...
**实时处理系统架构**: 整个系统架构由三个主要部分组成:Flume集群负责数据采集,Kafka集群作为数据中转站,Storm集群执行实时处理,而Redis提供快速数据检索。通过这些组件的紧密协作,系统能够实现实时分析和展示...
ELK+kafka日志集群是现代企业级日志管理和分析的常见解决方案,它结合了Elasticsearch(存储和搜索)、Logstash(数据收集与处理)、Kibana(数据可视化)以及Kafka(消息中间件)的优势,提供了一套高效、可扩展的...
标题中的“基于Hadoop大数据...综上所述,这个基于Hadoop的大数据集群平台旨在构建一个全面、智能的水电机组运维解决方案,通过整合大数据处理、实时监控、数据分析和可视化等功能,提升水电设施的运营效率和安全性。
8. **监控与管理**:Nimbus是Storm的主控节点,负责调度和监控拓扑,Zookeeper用于协调集群状态,Supervisor管理各个工作节点,这些组件共同确保了Storm集群的稳定运行。 9. **案例应用**:在实际应用中,Storm被...
Storm的自动容错机制能够处理进程、机器和网络异常,保证消息可以重发。 Storm在典型应用场景中能够解决时延性要求高的问题。例如,传统的MapReduce批处理方式难以满足秒级的数据处理需求,而Storm能够保持进程常驻...
亿矿云大数据处理框架是一个集成化的解决方案,它利用了Hadoop、Spark、Storm等强大的分布式处理架构,以应对海量数据的批处理和流处理计算需求。在这个框架中,我们可以看到数据预处理作为关键的一环,为机器学习...
当我们谈论"spring-storm"时,我们指的是将Spring依赖注入(DI)机制与Apache Storm相结合,以实现更灵活、可扩展的实时数据流处理解决方案。 首先,Spring依赖注入(DI)是Spring框架的核心特性,它允许开发者通过...
TDBank系统架构包括TDW管理中心、数据采集Agent、数据源适配、数据接入集群、TDBus协议、数据缓存Tube、数据分拣Storm集群等组件。这些组件共同作用,实现数据的高效采集、传输、存储和处理。TDBus作为数据传输协议...