Twitter Storm更新0.9.0.1之后,安装部署变得容易得多了,比起Storm0.8.x的版本,Storm少了zeromq和jzmq的安装,也省去了很多编译这些插件时出现的bug。
Storm-0.9.0.1 版本的亮点:
1.1、Netty Transport
Storm 0.9.0.1版本的第一亮点是引入了netty transport。Storm网络传输机制实现可插拔形式,当前包含两种方式:原来的0mq传输,以及新的netty实现;在早期版本中(0.9.x之前的版本),Storm只支持0mq传输,由于0MQ是一个本地库(native library),对平台的依赖性较高,要完全正确安装还是有一定挑战性。而且版本之间的差异也比较大;Netty Transport提供了纯JAVA的替代方案,消除了Storm的本地库依赖,且比0MQ的网络传输性能快一倍以上;
补充:之前写这篇文档的时候忘记把配置Netty Transport的方式写进来,所以可能很多朋友配置了之后会发觉后台会报一个错误;这里还是用的原来的方式,所以下面补充下storm使用netty配置的方式;
要配置Storm使用Netty传输需要添加以下配置和调整值到你的storm.yaml文件上,响应的配置值可根据你的需求自行调整
- storm.messaging.transport: "backtype.storm.messaging.netty.Context" --指定传输协议
- storm.messaging.netty.server_worker_threads: 1 --指定netty服务器工作线程数量
- storm.messaging.netty.client_worker_threads: 1 --指定netty客户端工作线程数量
- storm.messaging.netty.buffer_size: 5242880 --指定netty缓存大小
- storm.messaging.netty.max_retries: 100 --指定最大重试次数
- storm.messaging.netty.max_wait_ms: 1000 --指定最大等待时间(毫秒)
- storm.messaging.netty.min_wait_ms: 100 --指定最小等待时间(毫秒)
1.2、日志修改 Storm 0.9.0.1版本提供了有助于调试和检测拓扑结构的新特性:logviewer(守护进程名) 你现在可以在Storm UI通过点击相应的Woker来查看对应的工作日志。有点类似于hadoop的那种日志查看机制。
相关推荐
在IT行业中,Netty、Kafka和Storm是三个非常重要的技术组件,它们分别在不同的领域发挥着关键作用。本文将详细介绍这三项技术以及如何将它们整合到一起,特别是在结合JDBC(Java Database Connectivity)实现数据...
2. **依赖JARs**:Storm依赖于多个第三方库,如Zookeeper、Netty、A Commons Collections等,这些JAR文件是运行Storm必不可少的。 3. **配置文件**:如`storm.yaml`,这是Storm的主配置文件,用于设置集群参数,如...
此外,Netty的API设计使得它可以轻松地与其他技术栈集成,例如与Spring Boot、Apache Storm或Spark等大数据框架的配合。书中会有实例展示如何将Netty集成到这些系统中,以构建高性能的分布式应用。 在实际应用中,...
此外,书中还涉及到了Storm集群的基本安装步骤,包括Zookeeper和Storm的安装,以及Netty的配置和启动守护进程的介绍。Storm客户端的概念也被提到,并且包含了一些可选配置的讨论和总结。 第二部分深入讲解了Storm的...
如果你需要详细了解如何安装和配置Storm和Kafka,建议参考提供的博客教程。教程通常会涵盖从下载软件、配置环境变量、启动服务到编写和部署拓扑的整个过程。 7. **最佳实践**: - 使用合适的版本匹配:确保你的...
- **Storm配置文件配置项讲解**:解释Storm配置文件中的各项配置参数及其作用。 - **集群搭建常见问题解决**:总结集群搭建过程中可能遇到的问题及其解决方案。 - **Storm常用组件和编程API**:介绍Topology、Spout...
- **Storm配置文件配置项讲解**:详解Storm配置文件中的各项参数。 - **集群搭建常见问题解决**:解决集群搭建过程中可能遇到的问题。 - **Storm常用组件和编程API**: - **Topology**:拓扑是Storm中的核心概念之...
6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换NFS-RPC自带的协议。 淘宝开放平台JAVA版SDK top4java 设计原则 容易维护扩展(不...
学习Java API和RMI高可用集群开发,以及在Netty异步IO通信框架中的应用。 7. **Kafka**:Kafka是一个高吞吐量的分布式发布订阅消息系统,课程包括其安装、存储策略、分区特点、发布订阅模型,以及使用Java和Scala...
SpringBoot的核心设计理念是“约定优于配置”,通过默认配置来减少项目搭建过程中的繁琐步骤。其自动配置特性使得开发者可以快速启动基于Spring的应用,同时提供了丰富的starter依赖来快速引入所需功能。 2. **...
JStorm是阿里巴巴开源的一款分布式实时计算框架,其0.9.4.1版本在性能上相较于Storm-0.9.2-netty-p297有显著提升。本测试主要探讨了四个关键因素对JStorm性能的影响:worker进程并发度、消息大小、拓扑层数以及CPU...
6. 用户自定义日志:jstorm支持切换到用户日志配置,支持在logback和log4j之间切换,以及系统输出流的重定向,这使得日志管理更为灵活。 7. 用户自定义度量指标:用户自定义度量指标允许根据业务需求收集和分析关键...
Netty是一个异步IO通信框架,可用于构建高性能的服务。Kafka和Storm分别用于消息发布订阅和实时数据处理。Storm提供了低延迟的数据处理能力,其编程模型包括Topology、Spout和Bolt,且可以与Kafka结合以增强消息可靠...
下载地址: : : : 使用说明下载git clone https://github.com/xuwujing/springBoot-study.git使用秉着开箱即用的原则,这些工程只需下载之后,更改相应的配置(MySql,Es,Redis等地址配置),运行main方法,即可...
RMI(远程方法调用)和Netty框架用于实现高效的分布式通信。Kafka是一种高吞吐量的消息队列,它的架构、配置和使用场景对于实时数据流处理至关重要。Storm是实时流处理框架,通过Topology、Spout和Bolt组件处理数据...
2. **网络通信**:Hadoop的网络通信基于Socket和Netty,提供高效的网络数据传输,支持数据压缩和带宽优化,确保大规模数据传输的效率。 3. **安全机制**:Hadoop Common集成Kerberos进行身份验证,实现了Hadoop的...
Netty异步IO通信框架的学习,以及Zookeeper如何与Netty和Redis集成,展现了分布式系统中的协调与通信。Kafka和Storm的介绍,以及Scala和Spark的使用,为实时数据处理和流计算打下了基础。最后,Docker虚拟化技术和...
主要包括入门的Hello World、自定义配置获取、项目打包、使用logback、添加过滤器和拦截器、多数据源、Restful风格的服务、集成elasticsearch、redis、netty、集成jsp和thymeleaf、集成storm、kafka等相关技术。