Apache Storm是一个免费、开源的分布式实时计算系统。相对于Hadoop适用于批处理而言,Storm可以用于实时处理流式数据。Storm简单易用,支持多种编程语言。2013年9月,Storm成为了Apache软件基金会的孵化项目,近日,Apache软件基金会宣布,Storm已经孵化完毕,升级成为Apache顶级项目。这也意味着Storm社区和产品已经按照Apache 软件基金会的流程和理念顺利运作。
Storm本是由做分析平台的创业公司BackType开发,后来2011年7月BackType被Twitter收购,Storm得以保留并于2011年9月开源在GitHub上。在被收购后,Storm也随之成为了Twitter内部的实时数据分析系统。在Twitter的带领下,Storm获得了社区的广泛认可,Hortonworks宣布将Storm整合到自己的Hadoop企业版中,Yahoo将Storm与YARN整合成为Storm-YARN来支持的实时的流计算分析。另外,国内的几个公司也在大规模使用Storm,比如百度、淘宝,在Storm的官网也能看到他们的商标。
Storm也是少有的几个使用Clojure编写的开源项目之一,Clojure是一个在JVM平台运行的动态函数式编程语言。Storm的成功也证明了Clojure可以用于编写大型项目。近日,Puppet Labs决定使用Clojure重写其服务端的部分核心代码。
目前,热门流式计算系统还有Yahoo的S4和Spark streaming。Spark Streaming是建立在Spark上的应用框架,利用Spark的底层框架作为其执行基础,并在其上构建了DStream的行为抽象。S4(简单可扩展流系统的首字母简称:Simple Scalable Streaming System)是一个受Map-Reduce模式启发的分布式流处理引擎,设计之初是为了解决使用数据采集和机器学习算法的搜索应用环境中的数据广告的显示问题。
除了用于实时分析外,Storm也可用于在线机器学习、持续计算、分布式远程调用和ETL等领域。Storm目前的版本是0.9.2,更多的内容读者可以访问ASF博客和Storm官网了解。
微笑霸来了 第九期 卖票大妈敢不敢再坑一点
叫上小伙伴和力宏牵手 微笑霸来了
- 大小: 106.3 KB
分享到:
相关推荐
主分支: ##包裹包战 mvn clean package -DskipTests=true -Dwarcp ./target/storm-ui.war $TOMCAT_HOME/webapps/包装罐 mvn clean package -DskipTests=truecp ./target/storm-ui-*.jar $STORM_HOME/external/...
Apache Storm(apache-storm-2.3.0.tar.gz) 是一个免费的开源分布式实时计算系统。Apache Storm 可以轻松可靠地处理无限制的数据流,实时处理就像 Hadoop 进行批处理一样。Apache Storm 很简单,可以与任何编程语言...
Apache Storm 是一个分布式实时计算系统,它被设计用于处理大规模数据流,提供高吞吐量、低延迟的数据处理能力。在大数据领域,Storm 被广泛应用于实时分析、在线机器学习、持续计算、数据集成以及任何需要实时处理...
Apache Storm(apache-storm-2.3.0-src.tar.gz 源码) 是一个免费的开源分布式实时计算系统。Apache Storm 可以轻松可靠地处理无限制的数据流,实时处理就像 Hadoop 进行批处理一样。Apache Storm 很简单,可以与...
实时计算:Apache Storm:ApacheStorm实时机器学习应用.docx
Apache Storm 0.9.5是该项目的一个稳定版本,发布于2014年,虽然现在已经有了更先进的版本,但了解这个版本的源码有助于我们了解Storm的发展历程和基础架构。 Apache Storm的核心概念包括:Spout(数据源)、Bolt...
Apache Storm(apache-storm-2.3.0.zip) 是一个免费的开源分布式实时计算系统。Apache Storm 可以轻松可靠地处理无限制的数据流,实时处理就像 Hadoop 进行批处理一样。Apache Storm 很简单,可以与任何编程语言...
Apache Storm是大数据处理领域的一个重要工具,它是一个分布式实时计算系统。这个名为"apache-storm-2.1.0.tar.gz"的压缩包包含了Apache Storm的2.1.0版本,这是一个非源码的发行版,意味着它包含了编译后的二进制...
本实战项目旨在通过Apache Storm实现一个实时热力图分布系统的搭建,具体目标包括: - 实现对实时流数据的高效处理。 - 构建热力图数据模型,展示数据分布情况。 - 对处理后的数据进行可视化展示,以便直观了解数据...
Apache Storm(apache-storm-2.3.0-src.zip 源码) 是一个免费的开源分布式实时计算系统。Apache Storm 可以轻松可靠地处理无限制的数据流,实时处理就像 Hadoop 进行批处理一样。Apache Storm 很简单,可以与任何...
Apache Storm 是一个开源的分布式实时计算系统,专为处理无界数据流而设计。这个名为 "apache-storm-0.9.7.tar.gz" 的压缩包包含的是 Apache Storm 的0.9.7版本,它是软件的老版本,但仍然对理解Storm的核心概念和...
Apache Storm 是一个开源的分布式实时计算系统,它允许开发者处理无界数据流,提供高度容错性和可扩展性。在标题中提到的 "apache-storm-1.0.2.tar.gz" 是 Apache Storm 的特定版本,即1.0.2,以 tar.gz 形式打包,...
Apache Storm是一个免费开源、分布式、高容错的实时计算系统。Storm令持续不断的流计算变得容易,弥补了Hadoop批处理所不能满足的实时要求。Storm经常用于在实时分析、在线机器学习、持续计算、分布式远程调用和ETL...
文件名: apache-storm-2.4.0.tar.gz.zip 这是 Apache Storm 2.4.0 的安装包,Storm 是一个免费开源的分布式实时计算系统。Storm 使您可以处理大量的数据流,从而实现高效的数据处理和分析。这个安装包包含了所有你...
Apache Storm 是一个开源的分布式实时计算系统,它允许开发者处理无界数据流,提供高度容错性和可扩展性。在“apache-storm-1.1.2.tar.gz”这个压缩包中,包含了运行Apache Storm 1.1.2版本所需的所有组件和配置文件...
通过本次实战项目的学习与实践,我们不仅掌握了Apache Storm的基本原理及使用方法,还深入了解了如何构建一个完整的实时数据处理系统。未来随着技术的发展,还可以进一步探索更多高级功能和技术栈组合,如结合Apache...
Apache Storm 是一个开源的分布式实时计算系统,它允许开发者处理无界数据流,提供高度容错性和可扩展性。在本案例中,我们讨论的是Apache Storm的1.1.0版本,这是一个适用于Linux操作系统的安装包。 Apache Storm...
Apache Storm 是一个开源的分布式实时计算系统,它允许开发者处理无界数据流,提供高吞吐量、低延迟的数据处理能力。"apache-storm-1.0.2-src" 标题表明这是一个 Apache Storm 的 1.0.2 版本的源代码包,对于深入...
Apache Storm 是一个开源的分布式实时计算系统,常用于大规模数据流处理。在大数据领域,它以其高吞吐量、容错性和实时性而备受青睐。标题中的 "apache-storm-1.2.3.tar.gz" 指的是 Apache Storm 的 1.2.3 版本,这...
此存储库专用于 Apache Storm 项目和代码示例。 关于风暴 要了解有关 Storm 的更多信息,最好阅读 Storm 官方网页上的。 这是一个很好的指南,并且有一些非常好的链接。 它也不长且易于理解。 运行示例 在做任何事情...