Hadoop与Strom - 知其然，知其所以然 - ITeye博客

`

x-rip

浏览: 108273 次
性别:
来自: 杭州

最近访客更多访客>>

vigour36

ljlszq

superyang_xp

promiseloney

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

xurping： kolor 写道呵呵，一直在用kryo，不过都没有去分析过它 ...
Kryo为什么比Hessian快
xjl456852：你好,我感觉那个加x70是不是有问题啊.x65在其基础上加x7 ...
Kryo为什么比Hessian快
di1984HIT：呵呵，挺复杂啊，能分享一下么
Storm 与 Esper
x-rip： marsorp 写道使得Esper中利用持久层数据库做过滤、查 ...
Storm 与 Esper
marsorp：使得Esper中利用持久层数据库做过滤、查询等操作就形同鸡肋。 ...
Storm 与 Esper

Hadoop与Strom

博客分类：

Hadoop

阅读更多

   2011最后一个季度的工作基本上是围绕着两个开源项目展开的，总结如下：
   由于硬件的瓶颈，摩尔定律已无法跟上数据量增长的趋势。分布式系统应运而生，而Hadoop和Storm正好代表了两个分布式系统发展的两个方向。
   分布式系统，其主要问题在于如何在节点上将对应的操作应用到数据上。其计算模型也就变成了如何对数据或者操作或者两者的混合进行分发和处理。Hadoop根据移动计算优于移动数据的原则，将操作分发到存储数据的节点，仅在需要且必须移动数据的时候移动数据。这一点注定了Hadoop的适用范围——批处理计算。因为在我们需要对数据进行一系列操作时，数据已经固定了，从某种意义上来说，数据是死的，移动他们是费力且困难的。而对于流式计算来说，数据是流动的，我们可以预知对这些数据进行什么样的操作，但是并不知道这些数据到底是什么（因为他们是实时传送过来的），故采取了对数据进行分发到存储着固定操作的节点。这就是Storm。

分享到：

2011年终总结之流水账 | Hadoop中一些优化想法

2012-01-06 13:22
浏览 1302
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

2020年hadoop简历模板.doc: 熟练使用Sqoop意味着能够有效地集成Hadoop与非Hadoop环境。 5. **Kafka消息队列**：一个高吞吐量的分布式发布订阅消息系统，常用于大数据实时流处理。简历中提到Kafka对接Storm，展示了实时数据处理能力。 6. **...

hadoop2.5汇总：新特性、安装包、Eclipse插件、集群安装.pdf: 10. Hadoop家族和其他相关技术：文档中提到了Hadoop家族（如Strom、Spark）以及Linux、Flume等技术的包，说明Hadoop通常与这些技术和工具一起使用以构建复杂的大数据处理平台。 11. 用户支持和社区：文档提供了51...

精品课程推荐大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx: 【大数据与云计算教程】课程涵盖了从基础到深入的多个关键领域，主要围绕Hadoop和相关技术展开。Hadoop是大数据处理的核心，它是一个开源的分布式计算框架，特别适合处理和存储大规模数据集。 1. **Hadoop简介与...

基于Hadoop的大数据处理关键技术综述.ppt: 4. 解决方案：如Hadoop的MapReduce、MongoDB和流计算工具如Strom和S4。 Hadoop详解： Hadoop是基于Java的开源框架，主要用于在大规模集群中处理海量数据的分布式计算。它由分布式存储（HDFS）和分布式计算...

精品课程推荐大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx: 除了YARN，这个教程系列还涵盖了其他大数据处理工具，如Hadoop的HDFS、MapReduce、Hive、HBase、Pig、Zookeeper、Sqoop、Flume、Kafka、Strom、Spark、Oozie、Impala、Solr、Lily、Titan和Neo4j等，这些都是大数据...

基于Hadoop的大数据处理关键技术综述22.pptx: - 解决方案中，Hadoop及其MapReduce技术、MongoDB、流计算（如Strom和S4）被广泛应用。 4. Hadoop - Hadoop是由Apache于2005年引入，源于Google的MapReduce和GFS项目。 - Hadoop是一个Java实现的分布式计算框架...

大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx: 【大数据与云计算教程课件】中的“31.Strom”部分详细介绍了实时数据处理框架Storm。Storm是由Twitter开源的，旨在解决随着互联网急剧发展而产生的海量数据实时处理需求。相较于传统的Hadoop，Storm在实时计算方面...

精品课程推荐大数据与云计算教程课件优质大数据课程 05.Hadoop入门数据分析实战（共57页）.pptx: 大数据与云计算是现代信息技术领域的核心组成部分，而Hadoop作为开源的大数据处理框架，是学习大数据技术的起点。本课程系列涵盖了Hadoop从基础到高级的全方位讲解，旨在帮助学员掌握大数据处理的关键技能。 Hadoop...

批量下载】storm环境搭建v1等.zip: 【描述】：“strom hadoop,批量下载】storm环境搭建v1等.zip批量下载】storm环境搭建v1等.zip”虽然重复，但可以推测内容可能不仅限于Storm本身，还可能涉及到Hadoop的集成，因为提到了“hadoop”。这暗示了这个...

精品课程推荐大数据与云计算教程课件优质大数据课程 39.Titan（共20页）.pptx: 课程包括多个关键组件和工具，如Hadoop、MapReduce、Hive、HBase、Pig、Zookeeper、Sqoop、Flume、Kafka、Strom、Spark、Neo4j和Elasticsearch等。这些课程以PPTX格式提供，便于教学和自我学习。【Hadoop与...

Storm入门书籍PDF: 在2011年Storm开源之前，由于Hadoop的火红，整个业界都在喋喋不休地谈论大数据。Hadoop的高吞吐，海量数据处理的能力使得人们可以方便地处理海量数据。但是，Hadoop的缺点也和它的优点同样鲜明——延迟大，响应缓慢...

Strom实战构建大数据实时计算: 此外，还会涉及到与其他大数据工具（如Hadoop、Hive、Kafka等）的集成，使读者掌握完整的实时数据处理解决方案。在云计算背景下，Storm常与Hadoop YARN或Mesos等资源管理系统结合，以实现资源的有效管理和调度。书...

精品课程推荐大数据与云计算教程课件优质大数据课程 25.Sqoop（共19页）.pptx: 【大数据与云计算教程】课程涵盖了从基础到高级的大数据处理技术，主要围绕Hadoop生态系统的组件展开。课程从Hadoop的介绍与安装开始，引导学习者进入大数据的世界。Hadoop是分布式存储和计算的基础，其核心组件包括...

strom的学习记录，包括安装过程、整体介绍、监控页面等: ### Apache Storm 学习记录与安装指南 #### 一、Apache Storm 概述 Apache Storm 是一款免费且开源的分布式实时计算系统。它能够保证每个消息都能够被处理，并且能够非常方便地做到水平扩展。Storm 的设计使得它...

精品课程推荐大数据与云计算教程课件优质大数据课程 13.深入MapReduce应用开发（共21页）.pptx: 课程还涉及了Hadoop的多个核心组件，如HDFS（分布式文件系统）、YARN（资源调度系统）、Hive（数据仓库工具）、HBase（NoSQL数据库）、Pig（数据处理语言）、Zookeeper（分布式协调服务）、Sqoop（数据导入导出工具...

大数据运维工程师工作的岗位职责.docx: 2. 熟悉并不限于大数据生态圈 Hadoop、Strom、Spark、HDFS、Kafka、Zookeeper、Hbase、Redis、ElasticSearch、fastdfs 等相关基础组件的框架知识和运行原理。 3. 熟悉软硬件设备，网络原理，有丰富的大数据平台 CDH...

超值推荐超级完整版精品课程推荐大数据与云计算教程课件优质大数据课程全套PPT课件资源集合共41个章节.rar: 大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx 大数据与云计算教程课件优质大数据课程 32.Spark入门之Scala（共173页）.pptx 大数据与云计算教程课件优质大数据课程 33.Spark入门（共40页）....

Global site tag (gtag.js) - Google Analytics