本月博客排行
-
第1名
wy_19921005 -
第2名
mft8899 -
第3名
java-007 - benladeng5225
- Anmin
年度博客排行
-
第1名
龙儿筝 -
第2名
宏天软件 -
第3名
benladeng5225 - wy_19921005
- vipbooks
- kaizi1992
- 青否云后端云
- e_e
- tanling8334
- sam123456gz
- arpenker
- zysnba
- fantaxy025025
- xiangjie88
- lemonhandsome
- wallimn
- jh108020
- ganxueyun
- Xeden
- xyuma
- zhanjia
- wangchen.ily
- johnsmith9th
- zxq_2017
- forestqqqq
- jbosscn
- daizj
- xpenxpen
- 喧嚣求静
- kingwell.leng
- lchb139128
- kristy_yy
- jveqi
- javashop
- lzyfn123
- sunj
- yeluowuhen
- ajinn
- lerf
- silverend
- chenqisdfx
- xiaoxinye
- flashsing123
- bosschen
- lyndon.lin
- zhangjijun
- sunnylocus
- lyj86
- paulwong
- sgqt
最新文章列表
Storm中的基本概念
Storm中的一些基本概念
Storm:分布式、高容错的实时计算系统。
Topology:拓扑,相当于hadoop中的job,但没有严格的指定开始时间与结束时间。
Spout:Topology中的输入数据流,连接数据源,将各类数据源转换成tuple结构的数据,并序列化,向Bolt输出转化后的数据流。
Bolt:接收Spout的数据流并计算,记录计算结果,并向下一个已订阅的bolt发射结果。
Tup ...
在storm集群环境下发布Topology
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中,通过storm的管理命令来发布和管理集群中的topology。
1、打包
打包插件是使用maven提供的maven-shade-plugin,详细见maven-shade-plugin。
<plugin>
<groupId>org.apache.maven.plug ...
storm事务
转:http://blog.csdn.net/yangbutao/article/details/17844799
1、storm事务性topology的提出
对于容错机制,Storm通过一个系统级别的组件acker,结合xor校验机制判断一个msg是否发送成功,进而spout可以重发该msg,保证一个msg在出错的情况下至少被重发一次。但是在一些事务性要求比较高的场景中,需要保障一次 ...
storm drpc
转 http://www.cnblogs.com/panfeng412/archive/2012/07/02/storm-common-patterns-of-distributed-rpc.html
本文翻译自:https://github.com/nathanmarz/storm/wiki/Distributed-RPC,作为学习Storm DRPC的资料,转载必须以超链接形式标明文 ...
storm trident api
Trident API
partition本地操作,无需网络io
等同于pig的generate
mystream.each(new Fields("b"), new MyFunction(), new Fields("d")))
public class MyFunction extends BaseFunction {
...
Zookeeper可以干什么,能带来什么
在Zookeeper的官网上有这么一句话:ZooKeeper is a centralized service for maintaining configuration information, naming, providing distributed synchronization, and providing group services.
这大概描述了Zookeeper主要可以干哪 ...
storm supervisor 异常关机后 不能启动Error when processing event
2015-06-06 02:32:42 event [ERROR] Error when processing event
java.lang.RuntimeException: java.io.EOFException
at backtype.storm.utils.Utils.deserialize(Utils.java:68)
at bac ...
Storm0.9.4的集群部署
Twitter开源的Storm是一个分布式的、可靠的、容错的实时计算系统。Storm的其它概念和功能特点此处就不再赘述,这里主要讲Storm如何在集群中正确配置安装。在我之前听说Storm的时候,Storm的网络传输还是通过ZeroMQ来实现的,当前版本已经支持Netty Transport传输了,而且据说后者的性能要比前者高一倍,我们果断选择后者。好了言归正传,下面进入部署环节。
1、 ...
从批处理到流式计算的罪与罚 ——storm实践总结
近期是对storm做了不少的研究与分享,包括我的前一篇文章的《数据处理神器storm的理解与思考 ——让你的数据化作行云流水》,无论是看官方的文档,还是看其他第三方文献介绍推荐,总会让你觉得各种高端先进,毕竟它代表了一种比较新潮的设计思想,刚开始接触了解的人更会跃跃欲试。然而storm是否真如看上去那么美?还是说,storm只是另一个喜好新鲜事物的开发者把玩的玩物?这些都需要亲自尝试过才会得知。 ...
整合Kafka到Spark Streaming——代码示例和挑战
作者Michael G. Noll是瑞士的一位工程师和研究员,效力于Verisign,是Verisign实验室的大规模数据分析基础设施(基础Hadoop)的技术主管。本文,Michael详细的演示了如何将Kafka整合到Spark Streaming中。 期间, Michael还提到了将Kafka整合到 Spark Streaming中的一些现状,非常值得阅读,虽然有一些信息在Spark 1.2版 ...
基于Storm的Nginx log实时监控系统
背景
UAE(UC App Engine)是一个UC内部的PaaS平台,总体架构有点类似CloudFoundry,包括:
快速部署:支持Node.js、Play!、PHP等框架
信息透明:运维过程、系统状 ...
Storm安装
因为本人在用hbase,所以zk不用在安装,安装步骤如下
依赖包:
安装zeromq
wget http://download.zeromq.org/zeromq-2.1.7.tar.gz
tar -xzf zeromq-2.1.7.tar.gz
cd zeromq-2.1.7
./configure
make
sudo make install
conf ...
storm org.apache.thrift7.transport.TTransportException:java 解决
关于storm 搭建的文章很多了,这里就不写了。
搭建好storm后运行第一个例子,发现报错了,错误如下:
Exception in thread "main" java.lang.RuntimeException: org.apache.thrift7.transport.TTransportException: java.net.ConnectExce ...