本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
zysnba - xiangjie88
- sgqt
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wallimn
- wy_19921005
- vipbooks
- benladeng5225
- 龙儿筝
- javashop
- ranbuijj
- fantaxy025025
- zw7534313
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- jh108020
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- lemonhandsome
- jbosscn
- mengjichen
- zxq_2017
- luxurioust
- lzyfn123
- forestqqqq
- nychen2000
- Xeden
- zhanjia
- wjianwei666
- ajinn
- hanbaohong
- 喧嚣求静
- jickcai
- kingwell.leng
- mwhgJava
- silverend
- lich0079
- lchb139128
最新文章列表
storm入门教程 第四章 消息的可靠处理
4.1 简介
storm可以确保spout发送出来的每个消息都会被完整的处理。本章将会描述storm体系是如何达到这个目标的,并将会详述开发者应该如何使用storm的这些机制来实现数据的可靠处理。
4.2 理解消息被完整处理
一个消息(tuple)从spout发送出来,可能会导致成百上千的消息基于此消息被创建。
我们来思考一下流式的“单词统计”的例子:
storm任务从数据源(K ...
大数据系列7:Storm – 流计算
wget http://download.zeromq.org/zeromq-2.1.7.tar.gz
tar -xzvf zeromq-2.1.7.tar.gz
cd zeromq-2.1.7
sudo apt-get install gcc
sudo apt-get install g++
sudo apt-get install libuuid-dev
./configure ...
基于storm引擎的虫洞系统
虫洞系统是吸星大法项目衍生出来实时计算的基础平台。
它以storm实时流处理引擎为基础,提供了计算力、数据源整合、数据交换、监控几大功能模块。任务的权限控制正在筹划中。
这几个功能模块是此实时计算平台提供稳定运行的基础,虫洞系统承载的业务包括:月光宝盒、一淘首页个性化(实时用户个性化指标的计算)、吸星大法实时日志接入(数据源整合)。
storm入门教程 第一章 前言
1.1 实时流计算
互联网从诞生的第一时间起,对世界的最大的改变就是让信息能够实时交互,从而大大加速了各个环节的效率。正因为大家对信息实时响应、实时交互的需求,软件行业除了个人操作系统之外,数据库(更精确的说是关系型数据库)应该是软件行业发展最快、收益最为丰厚的产品了。记得十年前,很多银行别说实时转账,连实时查询都做不到,但是数据库和高速网络改变了这个情况。
随着互联网的更进一步发展,从 ...
Storm因机器断电等,启动supervisor错误
因机器断电或其他异常导致的supervisor意外终止,再次启动时报错:
2013-09-24 09:15:44,361 INFO [main] daemon.supervisor (NO_SOURCE_FILE:invoke(0)) - Starting supervisor wi ...
使用Storm实现实时大数据分析
简单和明了,Storm让大数据分析变得轻松加愉快。
当今世界,公司的日常运营经常会生成TB级别的数据。数据来源囊括了互联网装置可以捕获的任何类型数据,网站、社交媒体、交易型商业数据以及其它商业环境中创建的数据。考虑到数据的生成量,实时处理成为了许多机构需要面对的首要挑战。我们经常用的一个非常有效的开源实时计算工具就是Storm —— Twitter开发,通常被比作“实时的Hadoop”。然而 ...
二、基于storm的爬虫设计方案构想
基于storm的爬虫设计方案构想
这是一个令人振奋的构想
最近在弄storm,之前又弄过爬虫,所以把两者结合起来我觉得还挺有意思的。我们知道爬虫是从网络上获取数据经过一些处理保存到本地,作为自己的业务数据等。所以其从输入到输出其实就是一个数据流不断的流经系统。storm作为实时流处理的利器,其使我们非常方便的对系统各部件的并发进行rebalance,所以如果将其用在自己的爬虫中我们 ...
Storm 常见使用模式-场景
转:http://www.youxinrencwx.com/myblog/blog/java/framework/storm/storm-common-usage-pattern-scene/
Strom常见使用模式如下:
流聚合(stream join)
批处理(Batching)
BasicBolt
内存内缓存 + fields grouping 组合
计算top N ...
Twitter Storm
第 121 章 Twitter Storm
目录
121.1. 单机版
121.2. lein 安装
121.1. 单机版
操作系统环境:Ubuntu 13.04 KVM虚拟机
安装 storm 涉及到安装以下包:python、zookeeper、zeromq、jzmq、storm
过程 121.1. Ubuntu + Storm 单机环境安装
...
Storm分布式流计算平台的部署安装
目前大数据时代已经来临,面临大数据分布式、实时处理的多种技术平台,我们该如何选择?经过调研及逐步甄选,Storm和S4是相对比较突出的两个分布式流计算平台,Storm是由twitter开源,S4是雅虎开源,相对于S4,Storm的成熟度高稳定性好。包括阿里巴巴等大型公司的数据平台也在使用Storm。
搜罗了网上很多Storm的安装教程,大多数网友也是转载,没有一篇教程能够指导 ...
Storm流式实时计算开源框架(三)
本文讲述Twitter Storm安装配置,也作为学习笔记。 storm的官方安装说明(e文):https://github.com/nathanmarz/storm/wiki/Setting-up-a-Storm-cluster 。 storm的安 ...
Storm流式实时计算开源框架(二)
由于设备有限,采用虚拟机实现Storm单机版环境安装,以下是对自己安装过程的记录,以供他人参考。准备工作如下:
1.主机基本信息
2.虚拟机软件
实验中的虚拟机软件为VMware-workstation-full-8.0.0-471780.exe。
3.虚拟操作系统CentOS配置
镜像文件为CentOS-5.3-i386-bin-DVD.is ...