虫洞系统是吸星大法项目衍生出来实时计算的基础平台。
它以storm实时流处理引擎为基础,提供了计算力、数据源整合、数据交换、监控几大功能模块。任务的权限控制正在筹划中。
这几个功能模块是此实时计算平台提供稳定运行的基础,虫洞系统承载的业务包括:月光宝盒、一淘首页个性化(实时用户个性化指标的计算)、吸星大法实时日志接入(数据源整合)。
-
计算能力
基于storm的流式处理任务可以直接运行在虫洞系统上,避免了搭建、维护集群的成本,极大的节约了业务的成本、提高了开发的效率和系统的稳定性
-
数据源整合
目前虫洞系统整合了多个实时数据源,这些数据源组合起来,可以实现完整的业务分析。 吸星大法实时数据接入将数据源接入、归一化,为使用方提供格式一致的数据,简化了日志使用的成本和难度。目前接入的主要数据源有:
– 全网Aplus日志
– 订单
– 支付宝交易
– 站外B2C
– 实时购物车、收藏夹等
-
数据交换
基础日志经过归一化之后,根据业务场景需求,可以有两种方式来使用:
1) Hbase, 如果需要回溯历史数据,可以使用Hbase接口来访问
2)虫洞(动态端口), 高效、便捷的数据交换形式,支持日志的横向和纵向任意裁剪,支持客户端的动态负载均衡;高容错性等很多特性
上述两种方式都提供了客户端sdk供使用
-
监控系统
监控系统是虫洞系统稳定运行的基础。它有两个主要功能: 1) storm task级状态的汇总 2)异常状态的报警,目前支持短信、旺旺报警
storm task级监控室为storm量身定做的监控系统,使得集群中不同机器间的状态统一监控,监控指标丰富、并且可自定义,是任务开发、调试、运维的利器。
转自淘宝
相关推荐
基于Storm的分布式实时信号处理系统是一种利用了Storm这一流式云计算系统进行实时数据处理的架构。Storm系统由Twitter公司开发,它是一个开源的分布式实时计算系统,提供了实时处理数据流的高效平台。Storm系统的...
【基于Storm的日志收集系统】是一种利用Apache Storm技术构建的实时大数据处理解决方案,主要用于收集、分析和存储应用程序的日志数据。在现代企业中,日志数据对于监控系统性能、诊断问题以及进行业务分析至关重要...
在这篇论文中,作者穆化鑫和程渤提出了一种基于Storm引擎的分布式多传感器数据融合系统架构。Storm是一个近年来广泛使用的开源分布式实时处理引擎,具有良好的流式处理特性,这使得它成为承载数据融合理论与算法的...
### 基于Storm构建实时热力分布项目实战 #### 一、项目背景与目标 在大数据时代,数据流处理成为解决实时性需求的关键技术之一。Apache Storm作为一款开源的分布式实时计算系统,在处理大规模数据流方面表现出色,...
### 基于Storm流计算天猫双十一作战室项目实战 #### 一、课程亮点与核心知识点 本课程针对Apache Storm这一强大的分布式实时计算系统进行了全方位的解析与实战演练。通过本课程的学习,不仅可以掌握Storm的基本...
基于Storm的短信诈骗拦截提示系统的设计与实现
标题“基于Storm与Kafka集群的火电厂分布式流式数据建模与分析系统”指向了两个主要的技术组件:Apache Storm和Apache Kafka,以及它们在火电厂数据处理方面的应用。Apache Storm是一个分布式的、实时的计算系统,...
标题《基于Storm的城市消防联网远程监控系统的实时数据处理应用》揭示了本篇论文的核心研究方向,即运用了Storm这一实时计算系统,针对城市消防联网远程监控系统进行实时数据处理应用的研究。在描述中,“#资源达人...
本资源"实时大数据分析基于Storm、Spark技术的实时应用.zip"是一个聚焦于这一领域的专业书籍,出版于2018年,确保了其中的技术信息相对新颖,能够涵盖当前实时大数据处理的主流技术和最佳实践。 Storm和Spark是两个...
本文介绍的基于Storm的实时推荐系统论文,主要关注了如何在大规模的数字图书馆环境中,实时地为用户提供个性化推荐服务。以下是根据提供的文档内容,对涉及的关键知识点的详细解读。 1. Kafka集群架构 Kafka是一种...
在系统设计方面,本文提出了一种基于Storm的实时数据处理平台架构,该架构主要由分布式集群服务器、Web服务器、客户端三个部分组成。分布式集群服务器负责实时数据的采集和处理,Web服务器则负责与客户端通信,提供...
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学...基于Storm+Esper架构实现的证券异常交易行为监控系统源码+项目说明(支持金证交易系统的指令拦截 、复制与解析).zip
这说明基于Storm的实时分析系统能够很好地满足车联网数据流处理的要求。 #### 5. 关键词解析 - **车联网(vehiclenetwork)**:指的是将各种车辆通过传感器、网络等技术进行互联的系统,目的是实现车辆间及车辆与...
《基于Storm的区域销售数据分析系统》 随着互联网的飞速发展,企业和组织每天都在产生海量的数据,这使得大数据处理成为了当今的重要课题。特别是在销售领域,实时分析区域销售数据可以帮助企业快速响应市场变化,...
Storm是一个分布式实时计算系统,特别适合于对流数据的实时处理。Storm提供了一个低延迟、可伸缩和容错的流处理平台,能够处理大量数据流并支持多种编程语言。在Storm平台上,数据可以被实时处理和分析,从而满足...