`
wbj0110
  • 浏览: 1611026 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

基于storm引擎的虫洞系统

阅读更多

虫洞系统是吸星大法项目衍生出来实时计算的基础平台。

它以storm实时流处理引擎为基础,提供了计算力、数据源整合、数据交换、监控几大功能模块。任务的权限控制正在筹划中。

 

这几个功能模块是此实时计算平台提供稳定运行的基础,虫洞系统承载的业务包括:月光宝盒、一淘首页个性化(实时用户个性化指标的计算)、吸星大法实时日志接入(数据源整合)。
 
 
  • 计算能力
    基于storm的流式处理任务可以直接运行在虫洞系统上,避免了搭建、维护集群的成本,极大的节约了业务的成本、提高了开发的效率和系统的稳定性
 
  • 数据源整合
    目前虫洞系统整合了多个实时数据源,这些数据源组合起来,可以实现完整的业务分析。 吸星大法实时数据接入将数据源接入、归一化,为使用方提供格式一致的数据,简化了日志使用的成本和难度。目前接入的主要数据源有:
            – 全网Aplus日志
            – 订单
            – 支付宝交易
            – 站外B2C
            – 实时购物车、收藏夹等
  •   数据交换
    基础日志经过归一化之后,根据业务场景需求,可以有两种方式来使用:
                     1) Hbase, 如果需要回溯历史数据,可以使用Hbase接口来访问
                     2)虫洞(动态端口), 高效、便捷的数据交换形式,支持日志的横向和纵向任意裁剪,支持客户端的动态负载均衡;高容错性等很多特性
             上述两种方式都提供了客户端sdk供使用
 
  • 监控系统
    监控系统是虫洞系统稳定运行的基础。它有两个主要功能: 1) storm task级状态的汇总 2)异常状态的报警,目前支持短信、旺旺报警
storm task级监控室为storm量身定做的监控系统,使得集群中不同机器间的状态统一监控,监控指标丰富、并且可自定义,是任务开发、调试、运维的利器。
转自淘宝
分享到:
评论

相关推荐

    基于Storm的分布式实时信号处理系统.pdf

    基于Storm的分布式实时信号处理系统是一种利用了Storm这一流式云计算系统进行实时数据处理的架构。Storm系统由Twitter公司开发,它是一个开源的分布式实时计算系统,提供了实时处理数据流的高效平台。Storm系统的...

    基于Storm的日志收集系统

    【基于Storm的日志收集系统】是一种利用Apache Storm技术构建的实时大数据处理解决方案,主要用于收集、分析和存储应用程序的日志数据。在现代企业中,日志数据对于监控系统性能、诊断问题以及进行业务分析至关重要...

    论文研究-基于Storm引擎的分布式数据融合系统的设计与实现 .pdf

    在这篇论文中,作者穆化鑫和程渤提出了一种基于Storm引擎的分布式多传感器数据融合系统架构。Storm是一个近年来广泛使用的开源分布式实时处理引擎,具有良好的流式处理特性,这使得它成为承载数据融合理论与算法的...

    基于Storm构建实时热力分布项目实战.txt

    ### 基于Storm构建实时热力分布项目实战 #### 一、项目背景与目标 在大数据时代,数据流处理成为解决实时性需求的关键技术之一。Apache Storm作为一款开源的分布式实时计算系统,在处理大规模数据流方面表现出色,...

    基于Storm流计算天猫双十一作战室项目实战

    ### 基于Storm流计算天猫双十一作战室项目实战 #### 一、课程亮点与核心知识点 本课程针对Apache Storm这一强大的分布式实时计算系统进行了全方位的解析与实战演练。通过本课程的学习,不仅可以掌握Storm的基本...

    基于Storm的短信诈骗拦截提示系统的设计与实现

    基于Storm的短信诈骗拦截提示系统的设计与实现

    基于Storm与Kafka集群的火电厂分布式流式数据建模与分析系统.pdf

    标题“基于Storm与Kafka集群的火电厂分布式流式数据建模与分析系统”指向了两个主要的技术组件:Apache Storm和Apache Kafka,以及它们在火电厂数据处理方面的应用。Apache Storm是一个分布式的、实时的计算系统,...

    基于Storm的城市消防联网远程监控系统的实时数据处理应用.pdf

    标题《基于Storm的城市消防联网远程监控系统的实时数据处理应用》揭示了本篇论文的核心研究方向,即运用了Storm这一实时计算系统,针对城市消防联网远程监控系统进行实时数据处理应用的研究。在描述中,“#资源达人...

    实时大数据分析基于Storm、Spark技术的实时应用.zip

    本资源"实时大数据分析基于Storm、Spark技术的实时应用.zip"是一个聚焦于这一领域的专业书籍,出版于2018年,确保了其中的技术信息相对新颖,能够涵盖当前实时大数据处理的主流技术和最佳实践。 Storm和Spark是两个...

    基于storm的实时推荐系统论文

    本文介绍的基于Storm的实时推荐系统论文,主要关注了如何在大规模的数字图书馆环境中,实时地为用户提供个性化推荐服务。以下是根据提供的文档内容,对涉及的关键知识点的详细解读。 1. Kafka集群架构 Kafka是一种...

    基于Storm技术的实时数据处理平台研究与实现.pdf

    在系统设计方面,本文提出了一种基于Storm的实时数据处理平台架构,该架构主要由分布式集群服务器、Web服务器、客户端三个部分组成。分布式集群服务器负责实时数据的采集和处理,Web服务器则负责与客户端通信,提供...

    基于Storm+Esper架构实现的证券异常交易行为监控系统源码+项目说明(支持金证交易系统的指令拦截 、复制与解析).zip

    【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学...基于Storm+Esper架构实现的证券异常交易行为监控系统源码+项目说明(支持金证交易系统的指令拦截 、复制与解析).zip

    基于Storm的车联网数据实时分析系统.pdf

    这说明基于Storm的实时分析系统能够很好地满足车联网数据流处理的要求。 #### 5. 关键词解析 - **车联网(vehiclenetwork)**:指的是将各种车辆通过传感器、网络等技术进行互联的系统,目的是实现车辆间及车辆与...

    基于Storm的区域销售数据分析系统-开题报告.pdf

    《基于Storm的区域销售数据分析系统》 随着互联网的飞速发展,企业和组织每天都在产生海量的数据,这使得大数据处理成为了当今的重要课题。特别是在销售领域,实时分析区域销售数据可以帮助企业快速响应市场变化,...

    基于Storm的分布式实时数据流密度聚类算法.pdf

    Storm是一个分布式实时计算系统,特别适合于对流数据的实时处理。Storm提供了一个低延迟、可伸缩和容错的流处理平台,能够处理大量数据流并支持多种编程语言。在Storm平台上,数据可以被实时处理和分析,从而满足...

Global site tag (gtag.js) - Google Analytics