Eagle是eBay开源的一个分布式实时安全监控方案。通过离线训练模型集合实时流引擎监控,能立即监测出对敏感数据的访问或恶意的操作,并立即采取应对的措施。下图是Eagle的架构。
Eagle的数据行为监控方案可用于如下几类典型场景:
-
监控Hadoop中的数据访问流量
-
检测非法入侵和违反安全规则的行为
-
检测并防止敏感数据丢失和访问
-
实现基于策略的实时检测和预警
-
实现基于用户行为模式的异常数据行为检测
Eagle特点
-
高实时: 我们充分理解安全监控中高度实时和快速反应的重要性,因此设计Eagle之初,我们竭尽可能地确保能在亚秒级别时间内产生告警,一旦综合多种因素确订为危险操作,立即采取措施阻止非法行为。
-
可伸缩:在eBay Eagle 被部署在多个大型Hadoop集群上,这些集群拥有数百PB的数据,每天有8亿以上的数据访问时间,因此Eagle必须具有处理海量实时数据的高度可伸缩能力。
-
简单易用:可用性也是Eagle产品的核心设计原则之一。通过Eagle的Sandbox,使用者仅需数分钟便可以设置好环境并开始尝试。为了使得用户体验尽可能简单,我们内置了许多很好的例子,只需简单地点击几步鼠标,便可以轻松地完成策略地创建和添加。
-
用户Profile:Eagle 内置提供基于机器学习算法对Hadoop中用户行为习惯建立用户Profile的功能。我们提供多种默认的机器学习算法供你选择用于针对不同HDFS特征集进行建模,通过历史行为模型,Eagle可以实时地检测异常用户行为并产生预警。
Eagle框架
Eagle核心框架提供实时监控系统开发过程中所需要的大部分重要基础组件,例如:
轻量级分布式流处理框架:以DAG为基础模型对通用流处理范式进行抽象,在开发期用户只需基于DSL API定义监控程序的流式处理逻辑,运行期再选择实际物理执行环境,默认支持单进程和Storm,同时也支持对于其他执行环境的扩展,比如Spark Streaming 或者 Flink等。
实时流聚合引擎:提供简单易用的实时流聚合规则定义语法,元数据驱动,动态部署,实现线性扩展的实时监控数据流聚合。
分布式Policy引擎:分布式实时预警规则执行引擎,提供类SQL的描述性规则定义语法以及机器学习自动等多种扩展,支持预警规则的动态加载和分区。
存储和查询框架:通用监控数据存储框架,可用于存储和查询日志,指标,警报,事件等多种类型数据,默认支持HBase,并针对HBase进行多种优化和扩展,比如coprocesser,二级索引以及分区等,也支持其他存储类型的扩展比如RDBMS等,并提供通用的ORM, REST API以及易用强大的类SQL查询语法。
可定制化监控报表:提供类Notebook的交互式实时可视化分析,也支持进一步选取部分图标,并定义布局保存为dashboard以供分享或者持续监控。
Eagle 针对不同的应用场景提供多种上层应用,例如
Eagle JPA: 实时监控Hadoop 或者 Spark等平台上的作业当前和历史执行状态,提供多维度不同粒度的性能分析,支持多种异常预警和性能警告,比如作业运行时间过长,读写过慢,数据倾斜,失败任务比率过多等,可有效在作业无法满足SLA之前提供预警和性能建议,同时结合机器学习模型,基于任务分布或指标变化等协同预测任务或者服务器节点等可能潜在的异常,并集成Remediation系统对系统进行自动修复。
Eagle DAM:实时监控用户行为,以保证数据安全,支持HDFS, HIVE等不同数据类型,提供简单高效的数据流接入Plugin,支持简单规则定义语法,结合机器学习算法对用户行为建模(User Profiling),自动探测异常用户行为,可集成Dataguides等对敏感数据进行监控,也可集成Apache Ranger等对异常用户行为进行限制。
此外,Eagle 支持以AmbariPlugin等方式方便地安装和集成到现有集群中,并提供友好的用户界面进行管理。
Eagle是机器学习结合流计算应用的很好的案例,大家可以关注下。
微信扫一扫
关注该公众号
相关推荐
Apache Eagle 是一个分布式实时监控和预警框架,最初由 eBay 创建并捐赠给 Apache 软件基金会,成为 Apache 孵化器项目。Eagle 的主要目标是解决在大规模 Hadoop 生态系统中的实时监控和安全问题,尤其是在数据量...
Apache Eagle 是一个由Apache软件基金会支持的开源项目,专注于大数据平台的安全性和性能监控。自2015年10月进入Apache孵化器以来,Eagle经历了快速的发展,于2017年1月成为Apache顶级项目,并发布v0.5版本。该项目...
Apache Eagle是一个...总的来说,Apache Eagle是一个针对大规模Hadoop环境设计的高效监控和预警框架,通过其强大的实时处理能力、可扩展性和智能化特性,为企业提供了一种能够适应快速变化的大数据环境的解决方案。
Apache:registered:Eagle:trade_mark:是一个开源分析解决方案,用于立即识别大数据平台(例如Apache Hadoop,Apache Spark,NoSQL等)上的安全性和性能问题。它分析数据活动,yarn应用程序,jmx指标和守护程序日志等...
Apache Eagle 是一个实时监控和警报平台,专为大规模数据基础设施设计,旨在提供高效的数据安全、性能监控和业务智能功能。Eagle 0.5.0 版本是该项目的一个稳定版本,提供了多种改进和新特性。在这个版本中,用户...
总结来说,Apache Eagle 0.5.1 是一个强大的监控解决方案,它简化了企业对于大数据环境的监控和管理。通过解压并执行“eagle-0.5.1-SNAPSHOT-bin.tar.gz”文件,用户可以快速搭建起监控系统,保护数据安全,提升系统...
**Kafka Eagle** 是一款专为Apache Kafka设计的开源监控和管理工具,旨在提供更为直观、高效的监控解决方案。它的出现,极大地便利了Kafka集群的运维工作,通过丰富的图表和实时数据,帮助管理员及时发现并解决可能...
- **实时监控**:Kafka Eagle提供了全面的监控视图,包括 broker、topic、partition、consumer 等各个层面的实时状态,帮助管理员快速了解集群运行状况。 - **性能分析**:它能够展示各项性能指标,如吞吐量、...
Kafka Eagle是一款专门针对Apache Kafka的高性能、易用的监控和管理工具,其2.0.4版本为用户提供了更为完善的Kafka集群监控解决方案。这款开源软件能够帮助运维人员实时监控Kafka集群的状态,及时发现并解决问题,...
Apache Eagle 是一个分布式实时监控和警报引擎,专为Hadoop设计,由eBay开源并成为Apache孵化器项目。它的主要目标是在2015年10月26日推出,旨在实现实时保护Hadoop数据的安全,即时识别对敏感数据的访问,检测攻击...
- **简介**:Apache Eagle是一款针对Hadoop集群的安全监控方案。 - **最新版本**:Apache Eagle,此版本发布于一年前。 - **功能**: - Hadoop数据安全监控; - 异常检测; - 安全事件管理。 #### HTTP(S)流量...
Kafka Eagle是一款专为Apache Kafka设计的开源管理界面,它的1.4.0版本提供了丰富的功能,旨在帮助用户更有效地监控、管理和操作Kafka集群。这款工具在2019年发布,具有直观的用户界面和强大的数据可视化能力,使得...
面对这些挑战,Kafka Eagle 应运而生,旨在为用户提供更加便捷、高效的 Kafka 集群监控方案。 #### 二、Kafka Eagle 的设计架构 Kafka Eagle 的设计架构涵盖了多个方面,以确保其高效稳定运行: 1. **可视化**:...
**Kafka Eagle** 是一款专为Apache Kafka设计的开源监控和管理工具,旨在提供全面、高效且用户友好的界面,帮助管理员和开发人员实时监控Kafka集群的状态,从而确保数据流处理系统的稳定运行。它的主要功能包括但不...
Kafka Eagle,一个专为Apache Kafka设计的强大监控和管理系统,旨在提供全面、直观的监控解决方案,以确保Kafka集群的稳定运行和高效管理。在我们所讨论的版本——`kafka-eagle-bin-2.1.0.tar.gz.zip`中,包含了这个...
1. **实时监控**:Kafka Eagle可以实时展示Kafka集群的运行状态,包括主题、分区、副本等关键指标,帮助管理员及时发现并解决问题。 2. **管理功能**:用户可以通过Web界面创建、删除、修改Kafka的主题,以及调整...
Apache:registered:Eagle:trade_mark:是一个开源分析解决方案,用于立即识别大数据平台(例如Apache Hadoop,Apache Spark,NoSQL等)上的安全和性能问题。它分析数据活动,yarn应用程序,jmx指标和守护程序日志等,...
综上所述,Kafka_2.12-3.3.1.tgz 和 Kafka-Eagle-bin-3.0.1.tar.gz 为 Kafka 的部署、管理和监控提供了完整的解决方案。理解并熟练掌握这两个组件,对于构建高效、稳定的实时数据处理系统至关重要。在实际操作中,还...
监控管理方面,利用Apache Eagle等实时分析工具,对集群服务审计日志和用户行为进行智能分析,以便及时发现并预警潜在的安全风险。 总的来说,大数据安全架构设计是一个综合性的解决方案,涵盖了从标准制定到技术...