`

Facebook分布式日志收集框架——Scribe

阅读更多

 Scribe是用来收集日志的服务器。它具备很强的扩展能力,并且网络故障及服务器节点故障,都不会对日志收集造成影响。大规模集群系统中每个节点上都运行了一个Scribe服务,这个Scribe服务器可以收集信息然后将信息发送到一个中央Scribe服务器(也可以是多个中央Scribe服务器),如果中央Scribe服务器(或中央服务器组)出现故障不可用的话,各个节点的Scibe服务器就会将日志信息写到本地磁盘,待中央Scribe服务器恢复正常时再发送。中央Scribe服务器会将这些信息写文件保存到最终的磁盘地址,一般是nfs文件系统或者一个分布式文件系统中,有时也会把这些日志文件传输到其他层的Scribe服务器组中.

  Scribe的独特之处是客户端日志实例包含两个字符串:类别和信息(a category and a message)。类别(category)是对预期目标信息的高层次描述,可以在Scribe服务器中进行配置,这样就允许我们可以通过更改配置文件的方式转移数据而不需要更改代码。Scribe服务器也允许基于类别前缀(category prefix)进行配置,缺省状态下可以在文件路径中插入类别名称。灵活性和可扩展性,可通过“存储(store)“抽象。Stores可以通过一个配置文件静态配置,也可以在运行时无需停止服务器进行更改。

  Scribe是对一个使用非阻断C++服务器的thrift服务的实现。Facebook在上千台服务器上运行了Scribe服务,每天收集传输数十亿的信息。

c++编程网

分享到:
评论

相关推荐

    Thrift+Scribe分布式日志系统的构建

    在 Thrift+Scribe 构建的分布式日志系统中,日志的产生端(如服务器或应用)使用 log4j 或其他日志框架记录日志。这些日志可以通过 Thrift 的服务接口发送到 Scribe 客户端。Scribe 客户端将接收到的日志封装成 `Log...

    facebook scribe

    Facebook Scribe 是一个分布式日志收集系统,由Facebook开源,主要用于处理大规模的日志数据。在大型分布式系统中,各个服务会产生大量的日志信息,这些信息对于监控、调试和数据分析至关重要。Scribe设计的目标是...

    Facebook大量数据处理 Scribe.zip

    4. **数据分析**:Scribe收集的数据可以进一步导入Hadoop集群进行离线分析,或者直接送入实时分析系统进行在线分析。 **C/C++在Scribe中的作用** Scribe最初是用C++编写的,因为C++提供了高性能和低级别的内存管理...

    Scribe日志记录讲解

    Scribe 是一个由 Facebook 开源的日志记录框架,它基于 Thrift 框架构建,旨在提供分布式环境下的日志收集服务。Scribe 的主要特点是其简单架构、灵活的日志格式以及支持异步消息发送和队列处理。由于它与 Thrift ...

    开源日志系统比较:scribe、chukwa、kafka、flume.pdf

    Scribe是一款由Facebook开发的日志收集系统,广泛应用于其内部。其核心特点在于容错性和可扩展性。当后端存储系统出现问题时,Scribe能够将数据暂存至本地磁盘,待系统恢复后重新加载。Scribe的架构简单,由scribe ...

    facebook-scribe-63e4824.tar

    Scribe是Facebook设计的一种分布式日志系统,它的主要目标是统一收集各种服务的日志数据,提供一种简单高效的方式将日志流传输到中央存储或处理系统。Scribe支持多个日志流,每个流代表一类特定的日志信息,如服务器...

    开源日志系统比较:scribe、chukwa、kafka、flume.docx

    Scribe是Facebook开源的日志收集系统,适用于大规模分布式环境。它的核心特性在于高容错性,即使存储系统出现问题,也能保证数据不丢失。Scribe由三部分构成: - **Scribe Agent**:作为Thrift客户端,负责从各个...

    scribe客户端所需jar包

    4. **log4j**:Apache的log4j是Java日志框架,用于记录应用程序的运行时信息,包括错误、警告和调试信息。 5. **log4j Appender**:在log4j中,Appender是负责将日志事件输出到特定目的地的组件。配置一个指向...

    scribe日志系统文档

    Scribe是一款由Facebook开源的分布式日志收集系统,主要用于集中式地收集并处理各种来源的日志数据。它基于跨平台的语言Thrift进行开发,能够很好地支持Java Log4j等日志框架,并允许通过Log4j等工具将日志信息发送...

    scribe详细安装文档

    scribe是一个广泛使用的日志聚合系统,主要设计用于收集、分类和转发分布式系统的日志数据。在大型分布式环境中,如Hadoop或Facebook等,scribe扮演着至关重要的角色,它允许各个节点将日志数据发送到中心位置进行...

    Facebook大量相似高速数据实时日志收集系统

    **Scribe**:一个分布式日志收集系统,正在集成Zookeeper来提高系统的可靠性和一致性。 **HDFS**:一种可靠的分布式文件系统,其中`hdfsSync`和`ConcurrentReader`是关键组件,用于确保数据的一致性和并发访问。 *...

    scribe安装配置文档[汇编].pdf

    Scribe 是 Facebook 开源的日志收集系统,已经在 Facebook 内部得到大量的应用。它能从各种日志源收集日志,存储到一个中央存储系统上,便于进行集中统计分析处理。它为日志的”分布式收集,统一处理”提供了一个可...

    scribe软件

    scribe是一款开源的日志收集系统,最初由Facebook开发并贡献给了开源社区。它设计的主要目标是为大规模分布式系统提供可靠、高效且可扩展的日志管理解决方案。scribe允许不同的服务将它们的日志数据流式传输到一个...

    scribe+hadoop+log4j+hive+mysql

    #### 一、Hadoop——分布式计算框架 - **定义与功能**:Hadoop 是一个能够对大量数据进行分布式处理的软件框架。它通过使用简单的编程模型来支持数据密集型跨服务器应用程序的信息处理。Hadoop 的核心组件包括 HDFS...

    scribe-apache-1.5.0.zip

    结合这两个压缩包,我们可以构建一个Java应用,该应用能够从Scribe收集的日志数据中获取相关信息,然后利用Junrar库处理其中可能包含的RAR文件,例如,从日志文件中提取的归档日志数据。这种组合在处理如网络日志...

    Data Warehousing and Analytics Infrastructure at Facebook

    - **Scribe**:作为分布式日志收集系统,Scribe被用于收集来自不同服务的日志数据,确保了数据的集中管理与高效传输。 - **Hadoop**:作为一种分布式计算框架,Hadoop负责大规模数据的存储与处理。通过MapReduce等...

    scribe-log4j:将日志消息发送到 Scribe 的 log4j appender

    将日志消息发送到 Scribe 的 log4j appender。 有3个maven项目: scribe-client - 为 scribe 自动生成的 Java 客户端 scribe-log4j - scribe-log4j附加程序 scribe-example - 使用示例 入门 克隆仓库 git clone ...

    基于Flume的美团日志收集系统.pdf

    Flume-NG 是 Cloudera 提供的一个高可用的、分布式的海量日志采集、聚合和传输的系统,而 Scribe 是 Facebook 开源的日志收集系统。 Flume-NG 采用 Java 语言,具有高可用性、可靠性和可扩展性,而 Scribe 采用 C++ ...

    日志分析系统调研分析ELKEFK.docx

    - **Scribe**:由Facebook开发并开源的日志收集系统,已在Facebook内部广泛应用。其主要特点是容错性好,能够在后端存储系统出现故障时将数据暂存至本地磁盘,待故障恢复后再上传至中央存储系统。Scribe的架构主要...

    【推荐】开源日志系统-word范文模板 (17页).pdf

    Scribe是Facebook开发的日志聚合系统,旨在解决大规模分布式环境下的日志收集问题。它通过Thrift协议与日志源通信,将数据高效地汇聚到中心存储系统。Scribe的核心特性是其高容错性,当存储系统出现故障时,数据会...

Global site tag (gtag.js) - Google Analytics