`
raymond.chen
  • 浏览: 1437508 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Flume简介及安装配置

 
阅读更多

Flume是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

 

Flume以agent为最小的独立运行单位。一个agent就是一个JVM。单agent由Source、Sink和Channel三大组件构成。

 

Flume的数据流由事件(Event)贯穿始终。事件是Flume的基本数据单位,它携带日志数据(字节数组形式)并且携带有头信息,这些Event由Agent外部的Source生成。当Source捕获事件后会进行特定的格式化,然后Source会把事件推入(单个或多个)Channel中。你可以把Channel看作是一个缓冲区,它将保存事件直到Sink处理完该事件。Sink负责持久化日志或者把事件推向另一个Source。


 

常用的source有:

    JMS Source    从JMS系统(消息、主题)中读取数据

    Spooling Directory Source  监控指定目录内数据变更

    Avro Source    支持Avro协议(实际上是Avro RPC),内置支持

    Thrift Source    支持Thrift协议,内置支持

    ......

 

常用的Channel有:

    Memory Channel    Event数据存储在内存中

    File Channel    Event数据存储在磁盘文件中

    ......

 

常用的Sink有:

    File Roll Sink存储数据到本地文件系统

    HDFS Sink数据写入HDFS

    Logger Sink数据写入日志文件

    Avro Sink数据被转换成Avro Event,然后发送到配置的RPC端口上

    Thrift Sink数据被转换成Thrift Event,然后发送到配置的RPC端口上

    HBase Sink数据写入HBase数据库

    Custom Sink自定义Sink实现

    ......

 

 Flume的安装配置

    0、安装JKD并配置相关的环境变量

    1、上传安装包并解压   tar -zxvf apache-flume-1.6.0-bin.tar.gz

    2、环境变量配置

        在etc/profile文件添加以下环境变量

            export FLUME_HOME=/opt/apache-flume-1.6.0-bin

            export FLUME_CONF_DIR=$FLUME_HOME/conf

            export PATH=.:$PATH:$FLUME_HOME/bin

        执行 . /etc/profile 命令,让修改立即生效

    3、执行以下命名测试安装是否成功  

        bin/flume-ng version

        如果出错,需要修改bin/flume-ng文件,为相关的正则表达式加上双引号(依报错提示进行修改)

 

  • 大小: 11.6 KB
分享到:
评论

相关推荐

    Flume简介&安装配置&使用案例.md

    Flume简介&安装配置&使用案例.md

    flume介绍及安装配置

    Flume 是一个由 ...安装 Flume 的关键步骤包括准备合适的 Linux 环境,安装 JDK,设置环境变量,解压并配置 Flume。了解这些基础知识后,可以根据实际需求构建和配置 Flume 系统,以便更好地管理和分析日志数据。

    flume安装程序

    这里的`agentName`是你自定义的Agent名称,`config/file.conf`是你的Flume配置文件的路径。 4. **配置Flume**: 配置文件是Flume的核心,它定义了数据流的结构。一个基本的配置示例可能如下所示: ``` ...

    Flume1.6.0入门:安装、部署、及flume的案例

    ### Flume 1.6.0 入门详解:安装、部署及案例分析 #### 一、Flume 概述 Flume 是 Cloudera 开发的一款高效、可靠且易于扩展的日志收集系统,适用于大数据环境下的日志采集任务。Flume 的初始版本被称为 FlumeOG...

    flume-ng安装

    Flume-NG 安装与配置指南 Flume-NG 是一个分布式日志收集系统,能够从各种数据源中实时采集数据,并将其传输到集中式存储系统中。本文将指导您完成 Flume-NG 的安装和基本配置。 安装 Flume-NG 1. 先决条件:...

    flume安装配置

    1.flume是什么? 这里简单介绍一下,它是Cloudera的一个产品 2.flume是干什么的? 收集日志的 3.flume如何搜集日志? 我们把flume比作情报人员 (1)搜集信息 (2)获取记忆信息 (3)传递报告间谍信息

    Flume安装详细步骤

    Flume安装详细步骤 Flume是一款基于Java的分布式日志收集系统,主要用于收集和传输大规模日志数据。下面是Flume安装的详细步骤: Step 1: 安装JDK环境 在安装Flume之前,需要确保JDK环境已经安装。这里我们使用...

    flume在虚拟机上安装,

    #### 四、Flume配置与测试 - **配置Agent**: Flume的核心组件是Agent,它包含Source、Channel和Sink三个部分。可以通过修改Flume的配置文件来配置这些组件。 - **启动Agent**: 使用以下命令启动一个简单的Flume ...

    《数据采集与预处理》教学教案—06Flume的安装和配置.docx

    "《数据采集与预处理》教学教案—06Flume的安装和配置" 本节课主要讲解了 Flume 的安装和配置,旨在让学生熟悉 Flume 的相关基础知识,并学会 Flume 的安装和不同应用场景下的配置。 Flume 是一个分布式、高可靠...

    Apache_Flume安装与配置

    Apache Flume是一个分布式、可靠且可用的系统,用于...总体来说,安装和配置Flume涉及多个步骤,需要对系统的网络环境、Java环境和配置文件有详细的了解。正确配置可以保证Flume集群高效地进行数据的采集、传输和聚合。

    Flume1.8安装部署

    Flume 1.8 安装部署 Flume 是一个分布式、可靠、可扩展的日志收集、聚合和移动系统,广泛应用于大数据和实时数据处理领域。以下是 Flume 1.8 安装部署的详细步骤和相关知识点。 一、准备工作 1. 下载 apache ...

    Flume学习文档(2){Flume安装部署、Flume配置文件}.docx

    配置Flume涉及到编辑Flume配置文件,这是一个基于Java的Properties格式的文本文件。在案例一中,我们看到一个简单的配置示例,用于监听特定端口(如44444)并把接收到的数据打印到控制台。以下是对配置文件中各个...

    大数据Ambari之flume集成编译好的源码包

    Apache Ambari 是一个用于管理和监控Hadoop集群的开源工具,它提供了直观的Web界面和RESTful API,使得安装、配置、管理Hadoop生态系统变得更加简单。Flume是Apache的一个开源项目,用于收集、聚合和移动大量日志...

    hadoop集群配置之————flume安装配置(详细版)

    4. 将flume/conf下的flume-env.sh.template文件修改为flume-env.sh,并配置JAVA_HOME环境变量,指向JDK的安装目录。 入门案例: 1. 创建配置文件:例如使用Flume实时监控整个目录的新文件,自动输出到控制台。 2. ...

    Hadoop中Flume安装指南

    #### 知识点五:Flume配置详解 - **flume-env.sh**:这个文件是Flume的环境配置文件,主要用于设置`JAVA_HOME`等环境变量。例如: - `export JAVA_HOME=/opt/module/jdk1.8.0_144`:设置Java的安装路径,确保Flume...

    Linux下Flume的安装

    进入安装目录下的conf/目录,拷贝Flume的环境配置模板flume-env.sh.template,修改flume-env.sh文件,指定JDK的安装路径: export JAVA_HOME=/usr/java/jdk1.8.0_201 验证: 由于已经将Flume的bin目录配置到环境...

    Flume1.9.0配置.docx

    一、Flume 的安装和环境配置 在安装 Flume 之前,需要安装 Java JDK,因为 Flume 依赖 Java 环境变量。在本例中,我们使用的是 JDK 1.8.0_11。安装完成后,需要将 Java_HOME 变量添加到环境变量中,以便 Flume 可以...

    集群flume详细安装步骤

    今天,我们将讨论如何在集群环境中安装和配置 Flume,並与 Kafka 进行集成。 安装 Flume 首先,下载 Flume 的安装包,并将其解压到指定的目录下。接着,创建一个配置文件 `flume.conf`,用于指定 Flume 的 Agent ...

Global site tag (gtag.js) - Google Analytics