Flume是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
Flume以agent为最小的独立运行单位。一个agent就是一个JVM。单agent由Source、Sink和Channel三大组件构成。
Flume的数据流由事件(Event)贯穿始终。事件是Flume的基本数据单位,它携带日志数据(字节数组形式)并且携带有头信息,这些Event由Agent外部的Source生成。当Source捕获事件后会进行特定的格式化,然后Source会把事件推入(单个或多个)Channel中。你可以把Channel看作是一个缓冲区,它将保存事件直到Sink处理完该事件。Sink负责持久化日志或者把事件推向另一个Source。
常用的source有:
JMS Source 从JMS系统(消息、主题)中读取数据
Spooling Directory Source 监控指定目录内数据变更
Avro Source 支持Avro协议(实际上是Avro RPC),内置支持
Thrift Source 支持Thrift协议,内置支持
......
常用的Channel有:
Memory Channel Event数据存储在内存中
File Channel Event数据存储在磁盘文件中
......
常用的Sink有:
File Roll Sink存储数据到本地文件系统
HDFS Sink数据写入HDFS
Logger Sink数据写入日志文件
Avro Sink数据被转换成Avro Event,然后发送到配置的RPC端口上
Thrift Sink数据被转换成Thrift Event,然后发送到配置的RPC端口上
HBase Sink数据写入HBase数据库
Custom Sink自定义Sink实现
......
Flume的安装配置
0、安装JKD并配置相关的环境变量
1、上传安装包并解压 tar -zxvf apache-flume-1.6.0-bin.tar.gz
2、环境变量配置
在etc/profile文件添加以下环境变量
export FLUME_HOME=/opt/apache-flume-1.6.0-bin
export FLUME_CONF_DIR=$FLUME_HOME/conf
export PATH=.:$PATH:$FLUME_HOME/bin
执行 . /etc/profile 命令,让修改立即生效
3、执行以下命名测试安装是否成功
bin/flume-ng version
如果出错,需要修改bin/flume-ng文件,为相关的正则表达式加上双引号(依报错提示进行修改)
相关推荐
Flume 是一个由 ...安装 Flume 的关键步骤包括准备合适的 Linux 环境,安装 JDK,设置环境变量,解压并配置 Flume。了解这些基础知识后,可以根据实际需求构建和配置 Flume 系统,以便更好地管理和分析日志数据。
Flume-NG 安装与配置指南 Flume-NG 是一个分布式日志收集系统,能够从各种数据源中实时采集数据,并将其传输到集中式存储系统中。本文将指导您完成 Flume-NG 的安装和基本配置。 安装 Flume-NG 1. 先决条件:...
1.flume是什么? 这里简单介绍一下,它是Cloudera的一个产品 2.flume是干什么的? 收集日志的 3.flume如何搜集日志? 我们把flume比作情报人员 (1)搜集信息 (2)获取记忆信息 (3)传递报告间谍信息
请解压后再用,flume-1.6.0-bin.tar 安装包,希望对大家有用。
Flume安装详细步骤 Flume是一款基于Java的分布式日志收集系统,主要用于收集和传输大规模日志数据。下面是Flume安装的详细步骤: Step 1: 安装JDK环境 在安装Flume之前,需要确保JDK环境已经安装。这里我们使用...
"《数据采集与预处理》教学教案—06Flume的安装和配置" 本节课主要讲解了 Flume 的安装和配置,旨在让学生熟悉 Flume 的相关基础知识,并学会 Flume 的安装和不同应用场景下的配置。 Flume 是一个分布式、高可靠...
Flume 1.8 安装部署 Flume 是一个分布式、可靠、可扩展的日志收集、聚合和移动系统,广泛应用于大数据和实时数据处理领域。以下是 Flume 1.8 安装部署的详细步骤和相关知识点。 一、准备工作 1. 下载 apache ...
在本实验中,你将学习如何安装、配置并使用 Flume 组件,这对于大数据处理和分析至关重要,因为它能帮助组织高效地管理和传输海量数据。 1. 实验目的: - 掌握 Flume 的下载和解压缩过程。 - 学会部署 Flume 组件...
进入安装目录下的conf/目录,拷贝Flume的环境配置模板flume-env.sh.template,修改flume-env.sh文件,指定JDK的安装路径: export JAVA_HOME=/usr/java/jdk1.8.0_201 验证: 由于已经将Flume的bin目录配置到环境...
一、Flume 的安装和环境配置 在安装 Flume 之前,需要安装 Java JDK,因为 Flume 依赖 Java 环境变量。在本例中,我们使用的是 JDK 1.8.0_11。安装完成后,需要将 Java_HOME 变量添加到环境变量中,以便 Flume 可以...
今天,我们将讨论如何在集群环境中安装和配置 Flume,並与 Kafka 进行集成。 安装 Flume 首先,下载 Flume 的安装包,并将其解压到指定的目录下。接着,创建一个配置文件 `flume.conf`,用于指定 Flume 的 Agent ...
kafka对接flume,flume对接elasticSearch,flume配置样例
hadoop集群配置之————flume安装配置(详细版)
Flumeng简介 Apache Flume是从不同数据源收集、聚合、传输大量数据、日志到数据中心的分布式系统,具有可靠、可伸缩、可定制、高可用、高性能等明显优点。其主要特点有:声明式配置,可动态更新;提供上下文路由,...
Flume学习文档(2){Flume安装部署、Flume配置文件}。 记录我的学习之旅,每份文档倾心倾力,带我成我大牛,回头观望满脸笑意,望大家多多给予意见,有问题或错误,请联系 我将及时改正;借鉴文章标明出处,谢谢
本章将详细介绍如何在Linux上安装和配置Flume。 **实验目的**: 1. 学习并掌握下载与解压Flume的流程。 2. 理解Flume组件的部署方法。 3. 掌握通过Flume发送和接收信息的基本操作。 **实验要求**: 1. 先对Flume的...
**安装 Flume 1.5.0** 1. 下载 Apache Flume 1.5.0 从官方网站(http://flume.apache.org/)的下载页面。 2. 解压缩到指定目录,例如 `/home/hadoop`。 3. 修改配置文件 `flume-env.sh`,设置 `JAVA_HOME` 环境变量...
01_Flume的介绍及其架构组成 02_Flume的安装部署 03_Flume的测试运行 04_Flume中配置使用file channel及HDFS sink 05_Flume中配置HDFS文件生成大小及时间分区 ... 12_Flume中Taildir的配置及测试使用
Flume 组件安装配置知识点 Flume 是 Cloudera 提供的一个高可用的、 高可靠的、分布式的海量日志采集、聚合和传输的系统。它支持在日志系统中定制各类数据发送方用于收集数据,具有将数据写入到各种数据接受方...
flume配置文件,文件配了说明,可以拿下来改一改就用。 可以获取端口数据监听或者文件、文件夹内容监听,实时写入hdfs、mysql或者你需要的路径。