一、什么是Apache Flume
官网:Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data . It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.
1、flume是一个 分布式的 日志 收集系统 ,具有高可靠、高可用、事务管理、失败重启等功能。数据处理速度快,完全可以用于生产环境。
常用的分布式日志收集系统:
Apache Flume、
Facebook Scribe、
Apache Chukwa
2、flume的核心是 agent 。agent是一个java进程,运行在日志收集端,通过agent接收日志,然后暂存起来,再发送到目的地。
3、agent里面包含3个核心组件:source、channel、sink。
3.1、 source 组件是专用于收集日志的,可以处理各种类型各种格式的日志数据,包括avro、thrift、exec、jms、spooling directory、netcat、 sequence generator、syslog、http、legacy、自定义。source组件把数据收集来以后,临时存放在channel中。
3.2、 channel 组件是在agent中专用于临时存储数据的,可以存放在memory、jdbc、file、自定义。
channel中的数据只有在sink发送成功之后才会被删除。
3.3、 sink 组件是用于把数据发送到目的地的组件,目的地包括hdfs、logger、avro、thrift、ipc、file、null、hbase、solr、自定义。
4、在整个数据传输过程中,流动的是event。事务保证是在event级别。
5、flume可以支持 多级flume的agent ,支持扇入(fan-in)、扇出(fan-out)。
Flume简单处理示意图
Flume复杂处理示意图
二、Flume安装配置
2.1、下载Flume
Flume下载链接
2.2、解压缩
cd /home/yujianxin/flume
tar -zxvf apache-flume-1.6.0-src.tar.gz ; tar -zxvf apache-flume-1.6.0-bin.tar.gz
然后把src文件夹中的内容全部复制到bin文件夹
2.3、配置Flume环境变量
export FLUME_HOME=xxx/flume-1.6.0-bin
export path=$path:$FLUME_HOME/bin
三、 验证Flume安装是否成功
$ flume-ng version
Flume 1.6.0
Source code repository: https://git-wip-us.apache.org/repos/asf/flume.git
Revision: 2561a23240a71ba20bf288c7c2cda88f443c2080
Compiled by hshreedharan on Mon May 11 11:15:44 PDT 2015
From source with checksum b29e416802ce9ece3269d34233baf43f
OK!出现如上截图,说明Flume成功安装。Flume的使用请关注后续博文。
转载于:https://my.oschina.net/u/923508/blog/608255
分享到:
相关推荐
Flume安装详细步骤 Flume是一款基于Java的分布式日志收集系统,主要用于收集和传输大规模日志数据。下面是Flume安装的详细步骤: Step 1: 安装JDK环境 在安装Flume之前,需要确保JDK环境已经安装。这里我们使用...
接下来,我将详细介绍与Flume安装使用相关的知识点。 ### Flume的安装步骤 1. **下载安装包**:首先需要从Apache官方网站下载Flume的tar.gz压缩包,例如文档中提到的apache-flume-1.6.0-bin.tar.gz。 2. **解压...
在本安装指南中,我们将深入探讨如何使用提供的`flume-1.6.0-bin.tar`安装包来安装和配置Apache Flume。 1. **下载与准备**: 首先,你需要从Apache官方网站下载Flume的最新稳定版本。在本例中,我们已有一个名为`...
### Hadoop中Flume安装指南 #### 知识点一:Hadoop与Flume简介 - **Hadoop**:一个能够对大量数据进行分布式处理的软件框架,它为用户提供了高扩展性的系统来存储和运行应用程序。 - **Flume**:一款高可靠、高...
### Flume安装过程详解及其配置步骤 #### 一、Flume简介 Apache Flume是一款高可靠、高性能的服务,用于收集、聚合和移动大量日志数据。Flume支持简单灵活的配置,可以很好地满足多种场景下的数据采集需求。Flume...
Flume 安装搭建使用 Flume 是一个分布式的、可靠的、高效的日志收集、聚集、移动服务。它可以实时处理大数据量的日志,提供了一个灵活的架构来处理大数据。 一、Flume 简介 Flume 是一个基于流式架构的服务,能够...
3. 将下载好的Flume安装文件上传到目标服务器的指定目录下,例如/opt/psrv/programes目录。 4. 解压安装包:使用命令`tar -zvxf flume-distribution-0.9.4-bin.tar.gz`来解压文件到当前目录。 5. 在解压后的目录中...
在这个“flume安装文档”中,我们将探讨 Flume 的安装步骤、配置以及一个简单的 Avro 类型的数据传输示例。 **一、Flume 安装** 1. **下载 Flume**:首先,你需要从 Apache 官方网站下载最新稳定版本的 Flume。在...
1.flume是什么? 这里简单介绍一下,它是Cloudera的一个产品 2.flume是干什么的? 收集日志的 3.flume如何搜集日志? 我们把flume比作情报人员 (1)搜集信息 (2)获取记忆信息 (3)传递报告间谍信息
启动命令位于 Flume 安装目录的 `bin` 子目录下,使用 `flume-ng agent` 命令,指定配置文件启动服务。 为了验证 Flume 集群的工作,可以在 hadoop12 的 `logs` 目录下创建一个测试文件,然后观察 hadoop13 上 `...
安装 Flume 首先需要确保你的系统上已经安装了 Java 1.7 或更高版本,并且正确配置了 Java 环境变量。你可以通过 `java -version` 命令检查 Java 版本。然后,你可以从 Flume 的官方网站...
在本文档中,我们将深入探讨Flume的安装部署以及配置文件的使用。 首先,要安装Flume,你需要访问官方网站http://flume.apache.org/下载最新版本的Flume。在下载完成后,解压缩文件到你的服务器或开发环境中。安装...
Flume 1.8 安装部署 Flume 是一个分布式、可靠、可扩展的日志收集、聚合和移动系统,广泛应用于大数据和实时数据处理领域。以下是 Flume 1.8 安装部署的详细步骤和相关知识点。 一、准备工作 1. 下载 apache ...
### Flume安装手册 #### 一、Flume简介与应用场景 Apache Flume 是一款高可靠、高性能的服务,用于收集、聚合和移动大量日志数据。它具有简单的架构和灵活的配置,非常适合分布式日志收集场景。 #### 二、Flume在...
4. 将flume/conf下的flume-env.sh.template文件修改为flume-env.sh,并配置JAVA_HOME环境变量,指向JDK的安装目录。 入门案例: 1. 创建配置文件:例如使用Flume实时监控整个目录的新文件,自动输出到控制台。 2. ...
在进行Flume安装之前,需要确保以下条件: - **操作系统**: 本文档假设使用的操作系统为Linux。 - **JDK**: 已经安装了JDK,并且JDK版本至少为1.7或以上。Flume依赖于Java运行环境。 - **Hadoop**: 如果需要集成...
在这个场景中,我们将探讨如何安装和配置Flume,以及如何利用它进行数据采集。 首先,Flume的安装过程非常直观。你可以从Apache的官方镜像站点(如描述中给出的...
`flume安装及使用.conf`文件可能包含以下内容: ``` a1.sources = r1 a1.sinks = k1 a1.channels = c1 # Describe/configure the source a1.sources.r1.type = avro a1.sources.r1.bind = localhost a1.sources.r1...