在测试flume和spark push模式时的问题 - 蒋志伟 - ITeye博客

`

java_doom

浏览: 511166 次
来自: ...

最近访客更多访客>>

songhait

pudi

fengxiatao

bbooxx

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

java_doom： peaceliu 写道受教了客气了多谢指教和启发
HAhadoop集群namenode无法自动切换成active
peaceliu：受教了
HAhadoop集群namenode无法自动切换成active
java_doom：补充一下在编译hadoop2.9.4时不要改maven源不要 ...
编译hadoop2.7
java_doom： naomibyron 写道我专门注册了一个ITEYE账号，就为 ...
No protocol specified (gedit:2699): Gtk-WARNING **: cannot open display: :0.
naomibyron：我专门注册了一个ITEYE账号，就为了对你说声谢谢，对我帮助很 ...
No protocol specified (gedit:2699): Gtk-WARNING **: cannot open display: :0.

在测试flume和spark push模式时的问题

博客分类：

flume

阅读更多

写道

#push mode
a1.sources = r1
a1.sinks = k1
a1.channels = c1

#source
a1.sources.r1.channels = c1
a1.sources.r1.type = exec
a1.sources.r1.command = tail -f /export/logs/test.txt
a1.sources.r1.fileHeader = true

#channel
a1.channels.c1.type =memory
a1.channels.c1.capacity = 20000
a1.channels.c1.transactionCapacity=5000

#sinks
a1.sinks.k1.channel = c1
a1.sinks.k1.type = avro
a1.sinks.k1.hostname=172.16.7.165
a1.sinks.k1.port = 9999
a1.sinks.k1.batchSize= 2000

flume配置文件配置成这样了，其中tail -f 配成了小f，结果只能在服务启动时推过来一次数据，然后经高个人指教，原来f F 是不一样的

tail -f 等同于--follow=descriptor，根据文件描述符进行追踪，当文件改名或被删除，追踪停止

tail -F 等同于--follow=name --retry，根据文件名进行追踪，并保持重试，即该文件被删除或改名后，如果再次创建相同的文件名，会继续追踪

tailf 等同于tail -f -n 10（貌似tail -f或-F默认也是打印最后10行，然后追踪文件），与tail -f不同的是，如果文件不增长，它不会去访问磁盘文件，所以tailf特别适合那些便携机上跟踪日志文件，因为它减少了磁盘访问，可以省电

改成F就没问题了

写道

flume-ng agent -n a1 -c /export/servers/apache-flume-1.6.0-bin/conf -f /export/servers/apache-flume-1.6.0-bin/conf/flume-poll-spark1.conf -Dflume.root.logger=INFO,console

分享到：

scala的柯里化 | spark-shell运行spark任务参数设置

2018-12-04 14:39
浏览 539
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Flume对接Spark Streaming的相关jar包: 此 jar 文件在 Flume 集成 Spark Streaming 时用于编译和运行 Scala 代码。 2. commons-lang3-3.3.2.jar：Apache Commons Lang 是一组对 Java 语言的实用工具类库，提供了一些高级字符串处理、日期时间操作等功能。...

flume整合 SparkStreaming.rar: 1.Spark Streaming整合Flume需要的安装包. 2. Spark Streaming拉取Flume数据的flume配置文件.conf 3. Flume向Spark Streaming推数据的flume配置文件.conf

Flume push数据到SparkStreaming: 标题中的“Flume push数据到SparkStreaming”是指在大数据处理领域中，使用Apache Flume将实时数据流推送到Apache Spark Streaming进行进一步的实时分析和处理的过程。这两个组件都是Apache Hadoop生态系统的重要...

基于Flume&spark&Flask的分布式实时日志分析与入侵检测系统源码+文档说明: 基于Flume&spark&Flask的分布式实时日志分析与入侵检测系统源码+文档说明，，含有代码注释，新手也可看懂，个人手打98分项目，导师非常认可的高分项目，毕业设计、期末大作业和课程设计高分必看，下载下来，简单部署...

flume+kafka+sparkStream+redis实时日志采集.docx: 在构建实时日志采集系统时，常常会使用到Apache Flume、Apache Kafka、Apache Spark Streaming以及Redis等组件。以下是对这些技术的详细说明： **Apache Flume** 是一个分布式、可靠且可用于有效收集、聚合和移动...

基于Flume+spark+Flask的分布式实时日志分析与入侵检测系统.zip: 基于Flume+spark+Flask的分布式实时日志分析与入侵检测系统.zip 1、该资源内项目代码经过严格调试，下载即用确保可以运行！ 2、该资源适合计算机相关专业(如计科、人工智能、大数据、数学、电子信息等)正在做课程...

基于Flume+kafka+spark大型电商网站日志分析系统（离线+实时）.zip: 这里提到的"基于Flume+kafka+spark大型电商网站日志分析系统（离线+实时）"就是一个这样的解决方案，结合了三个关键组件：Apache Flume、Apache Kafka和Apache Spark。下面将详细介绍这三个技术及其在系统中的作用。...

基于Spark的实时日志分析及异常检测系统 Flume + Kafka + Hbase + Spark-Streaming: 在大数据处理领域，基于Spark的实时日志分析与异常检测系统是常见的应用场景，尤其是在人工智能（AI）领域。这里提到的"人工智能-spark"项目，结合了Flume、Kafka、HBase以及Spark-Streaming，构建了一个高效且实时...

基于Flume&spark&Flask的分布式实时日志分析与入侵检测系统.zip: 下面我们将详细探讨该系统的核心组成部分：Flume、Spark和Flask，并分析其在日志处理和安全防护中的应用。 1. **Flume：高效的数据采集工具** Flume是Apache的一款开源工具，专门用于收集、聚合和移动大量日志数据...

flumeng for streaming spark: 综上所述，这个压缩包可能包含的内容涵盖了如何配置和使用Flume将数据流从Kafka推送到Spark Streaming进行实时处理，以及如何在Hadoop环境中安装和配置Flume的相关步骤。对于想要学习和实践大数据实时处理的用户来说...

flume-push.conf: a1.sources.r1.spoolDir = /var/log/flume a1.sources.r1.fileHeader = true a1.sinks.k1.type = avro a1.sinks.k1.hostname = 192.168.10.130 a1.sinks.k1.port = 9999 a1.channels.c1.type = memory a1....

本科毕业设计项目，基于spark streaming+flume+kafka+hbase的实时日志处理分析系统，大数据处理技术: 本科毕业设计项目，基于spark streaming+flume+kafka+hbase的实时日志处理分析系统基于spark streaming+flume+kafka+hbase的实时日志处理分析系统本科毕业设计项目，基于spark streaming+flume+kafka+hbase的...

Flume-ng在windows环境搭建并测试+log4j日志通过Flume输出到HDFS.docx: Flume-ng 在 Windows 环境搭建并测试 + Log4j 日志通过 Flume 输出到 HDFS Flume-ng 是一个高可用、可靠、分布式的日志聚合系统，可以实时地从各种数据源（如日志文件、网络 socket、数据库等）中收集数据，并将其...

spark-streaming-flume_2.11-2.1.0.jar: spark-streaming-flume_2.11-2.1.0.jar

基计算机课程毕设：于Flume&spark&Flask的分布式实时日志分析与入侵检测系统.zip: 有任何问题也可以随时私信博主，博主会第一时间给您解答！！！本资源中的源码都是经过本地编译过可运行的，下载后按照文档配置好环境就可以运行。资源项目的难度比较适中，内容都是经过助教老师审定过的，应该能够...

flume+kafka+sparkstreaming: 通过flume监控文件，让kafka消费flume数据，再将sparkstreaming连接kafka作为消费者进行数据处理，文档整理实现

大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK......: 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK.......

Global site tag (gtag.js) - Google Analytics