本月博客排行
-
第1名
Xeden -
第2名
fantaxy025025 -
第3名
bosschen - paulwong
- johnsmith9th
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - gengyun12
- wy_19921005
- vipbooks
- e_e
- benladeng5225
- wallimn
- ranbuijj
- javashop
- jickcai
- fantaxy025025
- zw7534313
- qepwqnp
- robotmen
- 解宜然
- ssydxa219
- sam123456gz
- zysnba
- sichunli_030
- tanling8334
- arpenker
- gaojingsong
- xpenxpen
- kaizi1992
- wiseboyloves
- jh108020
- xyuma
- ganxueyun
- wangchen.ily
- xiangjie88
- Jameslyy
- luxurioust
- mengjichen
- lemonhandsome
- jbosscn
- nychen2000
- zxq_2017
- lzyfn123
- wjianwei666
- forestqqqq
- ajinn
- siemens800
- hanbaohong
- 狂盗一枝梅
- java-007
- zhanjia
- 喧嚣求静
- Xeden
最新文章列表
Linux搭建Flume开发环境
1.Linux搭建Flume环境
2.官网下载Flume安装包:apache-flume-1.8.0-bin.tar.gz, 利用xftp5工具上传到:/usr/local/flume
3.利用xshell5工具登录到服务器解压flume,输入:cd /usr/local/flume
[root@marklin ~]# cd /usr/local/flume
...
大数据(三)-----flume安装应用
1.安装规划
见大数据(一)-----HADOOP安装
2.安装flume
将flume安装在目录/home/hadoop/apache-flume-1.7.0-bin下,并配置环境变量
export FLUME_HOME=/home/hadoop/apache-flume-1.7.0-bin
配置conf目录下flume-hdfs.conf文件,包括agent,sink, ...
kafka + flume + hdfs + zookeeper + spark 测试环境搭建
最近由于项目需要, 搭建了一个类似线上环境的处理流数据的环境
用的是CDH 版本5.9.x
hdfs组成: 2 namenode HA, 6 datanode
kafka: 3 台kafka server
zookeeper: 3台
flume: 1台
spark: 6台 每台32G内存
数据流程是有远端终端向我们数据处理服务器(Gengo)发送, 再由Gengo向kafka还有flume发送 ...
flume配置及问题处理
一、flume配置
一台机器做负载均衡,二台服务器做存储hdfs
============================================
hadoop01
============================================
#声明Agent
a1.sources = r1
a1.sinks = k1 k2
a1.channels = c ...
Apache Flume日志收集系统简介
Apache Flume是一个分布式、可靠、可用的系统,用于从大量不同的源有效地收集、聚合、移动大量日志数据进行集中式数据存储。
Flume简介
Flume的核心是Agent,Agent中包含Source、Channel、Sink。Agent是最小的独立运行单位。在Agent中,数据流向为Source->Channel->Sink。
其中,
Source:收集数据 ...
flume-kafka 实例 详细
flume 下载:http://download.csdn.net/download/knight_black_bob/9454497
spring-kafka 接受消息实例 http://knight-black-bob.iteye.com/blog/2344424
flume kafka 安装 详细 http://knight-black-bob.iteye.com ...
Flume-1.7.0文档翻译-中英文对照-概览
Apache Flume是一个高可用的分布式系统.可以从多种不同的数据源高效的收集大量log数据至起中央数据仓库中.
Flume不仅仅可以用于收集log数据.由于数据源是可以自定义的,所以Flume可以用作传输大量复杂的事件数据,包括但不限于网络流量的采集,社交媒体数据的采集,电子邮件信息的采集,以及传输其他众多种类数据,正因为sources是自定义的,flume让这些成为了可 ...
Flume应用场景及架构原理
Flume概念
Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
flume 特点:
1、可靠性
当节点出现故障时,日志能够被传送到其他节点上而不会丢失。Flume提供了三种级别的可靠性保障,所有的数据以event为单位传输,从强到弱依次分别为:end-t ...
解决flume向kafka发送 均分到各个partition中
官网中虽然说没有key 会随机分配到partition,但是不知道为什么在我这没有出现这种效果,所以我加了一个key,需要加个source拦截器
运行flume-ng agent --conf conf --conf-file test.sh --name a1 -Dflume.root.logger=INFO,console
# example.conf: A single-node ...
flume使用hdfs sink时需要注意的几点
最近接触了flume,这个日志收集器在扩展性方面确实很便捷,相信这与其架构的设计有密切的关系。书归正传,这次用到了hdfs sink在使用时还是有几点需要注意的,在此和大家分享一下。
第一部分windows下搭建单机的hdfs
如果你和我一样没有linux的测试环境,想在windows搭建hdfs,可以参考下面的链接,笔者就是参照这篇文章进行部署的
http://blog.csdn.n ...
flume-ng hdfs配置文件
collection73Agent.sources=source73
collection73Agent.sinks=sink73-1 sink73-2
collection73Agent.channels=channel73
#configuration source
collection73Agent.sources.source73.type=avro
collectio ...
exec方式flume-ng配置
producer.sources = r1
producer.sinks = k1 k2
producer.channels = c1 c2
# Describe/configure the source
producer.sources.r1.type = exec
producer.sources.r1.command =tail -F /home/tom/job/test/d ...
flume-ng syslogtcp整合配置文件
#configuration 'flume78Agent'
flume78Agent.sources=source78
flume78Agent.sinks=sink78-1 sink78-2
flume78Agent.channels=channel78
#configuration sinks group
flume78Agent.sinksgroups=group78
...
Leek——韭菜的自我救赎
Leek——韭菜的自我救赎
Leek是一款基于分布式的简易版智能实时选股系统,计算能力超强,代码量极少。
相关项目:项目地址:Leek——简易版实时智能选股平台
目前实现了3种简单的策略(欢迎大家pull request更多策略): 策略1:大单卖,选出股票的卖5档总手数大于买5档口总手数100倍时的股票;策略2:大单买,选出股票的买5档总手数大于卖5档口总手数100倍时的股票;策 ...
基于flume-ng抓取mysql数据到kafka
flume是一个日志收集器,更多详细的介绍可以参照官网:http://flume.apache.org/
在apache flume的官网上没有找到sql数据源数据抓取的source,
可以利用github上的plugin插件:https://github.com/keedio/flume-ng-sql-source,1.4.3版本基于hibernate实现,已可以适配所有的关系型数据库 ...
flume系统使用以及与storm的初步整合
Flume NG的简单使用可以参考介绍文档:http://blog.csdn.net/pelick/article/details/18193527,图片也来源此blog:
下载完flume后,就可以在 https://flume.apache.org/FlumeUserGuide.html 中根据教程来启动agent console
...