flume集群搭建

字母哥

浏览: 70866 次
性别:
来自: 北京

最近访客更多访客>>

shansheng

iteakey

chiqiansunny

yanzuo2046

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

hadoop flume

搭建一个flume集群，设置2个节点，如下图这样的集群

2个节点分别为192.168.5.220和192.168.5.221
设置成这样的情景，第一个接受日志传过来的数据（这里使用配置log4j往里面写数据），
第一个节点的sink指向第二个节点的source，第二个节点sink配制成hdfs

首先，配置第一个节点，

这里面source的port设置成41414，log4j输出的port也必须配制成41414，才能把数据传到flume
sink配置的port必须和第二个节点source配置的一样才行

配置第二个节点

source的bind配置本机ip,端口配置和第一个节点的sink.port一样
这个节点sink写入hdfs,配置了2个拦截器，对输出hdfs目录进行格式化

然后先启动第2个节点

bin/flume-ng agent --conf ./conf/ -f ./conf/agent2.conf -n agent2 -Dflume.root.logger=DEBUG,console

再启动第一个节点

bin/flume-ng agent --conf ./conf/ -f ./conf/agent1.conf -n agent1 -Dflume.root.logger=DEBUG,console

都启动完成，写个java测试类进行测试

package cn.han;

import org.apache.log4j.Logger;

public class MyTest {
	public Logger log=Logger.getLogger(MyTest.class);
	public static void main(String[] args) {
		MyTest ss=new MyTest();
		for(int i=0;i<20;i++){
			ss.log.info(System.currentTimeMillis());
		}
	}
}

配置下log4j

log4j.rootLogger=INFO,flume
log4j.appender.flume = org.apache.flume.clients.log4jappender.Log4jAppender
log4j.appender.flume.Hostname = 192.168.5.220
log4j.appender.flume.Port = 41414
log4j.appender.flume.UnsafeMode = true

测试类运行的时候可能会报错，把flume-ng-log4jappender-1.5.0-cdh5.1.3-jar-with-dependencies.jar放入测试项目的环境变量中
运行测试类，去hdfs的目录查看文件已经生成，这样，flume集群就配置好了