浏览 2056 次
锁定老帖子 主题:MapReduce运行日志收集
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2013-07-02
最后修改:2013-07-09
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2013-07-09
共享一下想法
Hadoop各个DataNode都持有在当前机器上执行的map,reduce任务的日志。 log4j的TLA定义了这些日志的位置,使用SocketAppender重写TLA可以将多个结点的日志打印到某一个机器上。但是这种方法有缺点,当日志变多的时候,SocketAppender并不太稳定,且具有单点故障问题。 使用Chukwa收集这些日志也是可行的,在每一个DataNode上开启一个agent,agent监控Mapreduce任务产生日志的文件夹,收集Mapreduce的日志,将这些日志发往collector,集中存储到HDFS上。 |
|
返回顶楼 | |