MapReduce运行日志收集

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 2146 次

锁定老帖子主题：MapReduce运行日志收集精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
zhangbaoming815 等级: 初级会员性别: 文章: 2 积分: 40 来自: 北京	发表时间：2013-07-02 最后修改：2013-07-09 相关推荐: Hadoop13：【案例】MapReduce任务日志查看『Hadoop』MapReduce 处理日志log(单机版) MapReduce 运行原理（万字长篇原理 + 案例） MapReduce的jobHistory(工作日志)介绍分布式日志收集工具分析比较更多相关推荐 Hadoop MapReduce运行产生的日志分散在各个DataNode上，调试起来非常的麻烦，大家有什么好的方法将这些日志收集起来，统一分析的吗？声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

zhangbaoming815 等级: 初级会员性别: 文章: 2 积分: 40 来自: 北京	发表时间：2013-07-09 共享一下想法 Hadoop各个DataNode都持有在当前机器上执行的map，reduce任务的日志。 log4j的TLA定义了这些日志的位置，使用SocketAppender重写TLA可以将多个结点的日志打印到某一个机器上。但是这种方法有缺点，当日志变多的时候，SocketAppender并不太稳定，且具有单点故障问题。使用Chukwa收集这些日志也是可行的，在每一个DataNode上开启一个agent，agent监控Mapreduce任务产生日志的文件夹，收集Mapreduce的日志，将这些日志发往collector，集中存储到HDFS上。
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 综合技术版

跳转论坛: