`
sungine
  • 浏览: 28207 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

如何处理多线程并发时的日志追踪

 
阅读更多

MDC

MDC(Mapped Diagnostic Context,映射调试上下文)是 log4j 和 logback 提供的一种方便在多线程条件下记录日志的功能。某些应用程序采用多线程的方式来处理多个用户的请求。在一个用户的使用过程中,可能有多个不同的线程来进行处理。典型的例子是 Web 应用服务器。当用户访问某个页面时,应用服务器可能会创建一个新的线程来处理该请求,也可能从线程池中复用已有的线程。在一个用户的会话存续期间,可能有多个线程处理过该用户的请求。这使得比较难以区分不同用户所对应的日志。当需要追踪某个用户在系统中的相关日志记录时,就会变得很麻烦。

一种解决的办法是采用自定义的日志格式,把用户的信息采用某种方式编码在日志记录中。这种方式的问题在于要求在每个使用日志记录器的类中,都可以访问到用户相关的信息。这样才可能在记录日志时使用。这样的条件通常是比较难以满足的。MDC 的作用是解决这个问题。

MDC 可以看成是一个与当前线程绑定的哈希表,可以往其中添加键值对。MDC 中包含的内容可以被同一线程中执行的代码所访问。当前线程的子线程会继承其父线程中的 MDC 的内容。当需要记录日志时,只需要从 MDC 中获取所需的信息即可。MDC 的内容则由程序在适当的时候保存进去。对于一个 Web 应用来说,通常是在请求被处理的最开始保存这些数据。清单 5 中给出了 MDC 的使用示例。

清单 5. MDC 使用示例
 public class MdcSample { 
    private static final Logger LOGGER = Logger.getLogger("mdc"); 
    public void log() { 
        MDC.put("username", "Alex"); 
        if (LOGGER.isInfoEnabled()) { 
            LOGGER.info("This is a message."); 
        } 
    } 
 }

清单 5 中,在记录日志前,首先在 MDC 中保存了名称为“username”的数据。其中包含的数据可以在格式化日志记录时直接引用,如清单 6 所示,“%X{username}”表示引用 MDC 中“username”的值。

清单 6. 使用 MDC 中记录的数据
 log4j.appender.stdout.layout.ConversionPattern=%X{username} %d{yyyy-MM-dd HH:mm:ss} [%p] %c - %m%n

 

 

使用半结构化的日志消息

在介绍日志记录 API 中的格式化器时提到过,日志记录中除了基本的日志消息之外,还包括由日志框架提供的其他元数据。这些数据按照给定的格式出现在日志记录中。这些半结构化的格式使得可以通过工具提取日志记录中的相关信息进行分析。在使用日志 API 进行记录时,对于日志消息本身,也推荐使用半结构化的方式来组织。

比如一个电子商务的网站,当用户登录之后,该用户所产生的不同操作所对应的日志记录中都可以包含该用户的用户名,并以固定的格式出现在日志记录中,如清单 8 所示。

清单 8. 使用半结构化的日志消息
 [user1] 用户登录成功。
 [user1] 用户成功购买产品 A。
 [user2] 订单 003 付款失败。

当需要通过日志记录来排查某个用户所遇到的问题时,只需要通过正则表达就可以很快地查询到用户相关的日志记录。

 

 

日志聚合与分析

在程序中正确的地方输出合适的日志消息,只是合理使用日志的第一步。日志记录的真正作用在于当有问题发生时,能够帮助开发人员很快的定位问题所在。不过一个实用的系统通常由很多个不同的部分组成。这其中包括所开发的程序本身,也包括所依赖的第三方应用程序。以一个典型的电子商务网站为例,除了程序本身,还包括所依赖的底层操作系统、应用服务器、数据库、HTTP 服务器和代理服务器和缓存等。当一个问题发生时,真正的原因可能来自程序本身,也可能来自所依赖的第三方程序。这就意味着开发人员可能需要检查不同服务器上不同应用程序的日志来确定真正的原因。

日志聚合的作用就在于可以把来自不同服务器上不同应用程序产生的日志聚合起来,存放在单一的服务器上,方便进行搜索和分析。在日志聚合方面,已经有不少成熟的开源软件可以很好的满足需求。本文中要介绍的是 logstash,一个流行的事件和日志管理开源软件。logstash 采用了一种简单的处理模式:输入 -> 过滤器 -> 输出。logstash 可以作为代理程序安装到每台需要收集日志的机器上。logstash 提供了非常多的插件来处理不同类型的数据输入。典型的包括控制台、文件和 syslog 等;对于输入的数据,可以使用过滤器来进行处理。典型的处理方式是把日志消息转换成结构化的字段;过滤之后的结果可以被输出到不同的目的地,比如 ElasticSearch、文件、电子邮件和数据库等。

Logstash 在使用起来很简单。从官方网站下载 jar 包并运行即可。在运行时需要指定一个配置文件。配置文件中定义了输入、过滤器和输出的相关配置。清单 9 给出了一个简单的 logstash 配置文件的示例。

清单 9. logstash 配置文件示例
 input { 
  file { 
    path => [ "/var/log/*.log", "/var/log/messages", "/var/log/syslog" ] 
    type => 'syslog'
  } 
 } 

 output { 
  stdout { 
 debug => true 
 debug_format => "json" 
  } 
 }

清单 9 中定义了 logstash 收集日志时的输入(input)和输出(output)的相关配置。输入类型是文件(file)。每种类型输入都有相应的配置。对于文件来说,需要配置的是文件的路径。对每种类型的输入,都需要指定一个类型(type)。该类型用来区分来自不同输入的记录。代码中使用的输出是控制台。配置文件完成之后,通过“java -jar logstash-1.1.13-flatjar.jar agent -f logstash-simple.conf”就可以启动 logstash。

 

 

 

 

分享到:
评论

相关推荐

    C# 高效线程安全,解决多线程写txt日志类

    在C#编程中,线程安全是多线程应用程序中至关重要的一个方面,尤其是在处理共享资源如文本日志文件时。本主题将深入探讨如何在C#中创建一个高效的线程安全日志类,用于在多线程环境中安全地写入txt日志。 首先,...

    Android-可保持线程日志统一输出多线程不混乱

    通常,Android的日志系统(Logcat)会按照接收到日志消息的时间顺序进行输出,这在多线程并发情况下可能导致日志混淆。为了解决这个问题,开发者可以采用以下策略: 1. **线程标识**:在日志输出时,添加线程ID或者...

    多线程日志记录源码

    在IT行业中,多线程日志记录是一项至关重要的任务,特别是在大型系统或高并发环境中,确保日志的正确性和线程安全性是系统稳定运行的基础。本文将深入探讨使用VC++实现多线程日志记录的源码,以及如何保证线程安全。...

    多线程调试日志记录类

    在实际使用这个"多线程调试日志记录类"时,开发者需要理解如何配置日志级别、如何在代码中正确调用日志函数、如何处理多线程同步问题,以及如何利用提供的测试类进行验证。同时,为了保证性能和可扩展性,可能还需要...

    C#封装的日志类库源码 支持多线程,多窗口同步显示 含例程 实际工程中使用

    在C#编程环境下,一个高效、可靠的日志类库尤为重要,尤其是当它支持多线程和多窗口同步显示时。本文将深入探讨C#封装的日志类库源码的相关知识点,并提供实际工程中的应用示例。 首先,让我们理解什么是日志类库。...

    多线程的日志记录模块

    多线程的日志记录模块设计是为了在多线程环境下有效地管理和追踪应用程序的行为。在这个场景下,"DLL"(动态链接库)被用作共享代码和资源的机制,使得多个线程或进程可以同时访问和使用日志记录功能。 DLL是一种可...

    多线程定时并发类数据库操作日之类

    在IT领域,多线程、定时并发以及数据库操作是核心概念,特别是在开发高效、稳定的应用系统时。日志类则是追踪程序运行状态、排查问题的关键工具。以下将详细阐述这些知识点。 1. **多线程**:多线程是指在一个程序...

    基于TCP的多线程并发员工管理系统

    《基于TCP的多线程并发员工管理系统》 ...总的来说,基于TCP的多线程并发员工管理系统是一个集网络编程、多线程技术、数据库操作、权限控制和异常处理于一体的复杂系统,体现了IT领域的诸多核心技术和最佳实践。

    线程日志的实现代码 线程日志的实现代码

    线程日志是一种在多线程环境中记录程序运行情况的技术,它可以帮助开发者追踪各个线程的行为,定位并解决并发问题。在多线程编程中,由于多个线程可能同时访问和修改共享数据,因此可能会出现竞态条件、死锁等问题。...

    线程并发线程池

    在实际开发中,开发者可能还使用了一些调试工具,例如日志记录,以便追踪程序运行情况,以及异常处理机制,确保程序在遇到错误时能正常关闭,防止崩溃。 总的来说,这个项目展示了如何在MFC环境中实现高效的多线程...

    日志帮助类,支持多线程或异步写日志

    "日志帮助类,支持多线程或异步写日志"这个主题聚焦于一种特殊的设计模式,即日志助手类,它优化了日志记录过程,尤其适用于高并发或多线程环境。 一、日志帮助类的设计 1. **单例模式**:为了确保在应用中只有一个...

    多线程实例,可创建任意多线程

    理解和掌握多线程技术对于编写高效的并发程序至关重要,特别是在处理大量并发请求的服务器端编程或计算密集型任务时。通过学习和实践此类示例,开发者能够更好地应对现代计算环境中的复杂性和挑战。

    多线程时间记录logger类

    在IT领域,多线程时间记录logger类是一个关键的工具,尤其在开发高效并发系统时。这个logger类设计用于在多线程环境下记录程序运行的时间信息,帮助开发者追踪和优化性能。下面我们将深入探讨相关知识点。 1. **多...

    C++ 线程安全日志系统:设计、实现与优化全解析

    本文深入探讨在 C++ 中构建线程...为 C++ 开发者在构建高效、可靠且线程安全的日志系统方面提供全面而深入的参考,助力其在实际项目中更好地处理多线程环境下的日志记录需求,确保程序运行状态的有效监控与错误追踪。

    多线程SocketServer

    错误处理通常通过异常处理机制来实现,而日志记录则可以帮助开发者追踪服务器运行时的状态,分析性能瓶颈,以及在出现问题时快速定位故障点。 综上所述,“多线程SocketServer”项目涵盖了C++网络编程、多线程技术...

    武汉理工大学 面向对象与多线程综合实验 档案管理系统

    多线程技术在档案管理系统中至关重要,尤其是在处理并发请求时。当多个用户同时访问系统时,多线程允许系统同时执行多个任务,提高系统的吞吐量。例如,一个线程可以用于处理用户的登录请求,另一个线程则处理档案的...

    c++单例模式线程日志类

    在这个特定的场景中,我们讨论的是一个实现了单例模式的日志类,该类专为多线程环境设计,具备日志等级控制、精确的时间戳以及可变长参数和标准格式化输出的功能。 首先,让我们深入了解单例模式。单例模式的主要...

    多线程数据采集器源码

    多线程数据采集器在设计时需要考虑如何合理分配线程,避免过于频繁的请求导致IP被封禁,以及如何有效地存储和处理抓取到的数据。 源码分析: 1. **线程池管理**:为了有效控制和管理线程,源码可能会使用Java的`...

    多线程下载工具

    在计算机编程中,多线程是一种并发执行任务的方法,它允许多个任务(在这个场景下是文件下载)在同一时间片内并行运行,从而提高了整体效率。尤其在网络下载这种I/O密集型的任务中,多线程可以更充分地利用网络带宽...

    多线程数据采集器源码(C# )

    - 日志记录:用于追踪和调试多线程程序的行为。 五、优化策略 - 负载均衡:根据服务器性能和任务量动态调整线程数量,避免过度负载。 - 异常恢复:当某个线程出错时,可以设计机制让其他线程继续工作或重新尝试。 -...

Global site tag (gtag.js) - Google Analytics