`
m635674608
  • 浏览: 5028962 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

分布式系统日志跟踪

 
阅读更多
分布式系统为什么需要 Tracing?
  先介绍一个概念:分布式跟踪,或分布式追踪
  电商平台由数以百计的分布式服务构成,每一个请求路由过来后,会经过多个业务系统并留下足迹,并产生对各种Cache或DB的访问,但是这些分散的数据对于问题排查,或是流程优化都帮助有限。对于这么一个跨进程/跨线程的场景,汇总收集并分析海量日志就显得尤为重要。要能做到追踪每个请求的完整调用链路,收集调用链路上每个服务的性能数据,计算性能数据和比对性能指标(SLA),甚至在更远的未来能够再反馈到服务治理中,那么这就是分布式跟踪的目标了。在业界,twitter 的 zipkin 和淘宝的鹰眼就是类似的系统,它们都起源于 Google Dapper 论文,就像历史上 Hadoop 发源于 Google Map/Reduce 论文,HBase 源自 Google BigTable 论文一样。
  好了,整理一下,Google叫Dapper,淘宝叫鹰眼,Twitter叫ZipKin,京东商城叫Hydra,eBay叫Centralized Activity Logging (CAL),大众点评网叫CAT,我们叫Tracing。
  这样的系统通常有几个设计目标:
(1)低侵入性——作为非业务组件,应当尽可能少侵入或者无侵入其他业务系统,对于使用方透明,减少开发人员的负担;
(2)灵活的应用策略——可以(最好随时)决定所收集数据的范围和粒度;
(3)时效性——从数据的收集和产生,到数据计算和处理,再到最终展现,都要求尽可能快;
(4)决策支持——这些数据是否能在决策支持层面发挥作用,特别是从 DevOps 的角度;
(5)可视化才是王道。
 
先来一个直观感受:
  下面依次展示了 ZipKin、鹰眼、窝窝的调用链绘制界面。
图1 twitter zipkin 调用链
图2 淘宝鹰眼的调用链
图3 京东商城hydra调用链
图4 窝窝tracing调用链
 
  鼠标移动到调用链的每一层点击,可以看到执行时长、宿主机IP、数据库操作、传入参数甚至错误堆栈等等具体信息。
 

淘宝如何实现的:
  同一次请求的所有相关调用的情况,在淘宝 EagleEye 里称作 调用链。同一个时刻某一台服务器并行发起的网络调用有很多,怎么识别这个调用是属于哪个调用链的呢?可以在各个发起网络调用的中间件上下手。

  在前端请求到达服务器时,应用容器在执行实际业务处理之前,会先执行 EagleEye 的埋点逻辑(类似 Filter 的机制),埋点逻辑为这个前端请求分配一个全局唯一的调用链ID。这个ID在 EagleEye 里面被称为 TraceId,埋点逻辑把 TraceId 放在一个调用上下文对象里面,而调用上下文对象会存储在 ThreadLocal 里面。调用上下文里还有一个ID非常重要,在 EagleEye 里面被称作 RpcId。RpcId 用于区分同一个调用链下的多个网络调用的发生顺序和嵌套层次关系对于前端收到请求,生成的 RpcId 固定都是0

  当这个前端执行业务处理需要发起 RPC 调用时,淘宝的 RPC 调用客户端 HSF 会首先从当前线程 ThreadLocal 上面获取之前 EagleEye 设置的调用上下文。然后,把 RpcId 递增一个序号。在 EagleEye 里使用多级序号来表示 RpcId,比如前端刚接到请求之后的 RpcId 是0,那么 它第一次调用 RPC 服务A时,会把 RpcId 改成 0.1。之后,调用上下文会作为附件随这次请求一起发送到远程的 HSF 服务器。

  HSF 服务端收到这个请求之后,会从请求附件里取出调用上下文,并放到当前线程 ThreadLocal 上面。如果服务A在处理时,需要调用另一个服务,这个时候它会重复之前提到的操作,唯一的差别就是 RpcId 会先改成 0.1.1 再传过去。服务A的逻辑全部处理完毕之后,HSF 在返回响应对象之前,会把这次调用情况以及 TraceId、RpcId 都打印到它的访问日志之中,同时,会从 ThreadLocal 清理掉调用上下文。如图6-1展示了一个浏览器请求可能触发的系统间调用。

图6-1-一个浏览器请求可能触发的系统间调用

  图6-1描述了 EagleEye 在一个非常简单的分布式调用场景里做的事情,就是为每次调用分配 TraceId、RpcId,放在 ThreadLocal 的调用上下文上面,调用结束的时候,把 TraceId、RpcId 打印到访问日志。类似的其他网络调用中间件的调用过程也都比较类似,这里不再赘述了。访问日志里面,一般会记录调用时间、远端IP地址、结果状态码、调用耗时之类,也会记录与这次调用类型相关的一些信息,如URL、服 务名、消息topic等。很多调用场景会比上面说的完全同步的调用更为复杂,比如会遇到异步、单向、广播、并发、批处理等等,这时候需要妥善处理好 ThreadLocal 上的调用上下文,避免调用上下文混乱和无法正确释放。另外,采用多级序号的 RpcId 设计方案会比单级序号递增更容易准确还原当时的调用情况。

  最后,EagleEye 分析系统把调用链相关的所有访问日志都收集上来,按 TraceId 汇总在一起之后,就可以准确还原调用当时的情况了。

图6-2-一个典型的调用链

  如图6-2所示,就是采集自淘宝线上环境的某一条实际调用链。调用链通过树形展现了调用情况。调用链可以清晰地看到当前请求的调用情况,帮助问题定 位。如上图,mtop应用发生错误时,在调用链上可以直接看出这是因为第四层的一个(tair@1)请求导致网络超时,使最上层页面出现超时问题。这种调用链,可以在 EagleEye 系统监测到包含异常的访问日志后,把当前的错误与整个调用链关联起来。问题排查人员在发现入口错误量上涨或耗时上升时,通过  EagleEye 查找出这种包含错误的调用链采样,提高故障定位速度。

调用链数据在容量规划和稳定性方面的分析

  如果对同一个前端入口的多条调用链做汇总统计,也就是说,把这个入口URL下面的所有调用按照调用链的树形结构全部叠加在一起,就可以得到一个新的树结构(如图6-3所示)。这就是入口下面的所有依赖的调用路径情况。

图6-3-对某个入口的调用链做统计之后得到的依赖分析

  这种分析能力对于复杂的分布式环境的调用关系梳理尤为重要。传统的调用统计日志是按固定时间窗口预先做了统计的日志,上面缺少了链路细节导致没办法对超过两层以上的调用情况进行分析。例如,后端数据库就无法评估数据库访问是来源于最上层的哪些入口;每个前端系统也无法清楚确定当前入口由于双十一活动流量翻倍,会对后端哪些系统造成多大的压力,需要分别准备多少机器。有了 EagleEye 的数据,这些问题就迎刃而解了。
  下图6-4展示了数据流转过程。
图6-4 鹰眼的数据收集和存储
 
京东如何实现的: 
  京东商城引入了阿里开源的服务治理中间件 Dubbo,所以它的分布式跟踪 Hydra 基于 Dubbo 就能做到对业务系统几乎无侵入了。
  Hydra 的领域模型如下图7所示:
图7 hydra 领域模型以及解释
  hydra 数据存储是 HBase,如下图8所示:
图8 hydra 架构
 
窝窝如何实现的: 
  2012年,逐渐看到自建分布式跟踪系统的重要性,但随即意识到如果没有对 RPC 调用框架做统一封装,就可能侵入到每一个业务工程里去写埋点日志,于是推广 Dubbo 也提上日程。2013年,确定系统建设目标,开始动手。由于 tracing 跟 DevOps 息息相关,所以数据聚合、存储、分析和展示由运维部向荣牵头开发,各个业务工程数据埋点和上报由研发部国玺负责。
  经过后续向荣、刘卓、国玺、明斌等人的不断改进,技术选型大致如下所示。
  • 埋点
    • 实现线程内 trace 上下文传递,即服务器内部的方法互调时不需要强制在方法形参中加 Message 参数;
    • 实现 trace 埋点逻辑自动织入功能,即业务开发人员不需要在方法中打印 trace 日志,只需要给该方法加注解标识 ;
    • 原理:
      • 利用 Javaagent 机制,执行 main 方法之前,会先执行 premain 方法,在该方法中将字节码转换器载入 instrumentation,而后 jvm 在加载 class 文件之前都会先执行字节码转换器。
      • 字节码转换器中的逻辑为,识别出注解 trace 的类及方法,并修改该方法字节码,织入埋点逻辑。进入方法时会初始 trace 上下文信息,并存储在线程的 threadLocals 中,退出方法会打印 trace 日志并清空该方法的上下文。
  • 数据聚合
    • 应用层 trace 日志通过 flume agents 实时发送至 flume collector;
  • 数据存储
    • 服务端分别通过 hdfs-sink 和 hbase-sink,实时录入至 hbase、hdfs;
    • hdfs 有 tmp 临时文件存放实时聚合过来的数据,每5分钟生成一个 done 文件;
  • 数据分析和统计
    • load 程序每 4 分钟检查 done 文件并存放至 hive 表 hkymessage 指定分区;
    • 分析程序每5分钟执行一次, 将生成统计数据入库, 结果集数据如下:
      数据格式:{5个分层的5个响应时段请求个数合集}   {5个分层5-10s和大于10s散点数据合集}  当前5分钟最后一次请求rootid  统计时间
  • 数据展示
    • 基于 Python 的 Django
基于这些数据分析和统计,我们就能绘制性能曲线图,从中可以发现哪些时间点哪些层有性能问题,然后一路点进去,直到找到到底是哪一个调用链里的哪一个环节慢。
 
图9 性能曲线默认图形
  
  还可以从每一次调用结果分析出各层的异常曲线,并按照 memcached/redis/mongodb/mysql/runtime/fail 分类查看。
 
图10 异常曲线默认图形
  
  还可以进一步统计各个业务工程的访问量、访问质量和平均访问时长,并于历史同期对比,从而快速理解系统服务质量。
 
  如上所述,窝窝的 Tracing(鹰眼) 系统目前已投入使用,归并在 OAP(运维自动化平台)里。
 
-over-
分享到:
评论

相关推荐

    SOFATracer是一个用于分布式系统调用跟踪的组件

    SOFATracer 是一个用于分布式系统调用跟踪的组件,通过统一的 traceId 将调用链路中的各种网络调用情况以日志的方式记录下来,以达到透视化网络调用的目的。这些日志可用于故障的快速发现,服务治理等。

    Dapper,大规模分布式系统的跟踪系统 by bigbully1

    【Dapper:大规模分布式系统的跟踪系统】 Dapper是Google为了解决大规模分布式系统中的性能分析和问题定位问题而设计的一款高效、低损耗的跟踪系统。它致力于在不影响系统整体性能的前提下,提供对分布式操作的全面...

    基于Java语言的分布式系统调用跟踪组件SOFATracer设计源码

    SOFATracer是一个采用Java语言开发的分布式系统调用跟踪组件,包含639个Java源文件、32个XML配置文件、23个属性文件等共计717个文件。它通过统一的traceId记录网络调用情况,实现调用链路的日志记录,便于透视化网络...

    分布式系统设计 分布式系统设计

    分布式系统设计是现代互联网服务和企业级应用的核心技术之一,它涉及到多个计算机节点通过网络进行协同工作,共同处理任务和数据。在这个领域,我们需要深入理解并掌握一系列关键知识点,以构建高效、可扩展且容错的...

    详解spring cloud分布式日志链路跟踪

    分布式日志链路跟踪是微服务架构中的一个重要功能,它可以帮助开发人员和运维人员快速定位和诊断服务调用中出现...随着分布式系统的广泛使用,对分布式日志链路跟踪的理解和应用,已成为IT行业技术人员的必备技能之一。

    dubbo分布式应用日志追踪

    由于服务间的调用链路复杂,传统的单体应用中的日志跟踪方式无法满足需求。"dubbo分布式应用日志追踪"这个主题正是针对这一挑战提出的解决方案。 首先,我们需要理解Dubbo。Dubbo是一个高性能、轻量级的开源Java ...

    Tracer在分布式系统中的调用跟踪和日志相关

    在分布式系统中,Tracer是一种关键的工具,用于收集、分析和可视化服务之间的调用流程。这个工具的主要目的是为了提高系统的可观察性,使开发者能够理解应用程序如何在复杂的分布式环境中运行,快速定位问题并优化...

    微服务架构在分布式系统的设计和应用.pdf

    4. 分布式跟踪和日志:为了便于监控和故障诊断,微服务需要集成分布式跟踪系统和集中式日志管理。 5. 配置管理:随着服务数量和部署环境的增加,需要一个集中化的方式来管理配置信息。 6. 服务的分布式事务处理:在...

    分布式I/O日志收集系统的设计与实现

    在实现过程中,可能涉及的技术包括网络通信、分布式系统中的同步与并发控制、日志数据的压缩和存储技术、安全性保障措施等。文章可能会探讨这些关键技术如何在分布式I/O日志收集系统中得到应用。 7. 系统的应用场景...

    09Spring Cloud Sleuth:分布式请求链路跟踪1

    Spring Cloud Sleuth 是一种分布式系统中跟踪服务间调用的工具,它可以直观地展示出一次请求的调用过程。在大型分布式系统中,服务之间的调用关系非常复杂,使用 Spring Cloud Sleuth 可以帮助我们理清请求调用的...

    sofa-tracer:SOFATracer是分布式系统调用跟踪的组件。 并通过统一的traceId在调用链接中记录各种网络调用的日志。 这些日志可用于快速发现故障,服务管理等

    SOFATracer 是一个用于分布式系统调用跟踪的组件,通过统一的 traceId 将调用链路中的各种网络调用情况以日志的方式记录下来,以达到透视化网络调用的目的。这些日志可用于故障的快速发现,服务治理等。 一、背景 在...

    分布式系统服务链追踪与监控.pdf

    分布式系统服务链追踪与监控 分布式系统服务链追踪与监控是近年来随着云计算和分布式架构的发展而产生的一个重要技术领域。分布式系统由分布在不同节点上、通过网络相互通信和服务调用的组件构成。由于其分布式特性...

    基于事件处理的分布式系统故障定位技术.pdf

    在分布式系统中,事件处理技术可用于分析分布式系统的日志信息、状态变化等,是实现故障诊断和定位的重要技术手段。 文章指出,当前大多数复杂事件描述语言都是基于SQL的方法来描述复杂事件。这种数据流查询语言对...

    分布式实时监控系统

    1. 全链路跟踪:分布式系统中,一次用户请求可能会经过多个服务节点。全链路跟踪是指监控系统能够追踪从请求发起直到最终响应的完整链路。这需要在每个服务节点上收集跟踪标识符和时间戳,并将这些信息串联起来形成...

    分布式系统测试方法及应用实践研究.pdf

    例如,可以采用模拟器或实际的分布式环境进行测试,同时需要有适当的监控和日志记录机制来跟踪测试过程和结果,以确保测试的准确性和可靠性。 文章中提到的参考文献ISSN1009-3044,即电脑知识与技术Vol.14, No.07, ...

    基于Dubbo埋点的分布式调用跟踪系统.zip

    标题中的“基于Dubbo埋点的分布式调用跟踪系统”是指一种使用Apache Dubbo作为服务治理框架,并通过在服务调用中添加埋点来实现分布式系统中调用链路的追踪的技术方案。这样的系统通常用于优化微服务架构下的性能...

    google的dapper-2010-1论文

    Dapper的核心目标是解决分布式系统中的"跟踪问题",即如何在一个由众多相互依赖的服务组成的复杂环境中,追踪单个请求从源头到终点的完整路径。在微服务架构中,这种追踪能力对于故障排查、性能优化以及理解系统行为...

    分布式会话跟踪系统架构设计与实践.e99ce020-3781-11e6-9c51-9d4070b3fefa.pdf

    在分布式系统中,会话跟踪主要是指在一个用户的连续访问中,系统能够识别出这是同一个用户发起的连续操作。由于分布式系统通常由多个服务器节点组成,这些节点可能分布在不同的地理位置,因此实现有效的会话跟踪具有...

    分布式系统的经济模型和算法 Economic.Models.and.Algorithms.for.Distributed.Systems

    - **监控与日志**:讨论了如何通过监控和日志记录来跟踪系统的运行状态,及时发现并解决问题。 - **资源调度**:研究了如何根据当前的资源使用情况动态地调度资源,以达到最优的性能表现。 - **安全策略**:分析了在...

    大型应用系统架构设计 淘宝分布式调用跟踪系统介绍 共60页.pptx

    【大型应用系统架构设计——淘宝分布式调用跟踪系统】\n\n在当今的互联网环境中,大型...在大型应用系统的维护和优化中,类似鹰眼这样的工具显得尤为重要,它们可以帮助开发者快速理解和解决分布式系统中的各种问题。

Global site tag (gtag.js) - Google Analytics