`

Sentry——日志分析与处理平台

阅读更多

面临的问题

程序运行的日志是一个必不可少的东西,可能是一些系统信息,比如gc的情况;可能是一些正常的模块处理信息,比如最近更新的配置;还可能是一些在程序运行中,我们不希望出现的错误所带来的信息。通过日志,可以知道我们的程序是不是在正常地运行,看到错误日志,我们还需要利用日志排查错误。

我们知道日志如此重要,并乐于记录日志,然而在发现并解决问题的过程中,日志并没有想象中的高效率。

1. 文件过于分散

一般会将不同模块的日志以文件的形式分开保存。即使是将日志写在统一的目录下,不管是系统正常运行还是出现问题的时候都可能需要检查多个日志。

2. 内容过于繁杂

不太同于代码崇尚简洁,特别是遇到问题的时候,日志更是越详细越好,巴不得日志能记录下所有上下文信息和关联的代码。但是在查看日志的时候却往往不得不反复前后翻看错误的关联日志信息,同时还要略过大量无关信息,还没开始解决问题脑细胞就死了好多。

3. 解决问题的被动性

很可能在程序刚开始运行起来的时候,我们会检查一下情况,看看日志是否正常。但是更多的时候我们根本不会想去看那些冗长的日志。过了一段时间,突然有人告诉我们问题出现了,便又怀着沉重的心情慌张地检查日志开始排查错误。

如何解决

考虑传统的解决方案,规定好统一的日志格式,将所有模块的日志进行适配之后统一管理起来,并建立相应的日志分类与报表,在检查到问题的时候通过邮件的形式通知运维。这样的解决方案对于小公司来说,需要的时间和技术成本还是很大的,真正能提高日志利用的效率,还需要很长的规划与不断的总结。

而我们这样的小公司就中意这样的简单粗暴的方案:1个小时搭建整个平台、日志汇集,聚合,主动报警,漂亮的界面,都有了——Sentry

那么Sentry到底如何帮助我们有效利用日志发现并解决程序问题的呢。

Sentry初试

Server的安装教程官网已经非常详细了,如果不要求HA,只需要额外确定依赖的redis和postgresql安装好了就行。

支持多种语言与框架的客户端

Sentry不但有多种语言的客户端,还直接支持大量的日志框架,比如java的log4j,logback。这就意味着我们之前的代码几乎可以不用做任何修改,而仅仅加一点配置即可。

官方saas

如果想要快速欣赏一下Sentry的芳容,可以现在就尝试一下官方的saas(当然它是免费的):

Sentry团队很贴心地让你可以快速建立一个自己的demo尝试它的运用。

简单的使用示例

拿官方的saas快速认识Sentry:

注册好你的账户后,会有提示帮助你建立好自己的项目,并选择想要使用的客户端平台或框架(这里以logback为例):

(usage那里需要打马赛克)

到这里为止,我们就差一步就可以看到效果了:添加一个依赖和一个logback的appender到你的项目配置里,其他的代码可以一点不变,记日志还是熟悉的配方。

配置好依赖和appender,运行一些写入日志的代码后,你就会收到两方面的反馈:

1. 面板上出现待解决的issues:

2. 收到新issues的邮件:

怎么样,对Sentry已经有了一个直观的感受了吧。

Sentry如何解决问题

我们使用Sentry就是为了解决日志利用的低效率问题,那么Sentry是怎么帮助我们解决的呢。答案就在几个重要的概念中,当然Sentry有详尽的官方使用说明和文档。

dsn(data source name):

示例中是加在appender中的标签。这个就是Sentry的实际连接地址,Sentry通过这个来知道到底将日志发送到哪里。

issues&events:

从上面的图可以发现有3个error标记的issue标签,实际上代码里面发送了5条error的日志。这是Sentry很重要的一点:我们需要看的不是单单一条日志,而是一类日志。一些聚集的日志才能尽可能地反映整个错误的情况,即一个issue,而这些有关联的日志在Sentry这边就转化为这个issue的关联的events。回想一下我们通过日志文件来排查错误的时候,是不是就是自己耐心地运用肉眼过滤掉一系列无关的日志,然后大脑中聚合好这些有关联的日志,尽可能全面地了解一个错误呢。除了帮我们省掉这些事情,Sentry提供了更丰富的数据来充实这些events,点击一个issue,便会进入这个issue的详细信息:

不仅可以看到我们主动加上的message,stacktrace,Sentry还帮我们加上了一些额外的tags(我们也需要自己去定义一些有用的tags),尽可能多的展现一个issue发生前的状况。另外一个亮点在右边,展示了这个issue的一些统计信息。

Sampling

Sentry不是为了日志存储,也不会将所有日志都记录下来(毕竟使用关系型数据库作为持久化存储)。每个发送到Sentry的日志都是一个提供issue信息的事件(event),而每个项目发送到Sentry的事件都有一个数量上限,一旦超过这个上限Sentry就会忽略掉重复的内容。Sentry是我们所有日志的一个关于错误,问题的分析子集。体现在界面上的events信息,也是Sentry聚合之后的样本。

聚合策略

Sentry按照策略将日志事件进行聚合,从而提供一个issue的events。这么做就是为了智能地帮助我们组合关联的日志信息,减少人工的日志信息的提取工作量,关注一个issue首先关注这些聚合的事件。

但是这个策略分组并不会那么智能,Sentry主要按照以下几个方面,优先级从高到低进行日志事件的聚合:

1. Stacktrace
2. Exception
3. Template
4. Messages

要注意的是,如果日志记录比较随意,聚合的效果可能不尽如人意。例如:两个无关的事件但是stacktrace相同,那么Sentry会将它们分到同一个issue下。

alerts digest & limit

默认Sentry的alerts会发送邮件(你也可以推送slack!)。当一个issue产生或者一组issue产生时,项目相关的成员都会受到邮件。但是并不是每次issue有更新就会产生alert。考虑到用户也不希望被一箩筐的报警邮件给轰炸,因为过多相当于没有,Sentry除了对重复的报警进行抑制,还会追加一段时间内更新issue的摘要(digest)到下一个报警,这样,用户邮件上接收到的信息会充分压缩,不用苦恼于过多的邮件。另外,每个用户可以根据自己的喜好自行配置报警的时间间隔。

总结

Sentry还有有很多亮点,比如敏感信息过滤,release版本跟踪,关键字查找,受影响用户统计,权限管理等(部分可能需要我们通过代码提供内容)可以通过Sentry进行问题分配与跟踪。Sentry的plugin模块还可以集成大量的第三方工具如:slack,jira。

对我们来说最大的便利就是利用日志进行错误发现和排查的效率变高了。

1. 及时提醒

报警的及时性:不需要自己再去额外集成报警系统,一旦产生了issue便以邮件通知到项目组的每个成员。

2. 问题关联信息的聚合

每个问题不仅有一个整体直观的描绘,聚合的日志信息省略了人工从海量日志中寻找线索,免除大量无关信息的干扰。

3. 丰富的上下文

Sentry不仅丰富还规范了上下文的内容,也让我们意识到更多的有效内容,提高日志的质量。

最后,完全依赖Sentry?

虽然Sentry让我们在使用日志上的效率提高了,但是有几点还是需要注意。

1. 不是日志的替代

Sentry的目的是为了让我们专注于系统与程序的异常信息,目的是提高排查问题的效率,日志事件的量到达一个限制时甚至丢弃一些内容。官方也提倡正确设置Sentry接收的日志level的同时,用户也能继续旧的日志备份(用logback的同学仅仅是保留自己以前的appender就好)。

2. 不是排查错误的万能工具

Sentry是带有一定策略的问题分析工具,以样本的形式展示部分原始日志的信息。信息不全面的同时,使用过程中也可能出现Sentry聚合所带来的负面影响,特别是日志记录质量不够的情况下。

3. 不是传统监控的替代品

与传统的监控系统相比,Sentry更依赖于发出的日志报告,而另外一些隐藏的逻辑问题或者业务问题很可能是不会得到反馈的。

分享到:
评论

相关推荐

    PyPI 官网下载 | sentry-sdk-0.7.14.tar.gz

    《PyPI官网下载 | sentry-sdk-0.7.14.tar.gz——Python库的管理和使用详解》 PyPI(Python Package Index),是Python开发者最重要的资源库,它提供了丰富的Python库,供全球开发者免费下载和使用。在PyPI中,我们...

    前端监控方案sentry整体概览

    本文旨在介绍一种广泛使用的前端监控工具——Sentry,并提供详细的部署与配置指南,帮助开发者更好地理解和使用Sentry。 ##### 名词定义 - **Sentry**:一个开源的错误跟踪系统,能够自动检测并报告应用程序中的...

    PyPI 官网下载 | sentry-plugins-8.10.0.tar.gz

    Sentry的核心功能包括事件日志记录、错误分类、错误率统计、堆栈跟踪以及用户反馈收集等。 "plugins"一词在这里指的是扩展或增强Sentry核心功能的组件。Sentry的插件体系结构允许开发者根据需求定制其功能,例如...

    Python库 | catcher-1.20.1-py3-none-any.whl

    《Python库Catcher详解——构建高效异常处理与日志系统》 在Python的开发世界里,库是开发者的重要工具,它们极大地丰富了Python的功能并提高了开发效率。今天我们要讨论的是一个名为"Catcher"的Python库,版本号为...

    Python库 | logwrap-8.0.1-cp38-cp38-manylinux1_x86_64.whl

    《Python库logwrap详解——打造高效日志处理》 在Python编程中,日志记录是一项不可或缺的功能,它有助于开发者跟踪程序运行状态、定位错误及调试。logwrap是Python社区中一个用于日志处理的库,它提供了一种简洁且...

    Laravel开发-laravel-uniexlogger

    - 作为Laravel的一个扩展,laravel-uniexlogger遵循了Laravel的插件化设计原则,易于与其他扩展或第三方服务集成,如Sentry、Loggly等错误追踪和日志分析平台。 7. **实际应用场景**: - laravel-uniexlogger特别...

    django-guid:在Django请求的每个日志消息中注入一个ID。 兼容ASGI,与Sentry集成,并与Celery合作

    与Sentry的集成使得开发者可以在日志中快速找到与特定请求相关的错误报告,增强了故障排查能力。同时,由于与Celery的集成,Django-GUID也能帮助开发者理解在异步任务中的请求流程,这对于大型、复杂的Web应用尤其...

    XamarinSentryApp:一个iOS + Android示例应用程序,演示了如何将Sentry的RavenClient与Xamarin一起使用

    9. **调试与测试**:在开发阶段,可以使用Sentry的沙箱模式或调整日志级别,以便在不干扰最终用户的情况下收集和分析数据。 10. **持续集成/持续部署(CI/CD)**:集成Sentry到CI/CD流程中,确保每个版本发布前都经过...

    Laravel开发-log

    为了实时监控日志,可以集成第三方服务,如Sentry或Loggly,它们可以提供实时警报和分析功能。 总的来说,理解和充分利用Laravel的日志系统,可以极大地提高开发效率,帮助定位和解决问题,确保应用程序的稳定运行...

    前端开源库-logfella

    它的设计目标是简化前端应用的日志记录,提供多种日志级别(如debug、info、warn、error等),支持自定义日志格式,并可以方便地与其他日志处理服务集成。通过使用logfella,开发者可以更有效地监控和分析前端应用的...

    Laravel开发-laravel-loggr

    1. **集中式日志管理**:loggr可能提供了将日志数据发送到集中式日志服务的能力,如Loggly或Sentry,这样可以在一个地方查看所有应用程序的日志,便于管理和分析。 2. **实时监控**:通过集成实时日志查看工具,...

    Laravel开发-lumen-request-logger .zip

    在本文中,我们将深入探讨Laravel的微服务框架——Lumen,以及如何在Lumen中实现请求日志记录。Lumen是Laravel的一个轻量级版本,专为构建API和微服务而设计,它提供了快速、高效且优雅的开发体验。在Lumen中集成...

    Python库 | raven_python-1.0.0-py3-none-any.whl

    5. Sentry集成:Raven的主要目标是与Sentry服务配合工作,Sentry是一个开源的错误跟踪系统,可实时监控并分析来自多个源的错误。 6. 客户端配置:通过简单的代码配置,可以设置服务器URL、项目ID和其他选项,以定制...

    raven-go-源码.rar

    在Go语言的生态系统中,`raven-go`是一个重要的错误报告库,它使得开发者能够轻松地集成Sentry服务,实现对应用程序运行时错误的追踪与分析。本文将详细解析`raven-go`的源码,带你深入理解其内部机制,帮助你更好地...

    CDH-HDP-MAPR-DKH-星环组件比较.pdf

    《CDH-HDP-MAPR-DKH-星环组件比较》文档主要对比分析了四大Hadoop发行版——Cloudera的CDH、Hortonworks的HDP、MapR及中国大快科技的DKH和星环科技的Transwarp在组件支持上的异同。以下是对这些组件的详细说明: 1....

    Mastering-Python-Scripting-for-System-Administrators--master.zip

    13. **日志和监控**:syslog、sentry等工具或库可以实现日志记录和错误监控,对系统状态进行实时跟踪。 14. **安全与加密**:Python的hashlib、cryptography库可用于数据校验和加密解密,保护系统安全。 15. **...

    Hadoop应用开发技术详解

    5. Hadoop应用案例:Hadoop广泛应用于日志分析、推荐系统、社交网络分析、搜索引擎索引构建等多个场景。通过学习实际案例,开发者可以更好地理解和应用Hadoop技术。 6. YARN资源管理:YARN(Yet Another Resource ...

    raven-log4j-3.1.zip

    标题 "raven-log4j-3.1.zip" 暗示了这是一个关于日志管理的开源项目,可能与Log4j的特定版本——3.1有关。Log4j是Java编程语言中广泛使用的日志记录框架,它允许开发者记录应用程序运行时的事件和调试信息。Raven...

    CrashReporter.rar

    《崩溃报告器——深入理解与应用》 在IT行业中,软件崩溃是无法完全避免的问题,尤其是在复杂的系统和应用程序中。当遇到这样的问题时,我们通常需要一种机制来收集和分析崩溃信息,以便找出问题的根源并进行修复。...

    HbaseReferenceBook-Hbase参考指南英文版

    它能够有效地处理各种实时读写的大数据操作,特别适合于需要快速访问大量数据的应用场景,例如日志处理、实时分析等。由于其良好的扩展性和出色的性能,HBase已经得到了众多公司的广泛使用,如Facebook、Yahoo!和...

Global site tag (gtag.js) - Google Analytics