`

kafka主题消费积压问题总结

阅读更多

 

故障描述:

12月6日下午运维反馈说,某个主题的一个分区消费积压,由于这个主题非常重要,且已经有用户投诉所以运维很紧张,紧急打印堆栈并Dump堆内存后,就重启了这台机器。

 

故障分析1:

消费这个主题的集群的业务逻辑相对比较简单,主要就是读取某些主题,然后逻辑判断+DB操作后,分流写入到另外某些主题。运维通过kafka监控平台找到积压的主题,发现主题的某个分区积压了几万消息后,找到了消费这个分区的应用程序结点。

 

故障分析2:

通过对结点堆栈信息分析并未看出什么问题,又通过MAT(Eclipse Memory Analyzer)打开堆Dump文件,通过积压主题名称找到所有和此主题相关的线程,发现这些消费线程中有一个线程运行到(堵塞在?)mysql查询的网络返回阶段。通过这个线程上下文信息看到了SQL语句,这个SQL语句是查询某个表且两个查询字段也已经建立了索引,没有道理因为这个SQL语句引起堵塞!难道这个SQL语句是个慢查询?

 

注:

此问题已经通知运维找DBA,确认下在那个时间段有没有SQL慢查询,下周看情况再总结相关信息。

 

 

 

 

 

分享到:
评论

相关推荐

    kafka_2.13.rar

    4. 监控与报警:实施全面的监控,如消息积压、消费延迟等,及时发现并解决问题。 五、实战案例 1. 日志收集:Kafka可以作为日志收集系统的一部分,收集来自各应用的日志,再由其他系统进行分析和存储。 2. 实时流...

    kafka-manager-1.3.4(已编译)

    例如,通过查看 broker 的状态和消费者的offset lag,可以判断是否由于数据积压导致的问题。 2. **性能调优**:通过监控各项指标,可以发现性能瓶颈,如分区不均匀、资源过度使用等,从而进行相应的配置调整。 3. ...

    Kafka总结.docx

    它的核心特性包括生产者-消费者模型、主题(topic)与分区(partition)设计、消费者组(consumer group)概念以及副本(replica)机制,确保高可用性和可扩展性。 1. **主题与分区**:Kafka 的数据组织基于主题,...

    12_总结一下消息队列相关问题的面试技巧.zip

    - 发布/订阅(Publish/Subscribe)模型:多个消费者可以订阅同一主题,发布到主题的消息会被所有订阅者消费,可能存在消息重复。 3. **消息的可靠性传输** - 消费确认(Acknowledge)机制:确保消息被正确处理后...

    大数据面试100题.pdf

    Kafka消息数据积压,Kafka消费能力不足怎么处理: 处理消息积压的常见方法包括增加分区数来提升消费能力、优化消费者逻辑、增加消费者实例、提高broker的硬件配置等。 Kafka单条日志传输大小: Kafka对单条消息大小...

    MQ消息队列

    在这种模式下,多个消费者可以订阅同一个主题,当生产者发布消息时,所有订阅该主题的消费者都会收到消息。这种方式适用于广播消息或者需要一对多通信的场景。 2.2 点对点模式 点对点模式中,每个消息只有一个消费...

    电商异步消息系统的实践

    以下是对这一主题的详细探讨: 一、异步消息系统概念 异步消息系统是一种通信模式,其中生产者将消息发送到一个中间队列(如消息队列或消息代理),然后由消费者在适合的时间从队列中取出并处理这些消息。这种方式...

    实时流式数据导出方法.pptx

    - **实时数据流**:通过Kafka主题进行传递,支持多个消费者同时访问。 - **数据过滤**:消费者可以根据特定的标准过滤数据,只接收相关的数据流。 - **可扩展性与高可用性**:随着数据流量的增加,可以动态添加更多...

Global site tag (gtag.js) - Google Analytics