总结一下运营kafka平台过程中遇到的问题。
网络限制
新扩容的机器在由于其他原因导致在交换机上做了流量限制,出只能达到300+Mb,这个问题很隐蔽,不容易被发现。解决方式也很容易直接去掉限流即可。
Zookeeper连接上限
基于kafka客户端做了一层包装,某些版本上有bug会导致zookeeper连接有泄漏,很容易就超过一个ip Max60个连接的限制,最终导致访问zookeeper失败。
a01.zookeeper.kafka.javagc 60 192.168.200.36 60 192.168.200.193 60 192.168.200.19 59 192.168.200.35 59 192.168.200.194
ConsumerRebalanceFailedException
consumer rebalancing fails (you will see ConsumerRebalanceFailedException): This is due to conflicts when two consumers are trying to own the same topic partition. The log will show you what caused the conflict (search for "conflict in ").
If your consumer subscribes to many topics and your ZK server is busy, this could be caused by consumers not having enough time to see a consistent view of all consumers in the same group. If this is the case, try Increasing rebalance.max.retries and rebalance.backoff.ms.
Another reason could be that one of the consumers is hard killed. Other consumers during rebalancing won't realize that consumer is gone after zookeeper.session.timeout.ms time. In the case, make sure that rebalance.max.retries * rebalance.backoff.ms > zookeeper.session.timeout.ms.
If your consumer subscribes to many topics and your ZK server is busy, this could be caused by consumers not having enough time to see a consistent view of all consumers in the same group. If this is the case, try Increasing rebalance.max.retries and rebalance.backoff.ms.
Another reason could be that one of the consumers is hard killed. Other consumers during rebalancing won't realize that consumer is gone after zookeeper.session.timeout.ms time. In the case, make sure that rebalance.max.retries * rebalance.backoff.ms > zookeeper.session.timeout.ms.
https://cwiki.apache.org/confluence/display/KAFKA/FAQ#FAQ-Myconsumerseemstohavestopped,why?>
问题分析:http://blog.csdn.net/lizhitao/article/details/49589825
kafka 0.9以前的consumer client的设计不太好,建议升级至0.9+版本,这部分重新设计了。
Consumer Client Re-Design
https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Client+Re-Design
NotLeaderForPartitionException
kafka.common.NotLeaderForPartitionException: null at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) ~[na:1.7.0_76] at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:57) ~[na:1.7.0_76] at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) ~[na:1.7.0_76] at java.lang.reflect.Constructor.newInstance(Constructor.java:526) ~[na:1.7.0_76] at java.lang.Class.newInstance(Class.java:379) ~[na:1.7.0_76] at kafka.common.ErrorMapping$.exceptionFor(ErrorMapping.scala:70) ~[stormjar.jar:na] at kafka.server.AbstractFetcherThread$$anonfun$processFetchRequest$4$$anonfun$apply$5.apply(AbstractFetcherThread.scala:157) ~[stormjar.jar:na] at kafka.server.AbstractFetcherThread$$anonfun$processFetchRequest$4$$anonfun$apply$5.apply(AbstractFetcherThread.scala:157) ~[stormjar.jar:na] at kafka.utils.Logging$class.warn(Logging.scala:88) [stormjar.jar:na] at kafka.utils.ShutdownableThread.warn(ShutdownableThread.scala:23) [stormjar.jar:na] at kafka.server.AbstractFetcherThread$$anonfun$processFetchRequest$4.apply(AbstractFetcherThread.scala:156) [stormjar.jar:na] at kafka.server.AbstractFetcherThread$$anonfun$processFetchRequest$4.apply(AbstractFetcherThread.scala:112) [stormjar.jar:na] at scala.collection.immutable.Map$Map1.foreach(Map.scala:105) [stormjar.jar:na] at kafka.server.AbstractFetcherThread.processFetchRequest(AbstractFetcherThread.scala:112) [stormjar.jar:na] at kafka.server.AbstractFetcherThread.doWork(AbstractFetcherThread.scala:88) [stormjar.jar:na] at kafka.utils.ShutdownableThread.run(ShutdownableThread.scala:51) [stormjar.jar:na]
kafka Server挂起,需要检查log.dirs参数中配置的所有路径,磁盘损坏的情况会发生这种情况。
阶段性网络中断
一台kafka机器2个小时一个周期,会有2分钟中断通讯,导致Leader切换。排查不到原因,很可能是交换机或其他设备做了限制,直接下线解决。
相关推荐
《Kafka个人学习总结(一)》 在深入探讨Kafka之前,让我们先明确一下,Kafka是一款由LinkedIn开发,并随后贡献给Apache基金会的开源分布式流处理平台。它被广泛用于构建实时数据管道和流应用,能高效地处理大规模...
总结,Apache Kafka 2.8.2是大数据时代的关键组件,其强大的分布式流处理能力、可靠的存储机制以及丰富的API使得它在日志处理、数据整合、实时分析等领域有着广泛的应用。理解并掌握Kafka的特性和使用技巧,对于构建...
总结,Kafkatool 2.0.9 作为一款强大的 Kafka 管理工具,以其跨平台兼容性和丰富的功能,极大地简化了 Kafka 的日常管理和维护工作,是 Kafka 用户不可或缺的得力助手。无论是新手还是经验丰富的管理员,都能从中...
Kafka 是一个分布式流处理平台,由 Apache 软件基金会开发,广泛应用于大数据实时处理、日志收集、消息系统等多个领域。`kafka_2.12-2.5.1` 是 Kafka 的一个特定版本,针对 Scala 2.12 编译,并且是版本号为 2.5.1 ...
Kafka是一种分布式流处理平台,由LinkedIn开发并贡献给了Apache软件基金会。它最初设计用于构建实时数据管道和流应用,能够处理大规模的实时数据。Kafka的主要特性包括高吞吐量、持久化、容错性和灵活性。在华为...
Kafka Streams的出现,为Kafka平台带来了强大的实时计算能力,使得开发者可以在数据流进Kafka之后,对其进行过滤、聚合、连接等操作,并且可以无缝地与其他Kafka组件配合使用。 实时应用和微服务是当前企业级应用...
Kafka 的核心设计理念是为实时数据处理提供一个统一的平台。 ### Kafka 的基本概念 #### Kafka 的架构 - **Broker**:Kafka 集群中的每一个服务器实例被称为 Broker。 - **Topic**:消息分类存储的逻辑单元。 - *...
Kafka是一种分布式流处理平台,广泛应用于大数据实时处理、日志收集、消息系统等领域。这份详尽的PDF文档详细介绍了如何在Linux环境下部署和使用Kafka,包括单机部署和集群部署。 一、单机部署 1.1 规划 在CentOS ...
Apache Kafka,一个由LinkedIn开发并贡献给Apache软件基金会的开源流处理平台,因其高性能、高可扩展性和容错性而备受业界青睐。Kafka 2.13-3.1.0是Kafka的一个重要版本,它提供了对Java 8和Scala 2.13的支持,同时...
Kafka,由LinkedIn开发并开源,是一款高性能、分布式的流处理平台,其设计目标是处理海量实时数据。它的核心特性是能够以高吞吐量进行消息的发布与订阅,同时保证数据的可靠传输。Kafka 2.13-3.4.0版本的发布,...
总结,Kafka 2.13-2.8.0作为一个成熟的分布式消息系统,其高效、可扩展的特性和持续优化的功能使其在大数据领域广泛应用。无论是从理论层面还是实践操作,深入理解Kafka的核心概念、配置及应用场景,对于提升大数据...
总结,“Kafka-Grpc_kafka_assignment_”项目展示了如何结合Kafka的分布式消息传递能力和GRPC的高效通信机制,解决特定的作业问题。通过对Kafka主题、分区、生产者消费者模型的深入理解,以及巧妙利用GRPC的特性,...
Kafka是由LinkedIn开发并贡献给Apache软件基金会的一个开源分布式流处理平台。它的设计目标是成为一个高吞吐、低延迟的消息系统,能够处理海量实时数据。Kafka作为一个分布式消息中间件,它在大数据领域扮演着重要的...
本文主要总结了Apache Kafka的相关命令和操作,包括安装、服务启停、Topic管理、消息生产和消费以及一些实用工具。Kafka是一个分布式流处理平台,它被广泛用于实时数据管道和流应用。 1. **Kafka的安装与服务启停**...
Apache Kafka是一个分布式流处理平台,最初由...总结来说,Kafka以其高性能、可扩展和持久化的消息队列机制,在大数据处理和流媒体应用领域中广泛应用。它的设计原理、配置选项和集群部署都是支撑其成功的关键因素。
Kafka是一个分布式流处理平台,而Zookeeper是一个分布式协调服务,它们都是Apache软件基金会的开源项目。JDK是Java编程语言的运行环境,是运行Kafka和Zookeeper所必需的。 **JDK** JDK(Java Development Kit)是...
而Apache Kafka作为分布式流处理平台,被广泛用于实时数据传输和处理。本示例"springboot-kafka-simple-demo"旨在帮助开发者了解如何在SpringBoot应用中集成和使用Kafka。 首先,我们需要了解Kafka的基本概念。...
总结,Kafka_2.11-2.2.0作为Kafka的一个稳定版本,提供了强大的流处理能力和高度可扩展的架构。无论是对于企业级日志管理,还是实时数据分析,它都是一个值得信赖的选择。在实际操作中,理解并掌握Kafka的核心概念、...
Apache Kafka是一款分布式流处理平台,由LinkedIn开发并开源,后来成为了Apache软件基金会的顶级项目。它被广泛用于构建实时数据管道和流应用,能够高效地处理大量实时数据。在本文中,我们将深入探讨Kafka的核心...
总结来说,Spring Boot与Apache Kafka的集成使得在微服务架构中实现消息传递变得简单而高效。通过`spring-boot-starter-data-kafka`起步依赖,我们可以快速创建生产者和消费者,利用Spring的注解驱动特性简化编程...