`

Kafka配置详解

阅读更多
############################# System #############################
#唯一标识在集群中的ID,要求是正数。
broker.id=0
#服务端口,默认9092
port=9092
#监听地址,不设为所有地址
host.name=debugo01
 
# 处理网络请求的最大线程数
num.network.threads=2
# 处理磁盘I/O的线程数
num.io.threads=8
# 一些后台线程数
background.threads=4
# 等待IO线程处理的请求队列最大数
queued.max.requests=500
 
#  socket的发送缓冲区(SO_SNDBUF)
socket.send.buffer.bytes=1048576
# socket的接收缓冲区 (SO_RCVBUF)
socket.receive.buffer.bytes=1048576
# socket请求的最大字节数。为了防止内存溢出,message.max.bytes必然要小于
socket.request.max.bytes=104857600
 
############################# Topic #############################
# 每个topic的分区个数,更多的partition会产生更多的segment file
num.partitions=2
# 是否允许自动创建topic ,若是false,就需要通过命令创建topic
auto.create.topics.enable=true
# 一个topic ,默认分区的replication个数 ,不能大于集群中broker的个数。
default.replication.factor=1
# 消息体的最大大小,单位是字节
message.max.bytes=1000000
 
############################# ZooKeeper #############################
# Zookeeper quorum设置。如果有多个使用逗号分割
zookeeper.connect=debugo01:2181,debugo02,debugo03
# 连接zk的超时时间
zookeeper.connection.timeout.ms=1000000
# ZooKeeper集群中leader和follower之间的同步实际
zookeeper.sync.time.ms=2000
 
############################# Log #############################
#日志存放目录,多个目录使用逗号分割
log.dirs=/var/log/kafka
 
# 当达到下面的消息数量时,会将数据flush到日志文件中。默认10000
#log.flush.interval.messages=10000
# 当达到下面的时间(ms)时,执行一次强制的flush操作。interval.ms和interval.messages无论哪个达到,都会flush。默认3000ms
#log.flush.interval.ms=1000
# 检查是否需要将日志flush的时间间隔
log.flush.scheduler.interval.ms=3000
 
# 日志清理策略(delete|compact)
log.cleanup.policy=delete
# 日志保存时间 (hours|minutes),默认为7天(168小时)。超过这个时间会根据policy处理数据。bytes和minutes无论哪个先达到都会触发。
log.retention.hours=168
# 日志数据存储的最大字节数。超过这个时间会根据policy处理数据。
#log.retention.bytes=1073741824
 
# 控制日志segment文件的大小,超出该大小则追加到一个新的日志segment文件中(-1表示没有限制)
log.segment.bytes=536870912
# 当达到下面时间,会强制新建一个segment
log.roll.hours=24*7
# 日志片段文件的检查周期,查看它们是否达到了删除策略的设置(log.retention.hours或log.retention.bytes)
log.retention.check.interval.ms=60000
 
# 是否开启压缩
log.cleaner.enable=false
# 对于压缩的日志保留的最长时间
log.cleaner.delete.retention.ms=1day
 
# 对于segment日志的索引文件大小限制
log.index.size.max.bytes=10*1024*1024
#y索引计算的一个缓冲区,一般不需要设置。
log.index.interval.bytes=4096
 
############################# replica #############################
# partition management controller 与replicas之间通讯的超时时间
controller.socket.timeout.ms=30000
# controller-to-broker-channels消息队列的尺寸大小
controller.message.queue.size=10
# replicas响应leader的最长等待时间,若是超过这个时间,就将replicas排除在管理之外
replica.lag.time.max.ms=10000
# 是否允许控制器关闭broker ,若是设置为true,会关闭所有在这个broker上的leader,并转移到其他broker
controlled.shutdown.enable=false
# 控制器关闭的尝试次数
controlled.shutdown.max.retries=3
# 每次关闭尝试的时间间隔
controlled.shutdown.retry.backoff.ms=5000
 
# 如果relicas落后太多,将会认为此partition relicas已经失效。而一般情况下,因为网络延迟等原因,总会导致replicas中消息同步滞后。如果消息严重滞后,leader将认为此relicas网络延迟较大或者消息吞吐能力有限。在broker数量较少,或者网络不足的环境中,建议提高此值.
replica.lag.max.messages=4000
#leader与relicas的socket超时时间
replica.socket.timeout.ms=30*1000
# leader复制的socket缓存大小
replica.socket.receive.buffer.bytes=64*1024
# replicas每次获取数据的最大字节数
replica.fetch.max.bytes=1024*1024
# replicas同leader之间通信的最大等待时间,失败了会重试
replica.fetch.wait.max.ms=500
# 每一个fetch操作的最小数据尺寸,如果leader中尚未同步的数据不足此值,将会等待直到数据达到这个大小
replica.fetch.min.bytes=1
# leader中进行复制的线程数,增大这个数值会增加relipca的IO
num.replica.fetchers=1
# 每个replica将最高水位进行flush的时间间隔
replica.high.watermark.checkpoint.interval.ms=5000
 
# 是否自动平衡broker之间的分配策略
auto.leader.rebalance.enable=false
# leader的不平衡比例,若是超过这个数值,会对分区进行重新的平衡
leader.imbalance.per.broker.percentage=10
# 检查leader是否不平衡的时间间隔
leader.imbalance.check.interval.seconds=300
# 客户端保留offset信息的最大空间大小
offset.metadata.max.bytes=1024
 
#############################Consumer #############################
# Consumer端核心的配置是group.id、zookeeper.connect
# 决定该Consumer归属的唯一组ID,By setting the same group id multiple processes indicate that they are all part of the same consumer group.
group.id
# 消费者的ID,若是没有设置的话,会自增
consumer.id
# 一个用于跟踪调查的ID ,最好同group.id相同
client.id=<group_id>
 
# 对于zookeeper集群的指定,必须和broker使用同样的zk配置
zookeeper.connect=debugo01:2182,debugo02:2182,debugo03:2182
# zookeeper的心跳超时时间,查过这个时间就认为是无效的消费者
zookeeper.session.timeout.ms=6000
# zookeeper的等待连接时间
zookeeper.connection.timeout.ms=6000
# zookeeper的follower同leader的同步时间
zookeeper.sync.time.ms=2000
# 当zookeeper中没有初始的offset时,或者超出offset上限时的处理方式 。
# smallest :重置为最小值
# largest:重置为最大值
# anything else:抛出异常给consumer
auto.offset.reset=largest
 
# socket的超时时间,实际的超时时间为max.fetch.wait + socket.timeout.ms.
socket.timeout.ms=30*1000
# socket的接收缓存空间大小
socket.receive.buffer.bytes=64*1024
#从每个分区fetch的消息大小限制
fetch.message.max.bytes=1024*1024
 
# true时,Consumer会在消费消息后将offset同步到zookeeper,这样当Consumer失败后,新的consumer就能从zookeeper获取最新的offset
auto.commit.enable=true
# 自动提交的时间间隔
auto.commit.interval.ms=60*1000
 
# 用于消费的最大数量的消息块缓冲大小,每个块可以等同于fetch.message.max.bytes中数值
queued.max.message.chunks=10
 
# 当有新的consumer加入到group时,将尝试reblance,将partitions的消费端迁移到新的consumer中, 该设置是尝试的次数
rebalance.max.retries=4
# 每次reblance的时间间隔
rebalance.backoff.ms=2000
# 每次重新选举leader的时间
refresh.leader.backoff.ms
 
# server发送到消费端的最小数据,若是不满足这个数值则会等待直到满足指定大小。默认为1表示立即接收。
fetch.min.bytes=1
# 若是不满足fetch.min.bytes时,等待消费端请求的最长等待时间
fetch.wait.max.ms=100
# 如果指定时间内没有新消息可用于消费,就抛出异常,默认-1表示不受限
consumer.timeout.ms=-1
 
#############################Producer#############################
# 核心的配置包括:
# metadata.broker.list
# request.required.acks
# producer.type
# serializer.class
 
# 消费者获取消息元信息(topics, partitions and replicas)的地址,配置格式是:host1:port1,host2:port2,也可以在外面设置一个vip
metadata.broker.list
 
#消息的确认模式
# 0:不保证消息的到达确认,只管发送,低延迟但是会出现消息的丢失,在某个server失败的情况下,有点像TCP
# 1:发送消息,并会等待leader 收到确认后,一定的可靠性
# -1:发送消息,等待leader收到确认,并进行复制操作后,才返回,最高的可靠性
request.required.acks=0
 
# 消息发送的最长等待时间
request.timeout.ms=10000
# socket的缓存大小
send.buffer.bytes=100*1024
# key的序列化方式,若是没有设置,同serializer.class
key.serializer.class
# 分区的策略,默认是取模
partitioner.class=kafka.producer.DefaultPartitioner
# 消息的压缩模式,默认是none,可以有gzip和snappy
compression.codec=none
# 可以针对默写特定的topic进行压缩
compressed.topics=null
# 消息发送失败后的重试次数
message.send.max.retries=3
# 每次失败后的间隔时间
retry.backoff.ms=100
# 生产者定时更新topic元信息的时间间隔 ,若是设置为0,那么会在每个消息发送后都去更新数据
topic.metadata.refresh.interval.ms=600*1000
# 用户随意指定,但是不能重复,主要用于跟踪记录消息
client.id=""
 
# 异步模式下缓冲数据的最大时间。例如设置为100则会集合100ms内的消息后发送,这样会提高吞吐量,但是会增加消息发送的延时
queue.buffering.max.ms=5000
# 异步模式下缓冲的最大消息数,同上
queue.buffering.max.messages=10000
# 异步模式下,消息进入队列的等待时间。若是设置为0,则消息不等待,如果进入不了队列,则直接被抛弃
queue.enqueue.timeout.ms=-1
# 异步模式下,每次发送的消息数,当queue.buffering.max.messages或queue.buffering.max.ms满足条件之一时producer会触发发送。
batch.num.messages=200
分享到:
评论

相关推荐

    kafka配置参数详解 - 网络技术

    在实际使用过程中,需要对Kafka的配置参数进行详细理解,以便根据具体业务需求调整参数,优化性能。以下对Kafka主要配置参数进行详细解读: 1. broker.id:这是Kafka broker的唯一标识符,它是一个整数,用于唯一...

    kafka参数配置详解

    Kafka参数配置详解 Kafka是一种流行的分布式流处理平台,用于构建实时数据管道和事件驱动的架构。为了确保Kafka集群的稳定运行和高性能,需要正确地配置Kafka参数。本文将详细介绍Kafka的参数配置,包括系统参数、...

    kafka配置.pptx

    ### Kafka配置详解 #### 一、Kafka简介与应用场景 Kafka是一款由LinkedIn开发并开源的分布式消息系统,采用Scala语言编写。它最初被设计用于LinkedIn的活动流和运营数据处理管道,具备高度可扩展性和高吞吐量的...

    spring-cloud-stream结合kafka使用详解

    Spring Cloud Stream 结合 Kafka 使用详解 Spring Cloud Stream 是一个基于 Spring Boot 的消息驱动微服务框架,它提供了统一的消息处理模型,可以轻松地与各种消息中间件集成。在本文中,我们将详细介绍 Spring ...

    kafka配置安装详解

    ### Kafka配置安装详解 #### 一、环境搭建与配置 Kafka是一款开源的消息队列中间件,被广泛应用于大数据处理领域。本篇文章将详细介绍如何在本地环境中安装并配置Kafka,以及进行基本的操作演示。 ##### 环境要求...

    Kafka配置参数详解 - 网络技术.rar_KAFKA broker_Kafka配置参数详解_kafka

    本篇将深入探讨Kafka配置参数,帮助你理解和优化Kafka集群的运行。 1. **broker.id**: 这个参数是每个Kafka broker的唯一标识,它必须在整个集群中是唯一的。值可以是任意整数,通常从0开始。 2. **zookeeper....

    Kafka3.0详解,客户端命令,核心配置文件详解。spring集成、webflux集成、集群搭建

    它的客户端命令以及核心配置文件是其操作的核心,而spring集成和webflux集成则可以将Kafka3.0与主流的Java开发框架相结合,集群搭建则是其分布式特性的基础。 消息系统是一种应用程序,用于在不同的软件组件之间...

    Kafka配置信息.docx

    Kafka 配置信息总结 Kafka 是一个基于 Publish-Subscribe 模式的分布式消息队列系统,配置信息是 Kafka 集群的核心组件。本文将对 Kafka 配置信息进行详细的解析,帮助读者更好地理解 Kafka 的配置机制。 Broker ...

    Spring 集成 Kafka的配置文件及代码讲解

    接下来,我们来配置Spring Boot的`application.yml`或`application.properties`文件以连接到Kafka集群。这里是一个示例配置: ```yaml spring: kafka: bootstrap-servers: localhost:9092 # Kafka服务器地址 ...

    Flume+kafka+Storm整合

    #### 三、Kafka配置详解 1. **下载Kafka:** - 使用命令 `wget https://www.apache.org/dyn/closer.cgi?path=/kafka/0.8.2.1/kafka_2.10-0.8.2.1.tgz` 下载Kafka。 2. **解压与修改权限:** - 解压命令:`tar -...

    Kafka 配置文件及编程

    **Kafka配置文件详解** Kafka是一个分布式流处理平台,其核心组件包括生产者、消费者和代理(broker)。在Kafka的运行中,`server.properties`是每个Kafka broker节点的核心配置文件,它定义了服务器的行为和参数。...

    docker-kafka-cluster集群安装

    2、Kafka配置详解 Kafka的配置参数非常多,每个参数都有其特定的作用。以下是一些关键的配置项: - `KAFKA_ZOOKEEPER_CONNECT`:设置Kafka连接到的Zookeeper集群地址,通常包括Zookeeper实例的主机名和端口。 - `...

    kafka 配置kerberos安全认证

    ### Kafka配置Kerberos安全认证详解 #### 一、引言 Kafka 是一款高性能的消息队列服务,广泛应用于大数据处理领域。为了保障数据的安全性和完整性,Kafka 提供了多种安全认证机制,其中 Kerberos 认证是一种非常...

    Kafka工作原理详解

    ### Kafka工作原理详解 #### 一、Kafka的角色与组件 Kafka作为一款分布式消息系统,在实际应用中涉及多种角色及组件,它们协同工作确保消息的高效传递。 1. **Broker**:Kafka集群的基本单元,一个Broker可以视为...

    SpringBoot使用Kafka详解含完整代码

    ### Spring Boot 使用 Kafka 详解 #### 一、前言 随着大数据时代的发展,实时数据处理的需求日益增加。Kafka作为一款高性能的分布式流处理平台,因其高吞吐量、低延迟等特点,在数据处理领域占据了一席之地。而...

    kafka操作详解.docx

    在Spring Boot应用中,我们可以在`application.yml`或`application.properties`文件中配置Kafka连接信息和主题。例如: ```yaml spring: kafka: bootstrap-servers: localhost:9092 producer: key-serializer: ...

    kafka配置调优1

    【Kafka配置调优详解】 Kafka是一款高吞吐、分布式的流处理平台,它用于构建实时数据管道和流应用。在大型分布式系统中,为了保证高效稳定运行,对Kafka进行配置调优至关重要。本篇文章将深入解析Kafka的核心配置...

    Kafka、Zookeeper集群配置

    **Kafka与Zookeeper集群配置详解** 在大数据处理和实时流计算领域,Apache Kafka和Apache Zookeeper是两个不可或缺的组件。Kafka作为一个高吞吐量的分布式消息系统,用于处理实时数据流,而Zookeeper则作为一个...

    kafkatool 连接kafka工具

    **Kafka Tool 连接 Kafka 工具详解** 在大数据处理和实时流处理领域,Apache Kafka 是一个不可或缺的组件,它作为一个分布式的消息中间件,提供高效、可扩展且可靠的发布订阅服务。为了方便管理和操作 Kafka 集群,...

Global site tag (gtag.js) - Google Analytics