Kafka学习之producer配置(0.8.1版)

邢邢色色

浏览: 232105 次
性别:
来自: 广州

最近访客更多访客>>

qq_25052997

fww4022

yeahgoodboy

san_yun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Kafka

ZooKeeper producer 配置

metadata.broker.list 默认值：无，必填

格式为host1:port1,host2:port2，这是一个broker列表，用于获得元数据(topics，partitions和replicas)，建立起来的socket连接用于发送实际数据，这个列表可以是broker的一个子集，或者一个VIP，指向broker的一个子集。

request.required.acks 默认值：0

用来控制一个produce请求怎样才能算完成，准确的说，是有多少broker必须已经提交数据到log文件，并向leader发送ack，可以设置如下的值：

0，意味着producer永远不会等待一个来自broker的ack，这就是0.7版本的行为。这个选项提供了最低的延迟，但是持久化的保证是最弱的，当server挂掉的时候会丢失一些数据。
1，意味着在leader replica已经接收到数据后，producer会得到一个ack。这个选项提供了更好的持久性，因为在server确认请求成功处理后，client才会返回。如果刚写到leader上，还没来得及复制leader就挂了，那么消息才可能会丢失。
-1，意味着在所有的ISR都接收到数据后，producer才得到一个ack。这个选项提供了最好的持久性，只要还有一个replica存活，那么数据就不会丢失。

request.timeout.ms 默认值：10000

请求超时时间。

producer.type 默认值：sync

决定消息是否应在一个后台线程异步发送。合法的值为sync，表示异步发送；sync表示同步发送。设置为async则允许批量发送请求，这回带来更高的吞吐量，但是client的机器挂了的话会丢失还没有发送的数据。异步意味着消息将会在本地buffer，并适时批量发送，推荐使用。

serializer.class 默认值：kafka.serializer.DefaultEncoder

The serializer class for messages. The default encoder takes a byte[] and returns the same byte[].

消息的序列化类，默认是的encoder处理一个byte[]，返回一个byte[]。

key.serializer.class 默认值：无

The serializer class for keys (defaults to the same as for messages if nothing is given).

key的序列化类，默认跟消息的序列化类一样。

partitioner.class 默认值：kafka.producer.DefaultPartitioner

用来把消息分到各个partition中，默认行为是对key进行hash。

compression.codec 默认值：none

允许指定压缩codec来对消息进行压缩，合法的值为：none，gzip，snappy。

compressed.topics 默认值：null

允许你指定特定的topic对其进行压缩。如果compression codec设置了除NoCompressionCodec以外的值，那么仅会对本选项指定的topic进行压缩。如果compression codec为NoCompressionCodec，那么压缩就不会启用。

message.send.max.retries 默认值：3

如果producer发送消息失败了会自动重发，本选项指定了重发的次数。注意如果是非0值，那么可能会导致重复发送，就是说的确发送了消息，但是没有收到ack，那么就还会发一次。

retry.backoff.ms 默认值：100

在每次重发之前，producer会刷新相关的topic的元数据，来看看是否选出了一个新leader。由于选举leader会花一些时间，此选项指定了在刷新元数据前等待的时间。

topic.metadata.refresh.interval.ms 默认值：600 * 1000

当出现错误时(缺失partition，leader不可用等)，producer通常会从broker拉取最新的topic的元数据。它也会每隔一段时间轮询(默认是每隔10分钟)。如果设置了一个负数，那么只有当发生错误时才会刷新元数据，当然不推荐这样做。有一个重要的提示：只有在消息被发送后才会刷新，所以如果producer没有发送一个消息的话，则元数据永远不会被刷新。

queue.buffering.max.ms 默认值：5000

当使用异步模式时，缓冲数据的最大时间。例如设为100的话，会每隔100毫秒把所有的消息批量发送。这会提高吞吐量，但是会增加消息的到达延时。

queue.buffering.max.messages 默认值：10000

在异步模式下，producer端允许buffer的最大消息数量，如果producer无法尽快将消息发送给broker，从而导致消息在producer端大量沉积，如果消息的条数达到此配置值，将会导致producer端阻塞或者消息被抛弃。

queue.enqueue.timeout.ms 默认值：-1

当消息在producer端沉积的条数达到queue.buffering.max.meesages时，阻塞一定时间后，队列仍然没有enqueue(producer仍然没有发送出任何消息) 。此时producer可以继续阻塞或者将消息抛弃，此timeout值用于控制阻塞的时间，如果值为-1则无阻塞超时限制，消息不会被抛弃；如果值为0则立即清空队列，消息被抛弃。

batch.num.messages 默认值：200

在异步模式下，一个batch发送的消息数量。producer会等待直到要发送的消息数量达到这个值，之后才会发送。但如果消息数量不够，达到queue.buffer.max.ms时也会直接发送。

send.buffer.bytes 默认值：100 * 1024

socket的发送缓存大小。

client.id 默认值：""

这是用户可自定义的client id，附加在每一条消息上来帮助跟踪。

更多配置细节可以参考kafka.producer.ProducerConfig类。

0
顶

0
踩

分享到：

Kafka学习之consumer配置(0.8.1版) | Kafka学习之broker配置(0.8.1版)

2014-07-03 16:17
浏览 7317
评论(3)
分类:开源软件
查看更多

3 楼 NASa_CJ 2016-11-17

“合法的值为sync，表示异步发送；sync表示同步发送。”这句话你自己读读！

2 楼邢邢色色 2014-07-04

asialee 写道

近来我也在研究kafak，lz写的比较详细，佩服，应该是在什么地方翻译的吧，能不能分享下你的资料？

都是官方文档里的东东啊，也没其他的地方了，再加上一些自己的理解吧。

1 楼 asialee 2014-07-04

近来我也在研究kafak，lz写的比较详细，佩服，应该是在什么地方翻译的吧，能不能分享下你的资料？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论