- 浏览: 297887 次
- 性别:
- 来自: 南京
文章分类
最新评论
-
pangxiea_:
你好, 想请问一下 Linux下 这么使用rxtxcomm 在 ...
转载:java串口编程 -
xiang_mr:
多谢啊,有时间再看源码。
解决POI中DateUtil.isCellDateFormatted(Cell cell)不能判断中文日期的问题 -
huiy:
cheetah747 写道所以呢?怎么解决?请网络管理员开放网 ...
apache的ftpClient.listFiles()为空 -
cheetah747:
所以呢?怎么解决?
apache的ftpClient.listFiles()为空 -
huiy:
a8632935 写道感谢楼主的经验分享,问题搞定不客气
解决POI中DateUtil.isCellDateFormatted(Cell cell)不能判断中文日期的问题
原文档地址:http://kafka.apache.org/documentation.html
############################# System ############################# #唯一标识在集群中的ID,要求是正数。 broker.id=0 #服务端口,默认9092 port=9092 #监听地址,不设为所有地址 host.name=debugo01 # 处理网络请求的最大线程数 num.network.threads=2 # 处理磁盘I/O的线程数 num.io.threads=8 # 一些后台线程数 background.threads = 4 # 等待IO线程处理的请求队列最大数 queued.max.requests = 500 # socket的发送缓冲区(SO_SNDBUF) socket.send.buffer.bytes=1048576 # socket的接收缓冲区 (SO_RCVBUF) socket.receive.buffer.bytes=1048576 # socket请求的最大字节数。为了防止内存溢出,message.max.bytes必然要小于 socket.request.max.bytes = 104857600 ############################# Topic ############################# # 每个topic的分区个数,更多的partition会产生更多的segment file num.partitions=2 # 是否允许自动创建topic ,若是false,就需要通过命令创建topic auto.create.topics.enable =true # 一个topic ,默认分区的replication个数 ,不能大于集群中broker的个数。 default.replication.factor =1 # 消息体的最大大小,单位是字节 message.max.bytes = 1000000 ############################# ZooKeeper ############################# # Zookeeper quorum设置。如果有多个使用逗号分割 zookeeper.connect=debugo01:2181,debugo02,debugo03 # 连接zk的超时时间 zookeeper.connection.timeout.ms=1000000 # ZooKeeper集群中leader和follower之间的同步实际 zookeeper.sync.time.ms = 2000 ############################# Log ############################# #日志存放目录,多个目录使用逗号分割 log.dirs=/var/log/kafka # 当达到下面的消息数量时,会将数据flush到日志文件中。默认10000 #log.flush.interval.messages=10000 # 当达到下面的时间(ms)时,执行一次强制的flush操作。interval.ms和interval.messages无论哪个达到,都会flush。默认3000ms #log.flush.interval.ms=1000 # 检查是否需要将日志flush的时间间隔 log.flush.scheduler.interval.ms = 3000 # 日志清理策略(delete|compact) log.cleanup.policy = delete # 日志保存时间 (hours|minutes),默认为7天(168小时)。超过这个时间会根据policy处理数据。bytes和minutes无论哪个先达到都会触发。 log.retention.hours=168 # 日志数据存储的最大字节数。超过这个时间会根据policy处理数据。 #log.retention.bytes=1073741824 # 控制日志segment文件的大小,超出该大小则追加到一个新的日志segment文件中(-1表示没有限制) log.segment.bytes=536870912 # 当达到下面时间,会强制新建一个segment log.roll.hours = 24*7 # 日志片段文件的检查周期,查看它们是否达到了删除策略的设置(log.retention.hours或log.retention.bytes) log.retention.check.interval.ms=60000 # 是否开启压缩 log.cleaner.enable=false # 对于压缩的日志保留的最长时间 log.cleaner.delete.retention.ms = 1 day # 对于segment日志的索引文件大小限制 log.index.size.max.bytes = 10 * 1024 * 1024 #y索引计算的一个缓冲区,一般不需要设置。 log.index.interval.bytes = 4096 ############################# replica ############################# # partition management controller 与replicas之间通讯的超时时间 controller.socket.timeout.ms = 30000 # controller-to-broker-channels消息队列的尺寸大小 controller.message.queue.size=10 # replicas响应leader的最长等待时间,若是超过这个时间,就将replicas排除在管理之外 replica.lag.time.max.ms = 10000 # 是否允许控制器关闭broker ,若是设置为true,会关闭所有在这个broker上的leader,并转移到其他broker controlled.shutdown.enable = false # 控制器关闭的尝试次数 controlled.shutdown.max.retries = 3 # 每次关闭尝试的时间间隔 controlled.shutdown.retry.backoff.ms = 5000 # 如果relicas落后太多,将会认为此partition relicas已经失效。而一般情况下,因为网络延迟等原因,总会导致replicas中消息同步滞后。如果消息严重滞后,leader将认为此relicas网络延迟较大或者消息吞吐能力有限。在broker数量较少,或者网络不足的环境中,建议提高此值. replica.lag.max.messages = 4000 #leader与relicas的socket超时时间 replica.socket.timeout.ms= 30 * 1000 # leader复制的socket缓存大小 replica.socket.receive.buffer.bytes=64 * 1024 # replicas每次获取数据的最大字节数 replica.fetch.max.bytes = 1024 * 1024 # replicas同leader之间通信的最大等待时间,失败了会重试 replica.fetch.wait.max.ms = 500 # 每一个fetch操作的最小数据尺寸,如果leader中尚未同步的数据不足此值,将会等待直到数据达到这个大小 replica.fetch.min.bytes =1 # leader中进行复制的线程数,增大这个数值会增加relipca的IO num.replica.fetchers = 1 # 每个replica将最高水位进行flush的时间间隔 replica.high.watermark.checkpoint.interval.ms = 5000 # 是否自动平衡broker之间的分配策略 auto.leader.rebalance.enable = false # leader的不平衡比例,若是超过这个数值,会对分区进行重新的平衡 leader.imbalance.per.broker.percentage = 10 # 检查leader是否不平衡的时间间隔 leader.imbalance.check.interval.seconds = 300 # 客户端保留offset信息的最大空间大小 offset.metadata.max.bytes = 1024 #############################Consumer ############################# # Consumer端核心的配置是group.id、zookeeper.connect # 决定该Consumer归属的唯一组ID,By setting the same group id multiple processes indicate that they are all part of the same consumer group. group.id # 消费者的ID,若是没有设置的话,会自增 consumer.id # 一个用于跟踪调查的ID ,最好同group.id相同 client.id = <group_id> # 对于zookeeper集群的指定,必须和broker使用同样的zk配置 zookeeper.connect=debugo01:2182,debugo02:2182,debugo03:2182 # zookeeper的心跳超时时间,查过这个时间就认为是无效的消费者 zookeeper.session.timeout.ms = 6000 # zookeeper的等待连接时间 zookeeper.connection.timeout.ms = 6000 # zookeeper的follower同leader的同步时间 zookeeper.sync.time.ms = 2000 # 当zookeeper中没有初始的offset时,或者超出offset上限时的处理方式 。 # smallest :重置为最小值 # largest:重置为最大值 # anything else:抛出异常给consumer auto.offset.reset = largest # socket的超时时间,实际的超时时间为max.fetch.wait + socket.timeout.ms. socket.timeout.ms= 30 * 1000 # socket的接收缓存空间大小 socket.receive.buffer.bytes=64 * 1024 #从每个分区fetch的消息大小限制 fetch.message.max.bytes = 1024 * 1024 # true时,Consumer会在消费消息后将offset同步到zookeeper,这样当Consumer失败后,新的consumer就能从zookeeper获取最新的offset auto.commit.enable = true # 自动提交的时间间隔 auto.commit.interval.ms = 60 * 1000 # 用于消费的最大数量的消息块缓冲大小,每个块可以等同于fetch.message.max.bytes中数值 queued.max.message.chunks = 10 # 当有新的consumer加入到group时,将尝试reblance,将partitions的消费端迁移到新的consumer中, 该设置是尝试的次数 rebalance.max.retries = 4 # 每次reblance的时间间隔 rebalance.backoff.ms = 2000 # 每次重新选举leader的时间 refresh.leader.backoff.ms # server发送到消费端的最小数据,若是不满足这个数值则会等待直到满足指定大小。默认为1表示立即接收。 fetch.min.bytes = 1 # 若是不满足fetch.min.bytes时,等待消费端请求的最长等待时间 fetch.wait.max.ms = 100 # 如果指定时间内没有新消息可用于消费,就抛出异常,默认-1表示不受限 consumer.timeout.ms = -1 #############################Producer############################# # 核心的配置包括: # metadata.broker.list # request.required.acks # producer.type # serializer.class # 消费者获取消息元信息(topics, partitions and replicas)的地址,配置格式是:host1:port1,host2:port2,也可以在外面设置一个vip metadata.broker.list #消息的确认模式 # 0:不保证消息的到达确认,只管发送,低延迟但是会出现消息的丢失,在某个server失败的情况下,有点像TCP # 1:发送消息,并会等待leader 收到确认后,一定的可靠性 # -1:发送消息,等待leader收到确认,并进行复制操作后,才返回,最高的可靠性 request.required.acks = 0 # 消息发送的最长等待时间 request.timeout.ms = 10000 # socket的缓存大小 send.buffer.bytes=100*1024 # key的序列化方式,若是没有设置,同serializer.class key.serializer.class # 分区的策略,默认是取模 partitioner.class=kafka.producer.DefaultPartitioner # 消息的压缩模式,默认是none,可以有gzip和snappy compression.codec = none # 可以针对默写特定的topic进行压缩 compressed.topics=null # 消息发送失败后的重试次数 message.send.max.retries = 3 # 每次失败后的间隔时间 retry.backoff.ms = 100 # 生产者定时更新topic元信息的时间间隔 ,若是设置为0,那么会在每个消息发送后都去更新数据 topic.metadata.refresh.interval.ms = 600 * 1000 # 用户随意指定,但是不能重复,主要用于跟踪记录消息 client.id="" # 异步模式下缓冲数据的最大时间。例如设置为100则会集合100ms内的消息后发送,这样会提高吞吐量,但是会增加消息发送的延时 queue.buffering.max.ms = 5000 # 异步模式下缓冲的最大消息数,同上 queue.buffering.max.messages = 10000 # 异步模式下,消息进入队列的等待时间。若是设置为0,则消息不等待,如果进入不了队列,则直接被抛弃 queue.enqueue.timeout.ms = -1 # 异步模式下,每次发送的消息数,当queue.buffering.max.messages或queue.buffering.max.ms满足条件之一时producer会触发发送。 batch.num.messages=200
发表评论
-
利用apache的ftpclent实现FTP服务器之间互传
2015-11-26 14:46 2141在项目中遇到需要把一个FTP服务器文件复制到另一个服务器上面, ... -
apache的ftpClient.listFiles()为空
2015-11-25 14:10 2291客户端连接FTP服务器,执行到ftpClient.listFi ... -
org.apache.cxf.interceptor.Fault: Unmarshalling Error
2015-11-14 09:38 5210项目中遇到一个奇怪的问题,webservice客户端代码生成j ... -
java.net.SocketException: Connection reset by peer: socket write error
2015-10-12 16:56 1583下载文件时发生错误: java.net.SocketExce ... -
转: sql server 判断是否存在数据库,表,列,视图...
2015-09-29 09:34 870转载地址:http://blog.csdn.net/w ... -
转:Oracle判断表、列、主键是否存在的方法
2015-09-29 09:29 2471转载地址:http://blog.csdn.net/wxd ... -
RmsBulk.exe使用注意事项
2015-08-12 15:38 11401.首先确保office软件能否正常的进行RMS加解密 ... -
客户端RMS解密:此服务暂时不可用。请确认已连接此服务器。。。
2015-08-07 12:03 3581测试ADRMS时,客户端设置权限是提示错误::“此服务暂时不 ... -
RMS:不能对生产服务器使用测试清单
2015-08-07 12:00 2992问题说明:在使用office软件RMS加密时报:不能对生产服 ... -
客户端在非域环境下打开RMS加密后的文件
2015-08-06 18:24 2864如果客户端office不能打开,请依照以下执行: 1.确 ... -
RMS安装注意事项
2015-08-06 18:13 729----第一次安装 1.安装时RMS服务器和DC服务器最 ... -
oracle:比较两个用户下表结构差异
2015-07-10 20:48 1625问题说明:现有oracle11g,需要比较这其中两个用户A ... -
linux中tomcat日志乱码,XML读取显示乱码
2015-07-09 17:15 2171环境:centos6.5,tomcat7,jdk1.6, ... -
http文件下载注意事项
2015-05-05 16:04 529今天使用http下载文件,链接是:http://*.*.*.* ... -
<s:select>标签中再使用表达式访问变量
2014-11-05 22:43 802<s:iterator value="li ... -
eclipse debug调试报错
2014-11-05 15:25 1412FATAL ERROR in native meth ... -
linux:用户不在sudoers列表中
2014-10-23 14:19 1529原文地址:http://jingyan.baidu.com/a ... -
logback日志不能输出到文件
2014-10-08 21:39 25807今天发现在一个工程中logback不能输出日志到文件,只有在控 ... -
转载:spring资源占位PropertyPlaceholderConfigurer读取文件中文乱码
2014-10-04 10:17 3487引用原文地址:http://yourwafer.blog.16 ... -
LDAP error Code 及解决方法
2014-09-27 20:29 2030原文地址:http://blog.csdn.net/techc ...
相关推荐
Kafka参数配置详解 Kafka是一种流行的分布式流处理平台,用于构建实时数据管道和事件驱动的架构。为了确保Kafka集群的稳定运行和高性能,需要正确地配置Kafka参数。本文将详细介绍Kafka的参数配置,包括系统参数、...
以下对Kafka主要配置参数进行详细解读: 1. broker.id:这是Kafka broker的唯一标识符,它是一个整数,用于唯一确定集群中的每个broker。如果需要迁移broker到新的主机,更改broker.id会导致消费者和生产者无法识别...
本篇将深入探讨Kafka配置参数,帮助你理解和优化Kafka集群的运行。 1. **broker.id**: 这个参数是每个Kafka broker的唯一标识,它必须在整个集群中是唯一的。值可以是任意整数,通常从0开始。 2. **zookeeper....
### Kafka配置安装详解 #### 一、环境搭建与配置 Kafka是一款开源的消息队列中间件,被广泛应用于大数据处理领域。本篇文章将详细介绍如何在本地环境中安装并配置Kafka,以及进行基本的操作演示。 ##### 环境要求...
Kafka3.0是一个在分布式系统中广泛使用的消息队列系统,主要用于构建实时数据管道和流式应用程序。它的客户端命令以及核心配置文件是其操作的核心,而spring集成和webflux集成则可以将Kafka3.0与主流的Java开发框架...
通过合理地配置Kafka参数和搭建集群,可以大幅提升吞吐量。 5. Kafka优化 Kafka的优化是提高吞吐量的关键。常见的优化方法包括: * 将Kafka集群化,使其并发度更高 * 多partition化,使消息发送和消费更快 * 调整...
接着,创建配置类`KafkaConfig`,配置Kafka连接参数,如bootstrap servers、生产者和消费者的配置属性: ```java @Configuration public class KafkaConfig { @Value("${spring.kafka.bootstrap-servers}") ...
《Kafka技术内幕:图文详解Kafka源码设计与实现》是一本深入解析Apache Kafka的专著,旨在帮助读者理解Kafka的核心设计理念、内部机制以及源码实现。这本书籍覆盖了大数据处理领域的关键知识点,通过丰富的图表和...
### Spring Boot 使用 Kafka 详解 #### 一、前言 随着大数据时代的发展,实时数据处理的需求日益增加。Kafka作为一款高性能的分布式流处理平台,因其高吞吐量、低延迟等特点,在数据处理领域占据了一席之地。而...
**Kafka Tool 连接 Kafka 工具详解** 在大数据处理和实时流处理领域,Apache Kafka 是一个不可或缺的组件,它作为一个分布式的消息中间件,提供高效、可扩展且可靠的发布订阅服务。为了方便管理和操作 Kafka 集群,...
Spring Kafka 中关于 Kafka 的配置参数详解 在 Spring Kafka 中,配置参数是非常重要的,它直接影响着 Kafka 的性能和稳定性。本文将详细介绍 Spring Kafka 中关于 Kafka 的配置参数,帮助读者更好地理解和使用 ...
这通常涉及设置如`bootstrap.servers`(Kafka集群地址)等参数。例如: ```java Properties props = new Properties(); props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092"); props.put...
《Kafka ARM版:kafka_2.11-1.1.0-aarch64详解》 在当今大数据处理领域,Apache Kafka以其高吞吐量、低延迟和分布式架构的特点,成为实时数据流处理的重要工具。而随着物联网(IoT)的发展,ARM架构的设备在边缘...
**Kafka 2.3.0 Linux 版本详解** Apache Kafka是一款开源的分布式流处理平台,由LinkedIn开发并贡献给Apache软件基金会。Kafka主要设计目标是提供高吞吐量、低延迟的消息发布与订阅服务,同时也支持数据持久化和...
**Kafka Tool 2.0.7 在 Linux 系统中的使用详解** Kafka Tool 是一款功能强大的 Apache Kafka 管理工具,适用于监控、管理、以及数据迁移等任务。在 Linux 系统中,我们可以方便地利用此工具进行各种 Kafka 相关的...
使用emq_plugin_kafka插件,需要在EMQ X Broker的配置文件中启用该插件,并设置相关的Kafka服务器地址、端口、主题等参数。部署后,所有通过EMQ X Broker发布的消息都可以自动转发到Kafka。 7. **应用场景**: - ...
### Kafka集群部署与运维知识点详解 #### 一、Kafka概览 Kafka是一种高性能的分布式消息系统,具有以下特点: - **数据持久性**:Kafka通过高效的磁盘数据结构来实现消息的持久化存储,即使面对大量数据也能保持...
**Kafka配置文件详解** Kafka是一个分布式流处理平台,其核心组件包括生产者、消费者和代理(broker)。在Kafka的运行中,`server.properties`是每个Kafka broker节点的核心配置文件,它定义了服务器的行为和参数。...
《Kafka在Linux环境下的安装与使用详解》 Apache Kafka是一款高性能、分布式的消息中间件,广泛应用于大数据实时处理、日志收集、流式数据处理等领域。本文将详细讲解如何在Linux环境下安装并使用Kafka 2.2.2版本。...
- **server.properties**:Kafka服务端的主要配置文件,包括broker.id、log.dirs、num.partitions等关键参数。 - **client.properties**:客户端连接服务器时使用的配置文件,包含bootstrap.servers等参数。 ####...