好了 , 接着上一章 , 我们回到kafka的 kafkaserver 这个重量级的类。
val handlers = new KafkaRequestHandlers(logManager) socketServer = new SocketServer(config.port, config.numThreads, config.monitoringPeriodSecs, handlers.handlerFor, config.socketSendBuffer, config.socketReceiveBuffer, config.maxSocketRequestSize)
在初始化zk连接, 加载topic信息之后。kafka开始跟做一些io的东西。个人对这部分还是很感兴趣的。让我们点进去看一看。
注释写的很精彩啊:
/** * An NIO socket server. The thread model is * 1 Acceptor thread that handles new connections * N Processor threads that each have their own selectors and handle all requests from their connections synchronously */
他都已经说了,这是 NIO 线程模型是 单线程负责处理所以的连接。n个线程异步处理这些连接。
从这个注释入手,我们看一看 Acceptor 和 Processor 是如何实现的。
/** * Thread that accepts and configures new connections. There is only need for one of these */ private[kafka] class Acceptor(val port: Int, private val processors: Array[Processor], val sendBufferSize: Int, val receiveBufferSize: Int) extends AbstractServerThread { /** * Accept loop that checks for new connection attempts */ def run() { val serverChannel = ServerSocketChannel.open() serverChannel.configureBlocking(false) serverChannel.socket.bind(new InetSocketAddress(port)) serverChannel.register(selector, SelectionKey.OP_ACCEPT); logger.info("Awaiting connections on port " + port) startupComplete() var currentProcessor = 0 while(isRunning) { val ready = selector.select(500) if(ready > 0) { val keys = selector.selectedKeys() val iter = keys.iterator() while(iter.hasNext && isRunning) { var key: SelectionKey = null try { key = iter.next iter.remove() if(key.isAcceptable) accept(key, processors(currentProcessor)) else throw new IllegalStateException("Unrecognized key state for acceptor thread.") // round robin to the next processor thread currentProcessor = (currentProcessor + 1) % processors.length } catch { case e: Throwable => logger.error("Error in acceptor", e) } } } } logger.debug("Closing server socket and selector.") Utils.swallow(logger.error, serverChannel.close()) Utils.swallow(logger.error, selector.close()) shutdownComplete() }
如果明白 java NIO 的相关部分,就会比较容易看懂这部分,忘了的上网搜搜。 一段标准的java server端的NIO 的操作, 绑定端口,注册事件,轮询 selector。如果有连接事件,就交给 processor 来处理。 简单而强有力的做法。下面看看Processor 是咋实现的。
private val newConnections = new ConcurrentLinkedQueue[SocketChannel](); private val requestLogger = Logger.getLogger("kafka.request.logger") override def run() { startupComplete() while(isRunning) { // setup any new connections that have been queued up configureNewConnections() val ready = selector.select(500) if(ready > 0) { val keys = selector.selectedKeys() val iter = keys.iterator() while(iter.hasNext && isRunning) { var key: SelectionKey = null try { key = iter.next iter.remove() if(key.isReadable) read(key) else if(key.isWritable) write(key) else if(!key.isValid) close(key) else throw new IllegalStateException("Unrecognized key state for processor thread.") } catch { case e: EOFException => { logger.info("Closing socket connection to %s.".format(channelFor(key).socket.getInetAddress)) close(key) } case e: InvalidRequestException => { logger.info("Closing socket connection to %s due to invalid request: %s".format(channelFor(key).socket.getInetAddress, e.getMessage)) close(key) } case e: Throwable => { logger.error("Closing socket for " + channelFor(key).socket.getInetAddress + " because of error", e) close(key) } } } } } logger.debug("Closing selector.") Utils.swallow(logger.info, selector.close()) shutdownComplete() }
好 , 咱们看看首先他有一个newConnections队列 用来存储SocketChannel 对象,实际上可以看成缓存请求的消息队列。
在 run方法中, 先清空了这个队列,同时在selector 中注册这些事件。然后又是nio的一段标准的程序。看看read 方法中都干了什么:
/**
* Handle a completed request producing an optional response
*/
private def handle(key: SelectionKey, request: Receive): Option[Send] = {
val requestTypeId = request.buffer.getShort()
if(requestLogger.isTraceEnabled) {
requestTypeId match {
case RequestKeys.Produce =>
requestLogger.trace("Handling produce request from " + channelFor(key).socket.getRemoteSocketAddress())
case RequestKeys.Fetch =>
requestLogger.trace("Handling fetch request from " + channelFor(key).socket.getRemoteSocketAddress())
case RequestKeys.MultiFetch =>
requestLogger.trace("Handling multi-fetch request from " + channelFor(key).socket.getRemoteSocketAddress())
case RequestKeys.MultiProduce =>
requestLogger.trace("Handling multi-produce request from " + channelFor(key).socket.getRemoteSocketAddress())
case RequestKeys.Offsets =>
requestLogger.trace("Handling offset request from " + channelFor(key).socket.getRemoteSocketAddress())
case _ => throw new InvalidRequestException("No mapping found for handler id " + requestTypeId)
}
}
val handler = handlerMapping(requestTypeId, request)
if(handler == null)
throw new InvalidRequestException("No handler found for request")
val start = time.nanoseconds
val maybeSend = handler(request)
stats.recordRequest(requestTypeId, time.nanoseconds - start)
maybeSend
}
关键是匹配事件之后,他们都干了什么。由于对scala 语法不是那么纯熟,不知道咱们的就调用到了
var response: MessageSetSend = null try { trace("Fetching log segment for topic, partition, offset, maxSize = " + fetchRequest) val log = logManager.getLog(fetchRequest.topic, fetchRequest.partition) if (log != null) { response = new MessageSetSend(log.read(fetchRequest.offset, fetchRequest.maxSize)) BrokerTopicStat.getBrokerTopicStat(fetchRequest.topic).recordBytesOut(response.messages.sizeInBytes) BrokerTopicStat.getBrokerAllTopicStat.recordBytesOut(response.messages.sizeInBytes) } else response = new MessageSetSend() }
也就是说 在消费消息的时候是把 内容封装到 MessageSetSend 中作为参数返回给客户端。
相关推荐
* 修改 server.properties 文件中参数值:broker 处理消息的最大线程数 num.network.threads=xxx,broker 处理磁盘 IO 的线程数 num.io.threads=xxx。 七、Producer 写入优化 * 定期批量写文件可以大幅度提高 ...
- `num.network.threads`和`num.io.threads`:分别表示网络处理和I/O处理的线程数量,用于提升并发处理能力。 - `log.dirs`:消息存储的目录,可以配置多个以逗号分隔。 - `socket.*`参数:与网络通信相关的缓冲...
Kafka参数配置详解 Kafka是一种流行的分布式流处理平台,用于构建实时数据管道和事件驱动的架构。为了确保Kafka集群的稳定运行和高性能,需要正确地配置Kafka参数。本文将详细介绍Kafka的参数配置,包括系统参数、...
- `network.host`: 设置为 `0.0.0.0` 以允许所有网络接口监听。 - `http.port`: 默认为 `9200`,保持不变或取消注释。 - `discovery.seed_hosts`: 必须配置,设置为 Elasticsearch 节点的 IP 列表,例如 `[...
2. **网络层**:`kafka.network.RequestHandler` 和 `kafka.network.Processor` 处理网络请求,`Selector` 类负责网络 I/O。 3. **消费者**:`kafka.consumer.SimpleConsumer` 和 `kafka.consumer....
* `num.network.threads`:Server 用来处理网络请求的网络线程数目;一般你不需要更改这个属性。 * `num.io.threads`:Server 用来处理请求的 I/O 线程的数目;这个线程数目至少要等于硬盘的个数。 * `background....
- `num.network.threads=3`:定义处理网络请求的线程数量。 - `num.io.threads=8`:定义执行I/O操作的线程数量。 - `log.dirs=/opt/kafka/kafkallogs/`:指定日志文件的存储路径。 - `socket.send.buffer.bytes=...
**Kafka.network 包** 包含了 Kafka 网络通信的核心代码,如客户端与 Broker 之间的通信协议等。了解这部分源码有助于深入理解 Kafka 如何高效地进行数据传输。 #### 六、Kafka Broker 的配置 **Kafka Broker** 的...
#### 5.1 Network Layer 网络层定义了 Kafka 与客户端间的通信协议,包括消息格式、错误处理等。 #### 5.2 Messages 消息是 Kafka 中的基本单位,包含键值对、时间戳等元数据。 #### 5.3 Message Format 消息格式...
- `num.network.threads` 和 `num.io.threads`:分别设置网络请求和磁盘 I/O 线程数量。 - `socket.*.bytes`:设置套接字缓冲区大小。 - `log.dirs`:日志文件的存储路径。 - `num.partitions`:默认每个主题的...
1. **broker配置**: 调整broker的配置参数如`num.network.threads`、`num.io.threads`等,以平衡处理能力与内存消耗。 2. **分区和副本策略**: 合理设置分区数量和副本数量,以实现高可用性和负载均衡。同时,根据...
### Kafka + Zookeeper 集群安装教程 #### 一、环境准备 本文档将指导您如何在CentOS 7.4环境下安装并配置Kafka和独立的Zookeeper集群。安装过程中使用的具体版本为Zookeeper 3.4.12 和 Kafka 2.12-2.0.0。目标系统...
- **配置项**: `log.dirs=/data/data1/kafka/kafka-logs,/data/data2/kafka/kafka-logs,/data/data3/kafka/kafka-logs,/data/data4/kafka/kafka-logs,/data/data5/kafka/kafka-logs` - **作用**: 指定日志文件的存储...
- 在`/etc/sysconfig/network-scripts/ifcfg-ens33`中进行配置。 - 修改`BOOTPROTO`为`static`。 - 添加具体的IP地址、网关和子网掩码信息。 #### hostname与hosts文件配置 - **hostname配置**:每个虚拟机都...
14. **num.io.threads / num.network.threads**: IO线程和网络线程的数量,分别处理磁盘I/O和网络通信。 15. **log.retention.hours / log.retention.bytes**: 日志保留的小时数或总字节数。达到任一条件,旧的日志...
1. **num.io.threads**和**num.network.threads**:IO线程和网络线程的数量,根据硬件资源进行调整。 2. **message.max.bytes**和**max.message.bytes**:限制单个消息的最大大小。 以上只是Kafka集群配置的部分...
-manager,Docker-compose脚本,使用之前需要手动配置文件中的zookeeper链接,使用之前需要先创建Docker网络: docker network create zoo_kafka。 Docker镜像使用的是:wurstmeister/kafka、sheepkiller/kafka-...
- `num.network.threads`:处理网络请求的线程数。 - `num.io.threads`:执行I/O操作的线程数。 - `socket.send.buffer.bytes`:套接字发送缓冲区大小。 - `socket.receive.buffer.bytes`:套接字接收缓冲区大小...
- 其他配置如 `num.network.threads`, `num.io.threads`, `socket.send.buffer.bytes`, `socket.receive.buffer.bytes` 等,可以根据实际需求调整。 6. **启动 Kafka 和 ZooKeeper**: - 启动 ZooKeeper 服务,...
### Kafka详细配置解析 #### 一、Zookeeper配置(zoo.cfg) Kafka集群依赖于Zookeeper进行协调管理,因此Kafka的配置中通常会包含Zookeeper的基本配置信息。 ##### Tick Time (tickTime) - **定义**: Zookeeper的...