kafka 伪分布式集群搭建、排错
1.基于zookeeper集群
2.修改基本参数,启动即可
3.kafka、zookeeper关系(https://blog.csdn.net/u012635648/article/details/82498366)
3.1管理协调kafka服务
3.2保存kafka相关元数据
一 搭建:
1.1官网下载kafka,以kafka_2.11-2.1.0.tgz 为例
1.2 解压、配置环境变量、不配置也可以(用的时候写全路劲即可)
1.3 进入解压后的 config 文件夹下 eg:/kafka/kafka_2.11-2.1.0/config
1.4 配置文件server.properties
配置文件各项配置解释
- broker.id=0 #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
- (
- port=19092 #当前kafka对外提供服务的端口默认是9092
- host.name=192.168.7.100 #这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
- 有的新版本不是这个东西 是 listeners=PLAINTEXT://:9092
- 其实就是ip+端口,配置了监听就用监听下的,没配置 则从 java.net.InetAddress.getCanonicalHostName()返回
- )
- num.network.threads=3 #这个是borker进行网络处理的线程数
- num.io.threads=8 #这个是borker进行I/O处理的线程数
- log.dirs=/opt/kafka/kafkalogs/ #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
- socket.send.buffer.bytes=102400 #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
- socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
- socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
- num.partitions=1 #默认的分区数,一个topic默认1个分区数
- log.retention.hours=168 #默认消息的最大持久化时间,168小时,7天
- message.max.byte=5242880 #消息保存的最大值5M
- default.replication.factor=2 #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
- replica.fetch.max.bytes=5242880 #取消息的最大直接数
- log.segment.bytes=1073741824 #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
- log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168 ),到目录查看是否有过期的消息如果有,删除
- log.cleaner.enable=false #是否启用log压缩,一般不用启用,启用的话可以提高性能
- zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口
1.5 cp 几份server.properties 修改名字
- 配置内容按需修改,最基本的修改项如下
- broker.id 唯一项,每一个配置都不同
- listeners=PLAINTEXT://:9092 唯一项 默认监听9092 每个配置都不同
- log.dirs 这种东西分开
- zookeeper.connect zk的连接、逗号分隔。
1.6 解压下的bin目录 启动
kafka-server-start.sh + 配置文件 (-daemon参数 新版本 表示在后台运行,无需nohup命令)
二、报错、死活起不来
报错如下:
ERROR Invalid config, exiting abnormally (org.apache.zookeeper.server.quorum.QuorumPeerMain)
org.apache.zookeeper.server.quorum.QuorumPeerConfig$ConfigException: Error processing config/zookeeper.properti……
Caused by: java.lang.NumberFormatException: For input string: "group.initial.rebalance.delay.ms"at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65)
害的我一直以为配置文件错了 死活找最后一行 group.initial.rebalance.delay.ms
网上有人说,用kafka bin下的zk启动命令来起zk,很尬 其实不是这个原因
解决:
由于安装zk集群时候 安装的目录 和kafka的不在一个地方
Zk集群有个重要的东西 myid,Zookeeper启动的时候,读取myid文件中的server id,然后去zoo.cfg 中查找对应的配置,kafka又过来连 所以必须得有权限 (仅个人入门猜测)
如果是本机测试 直接 在kafka的目录下 chmod 777 / 即可
https://www.cnblogs.com/thinkingandworkinghard/p/6113069.html?utm_source=itdadao&utm_medium=referral kafka启动错误
相关推荐
本教程将有助于小白实现从零开始搭建kafka伪分布式集群
### Kafka分布式集群搭建详解 #### 一、概述 Kafka是一种高性能、分布式的消息发布与订阅系统,被广泛应用于日志收集、流处理、消息传递等多个领域。为了提高系统的可用性与扩展性,通常会采用分布式集群的方式...
Kafka分布式集群搭建.doc
内容涵盖Kafka集群的核心组件讲解、集群架构设计、分布式集群搭建与伪集群配置,帮助读者快速上手Kafka环境部署。 通过实战案例,深入解析Java Consumer与Producer的高级用法,包括手动提交Offset、数据回溯、...
需要的环境支持:jdk8,zookeeper端口为2181,然后将此压缩包的module目录解压到/opt下并直接运行cluster-kafka.sh即可。 注意:端口不能被占用 主要相关文档: ...
Kafka分布式集群安装部署 Kafka是一个流行的分布式消息队列系统,广泛应用于大数据处理、实时数据处理和流处理等领域。为了确保Kafka的高可用性和可靠性,需要安装和部署分布式集群。本文将详细介绍Kafka分布式集群...
课程内容包括了Kafka java Consumer实战,Kafka集成框架,Kafka分布式集群架构,Kafka性能测试实战,Kafka集群监控实战,Kafka用户行为画像,Kafka性能存储优化及如何提高Kafka吞吐量等企业级技术。 视频大小:1.5G
window 搭建开发kafka集群:我的集群目录:F:\liuzhiwen\cluster\tech\kafka_cluster 需要切换到指定的目录:命令行切换cd F:\liuzhiwen\cluster\tech\kafka_cluster\k1\bin\windows 分别启动:kafka-server-start....
标题中的“kafka自定义伪分布式安装.zip”表明这是一个关于Apache Kafka的自定义伪分布式安装教程的压缩包。Apache Kafka是一种流行的开源流处理平台,常用于构建实时数据管道和流应用。它允许用户以高吞吐量、低...
Kafka技术实战学习的优选课程,课程内容全程实战,没有拖泥带水,但不包含基础知识的教学,需要同学们先具备一定的Kafka技术基础再进行学习。课程内容包括了Kafka java Consumer实战,Kafka集成框架等。
ELK+FileBeat+Kafka分布式系统搭建图文教程 本教程详细记录了ELK+FileBeat+Kafka分布式系统的搭建流程和步骤,为大家快速上手提供了详细的指导。本系统由FileBeat、Kafka、Logstash、Elasticsearch、Kibana五个组件...
总之,Kafka和Zookeeper的集群搭建是构建大规模分布式系统的关键步骤。理解它们的工作原理和配置方法对于任何IT专业人员来说都是非常有价值的技能。通过以上步骤,你可以成功地部署一个可靠的Kafka和Zookeeper集群,...
综合案例:构建互联网高并发分布式服务器集群是分布式集群技术的实践经验,Hadoop 生态圈简介、Hadoop 伪分布式环境搭建、Hadoop 计算模型 MapReduce 例子说明等内容将为读者提供了分布式集群技术的实践经验。...
**KAFKA分布式消息系统在Windows环境下的搭建与应用** KAFKA是一个高吞吐量的分布式消息系统,由LinkedIn开发并开源,现在是Apache软件基金会的顶级项目。它主要设计用于处理实时流数据,允许应用程序发布和订阅...
本篇文档将详细介绍如何在Linux环境中搭建Kafka集群,同时结合Hadoop和Spark的分布式安装,构建一个完整的数据处理平台。 首先,搭建Kafka集群的基础条件包括: 1. 至少一台Linux服务器,但为了高可用性,推荐多台...
centos大数据分布式集群搭建,包含hadoop spark hbase hive solr elasticsearch redis zookeeper rocketmq mongodb mariadb storm kafka docker
自己整理的Hadoop环境的一些安装,和一些简单的使用,其中包括Hadoop、hbase、hive、mysql、zookeeper、Kafka、flume。都是一些简单的安装步骤和使用,只在自己的虚拟机(Linux centOS7)上使用测试过。按照步骤一步...
在分布式环境中,通常需要多台服务器来运行Kafka集群,但为了测试或学习目的,可以使用单机上的伪分布式设置,这使得开发者能够在本地环境中快速搭建Kafka实例,而无需复杂的网络配置。 标签中的“kafka”、...
分布式集群电商平台搭建方案 在构建大型的电商平台时,分布式集群技术是不可或缺的组成部分。它能够提高系统的可扩展性、容错性和性能,确保在高并发访问下也能稳定运行。本方案将详细介绍如何使用Java实现一个...