`
TableMiao
  • 浏览: 75021 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

kafka 伪分布式集群搭建、排错

阅读更多

kafka 伪分布式集群搭建、排错

1.基于zookeeper集群

2.修改基本参数,启动即可

 

3.kafka、zookeeper关系(https://blog.csdn.net/u012635648/article/details/82498366

   3.1管理协调kafka服务

   3.2保存kafka相关元数据

 

一 搭建:

 1.1官网下载kafka,以kafka_2.11-2.1.0.tgz 为例

 1.2 解压、配置环境变量、不配置也可以(用的时候写全路劲即可)

 1.3 进入解压后的 config 文件夹下  eg:/kafka/kafka_2.11-2.1.0/config

 1.4 配置文件server.properties

   配置文件各项配置解释

  •    broker.id=0  #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
  • port=19092 #当前kafka对外提供服务的端口默认是9092
  • host.name=192.168.7.100 #这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
  •  有的新版本不是这个东西   是 listeners=PLAINTEXT://:9092
  •  其实就是ip+端口,配置了监听就用监听下的,没配置 则从 java.net.InetAddress.getCanonicalHostName()返回
  • num.network.threads=3 #这个是borker进行网络处理的线程数
  • num.io.threads=8 #这个是borker进行I/O处理的线程数
  • log.dirs=/opt/kafka/kafkalogs/ #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
  • socket.send.buffer.bytes=102400 #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
  • socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
  • socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
  • num.partitions=1 #默认的分区数,一个topic默认1个分区数
  • log.retention.hours=168 #默认消息的最大持久化时间,168小时,7天
  • message.max.byte=5242880  #消息保存的最大值5M
  • default.replication.factor=2  #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
  • replica.fetch.max.bytes=5242880  #取消息的最大直接数
  • log.segment.bytes=1073741824 #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
  • log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168 ),到目录查看是否有过期的消息如果有,删除
  • log.cleaner.enable=false #是否启用log压缩,一般不用启用,启用的话可以提高性能
  • zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口

 

1.5 cp 几份server.properties  修改名字

  •    配置内容按需修改,最基本的修改项如下
  •    broker.id  唯一项,每一个配置都不同
  •    listeners=PLAINTEXT://:9092  唯一项  默认监听9092 每个配置都不同
  •    log.dirs   这种东西分开  
  •    zookeeper.connect  zk的连接、逗号分隔。

 

1.6 解压下的bin目录 启动

    kafka-server-start.sh  + 配置文件  (-daemon参数   新版本 表示在后台运行,无需nohup命令)

 

 

二、报错、死活起不来

  报错如下:

     ERROR Invalid config, exiting abnormally (org.apache.zookeeper.server.quorum.QuorumPeerMain)
org.apache.zookeeper.server.quorum.QuorumPeerConfig$ConfigException: Error processing config/zookeeper.properti……

 

Caused by: java.lang.NumberFormatException: For input string: "group.initial.rebalance.delay.ms"at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65)

 害的我一直以为配置文件错了  死活找最后一行 group.initial.rebalance.delay.ms

 网上有人说,用kafka  bin下的zk启动命令来起zk,很尬  其实不是这个原因

 

 解决:

       由于安装zk集群时候  安装的目录  和kafka的不在一个地方

       Zk集群有个重要的东西 myid,Zookeeper启动的时候,读取myid文件中的server id,然后去zoo.cfg 中查找对应的配置,kafka又过来连 所以必须得有权限 (仅个人入门猜测)

       如果是本机测试  直接 在kafka的目录下  chmod 777 /  即可

 

     https://www.cnblogs.com/thinkingandworkinghard/p/6113069.html?utm_source=itdadao&utm_medium=referral  kafka启动错误

 

 

分享到:
评论

相关推荐

    kafka分布式集群搭建

    ### Kafka分布式集群搭建详解 #### 一、概述 Kafka是一种高性能、分布式的消息发布与订阅系统,被广泛应用于日志收集、流处理、消息传递等多个领域。为了提高系统的可用性与扩展性,通常会采用分布式集群的方式...

    Kafka集群调优实战+分布式集群搭建,分布式集群搭建与调优实战,Kafka专家之路!课程内容全程实战,没有拖泥带水

    内容涵盖Kafka集群的核心组件讲解、集群架构设计、分布式集群搭建与伪集群配置,帮助读者快速上手Kafka环境部署。 通过实战案例,深入解析Java Consumer与Producer的高级用法,包括手动提交Offset、数据回溯、...

    kafka伪分布式集群安装压缩包

    需要的环境支持:jdk8,zookeeper端口为2181,然后将此压缩包的module目录解压到/opt下并直接运行cluster-kafka.sh即可。 注意:端口不能被占用 主要相关文档: ...

    Kafka分布式集群安装部署.doc

    Kafka分布式集群安装部署 Kafka是一个流行的分布式消息队列系统,广泛应用于大数据处理、实时数据处理和流处理等领域。为了确保Kafka的高可用性和可靠性,需要安装和部署分布式集群。本文将详细介绍Kafka分布式集群...

    Kafka集群调优实战+分布式集群搭建-视频教程网盘链接提取码下载 .txt

    课程内容包括了Kafka java Consumer实战,Kafka集成框架,Kafka分布式集群架构,Kafka性能测试实战,Kafka集群监控实战,Kafka用户行为画像,Kafka性能存储优化及如何提高Kafka吞吐量等企业级技术。 视频大小:1.5G

    window 伪分布式kafka集群

    window 搭建开发kafka集群:我的集群目录:F:\liuzhiwen\cluster\tech\kafka_cluster 需要切换到指定的目录:命令行切换cd F:\liuzhiwen\cluster\tech\kafka_cluster\k1\bin\windows 分别启动:kafka-server-start....

    kafka自定义伪分布式安装.zip

    标题中的“kafka自定义伪分布式安装.zip”表明这是一个关于Apache Kafka的自定义伪分布式安装教程的压缩包。Apache Kafka是一种流行的开源流处理平台,常用于构建实时数据管道和流应用。它允许用户以高吞吐量、低...

    Kafka集群调优实战+分布式集群搭建

    Kafka技术实战学习的优选课程,课程内容全程实战,没有拖泥带水,但不包含基础知识的教学,需要同学们先具备一定的Kafka技术基础再进行学习。课程内容包括了Kafka java Consumer实战,Kafka集成框架等。

    ELK+FileBeat+Kafka分布式系统搭建图文教程.docx

    ELK+FileBeat+Kafka分布式系统搭建图文教程 本教程详细记录了ELK+FileBeat+Kafka分布式系统的搭建流程和步骤,为大家快速上手提供了详细的指导。本系统由FileBeat、Kafka、Logstash、Elasticsearch、Kibana五个组件...

    Kafka和Zookeeper集群搭建

    总之,Kafka和Zookeeper的集群搭建是构建大规模分布式系统的关键步骤。理解它们的工作原理和配置方法对于任何IT专业人员来说都是非常有价值的技能。通过以上步骤,你可以成功地部署一个可靠的Kafka和Zookeeper集群,...

    分布式集群技术.pdf

    综合案例:构建互联网高并发分布式服务器集群是分布式集群技术的实践经验,Hadoop 生态圈简介、Hadoop 伪分布式环境搭建、Hadoop 计算模型 MapReduce 例子说明等内容将为读者提供了分布式集群技术的实践经验。...

    KAFKA分布式消息系统(window)

    **KAFKA分布式消息系统在Windows环境下的搭建与应用** KAFKA是一个高吞吐量的分布式消息系统,由LinkedIn开发并开源,现在是Apache软件基金会的顶级项目。它主要设计用于处理实时流数据,允许应用程序发布和订阅...

    分布式集群系统架构设计及应用部署.pdf

    同时,系统架构还包括分布式集群环境的搭建、数据库集群系统的构建、ZooKeeper 集群部署和 Kafka 集群部署等。 分布式系统架构设计的主要目的是为了提高系统的高吞吐、高并发和高可靠性能。为了实现这一目标,系统...

    kafka集群搭建文档

    本篇文档将详细介绍如何在Linux环境中搭建Kafka集群,同时结合Hadoop和Spark的分布式安装,构建一个完整的数据处理平台。 首先,搭建Kafka集群的基础条件包括: 1. 至少一台Linux服务器,但为了高可用性,推荐多台...

    大数据分布式集群环境搭建.docx

    centos大数据分布式集群搭建,包含hadoop spark hbase hive solr elasticsearch redis zookeeper rocketmq mongodb mariadb storm kafka docker

    大数据hadoop分布式集群搭建(Hadoop、hbase、hive、mysql、zookeeper、Kafka、flume)

    自己整理的Hadoop环境的一些安装,和一些简单的使用,其中包括Hadoop、hbase、hive、mysql、zookeeper、Kafka、flume。都是一些简单的安装步骤和使用,只在自己的虚拟机(Linux centOS7)上使用测试过。按照步骤一步...

    windows下kafka_2.12-2.9.0.rar(含单机伪分布式配置)

    在分布式环境中,通常需要多台服务器来运行Kafka集群,但为了测试或学习目的,可以使用单机上的伪分布式设置,这使得开发者能够在本地环境中快速搭建Kafka实例,而无需复杂的网络配置。 标签中的“kafka”、...

    分布式集群电商平台搭建方案 代码

    分布式集群电商平台搭建方案 在构建大型的电商平台时,分布式集群技术是不可或缺的组成部分。它能够提高系统的可扩展性、容错性和性能,确保在高并发访问下也能稳定运行。本方案将详细介绍如何使用Java实现一个...

    Kafka分布式消息系统实战(与Java+Scala+Hadoop+Storm集成)

    Kafka是分布式的消息队列,作为云计算服务的基石,它广泛的应用在实时数据流方面,是实时数据处理的数据中枢,广泛应用在很多互联网企业,例如:linkedin,facebook,腾讯,百度,阿里等。实时数据流是现在互联网...

Global site tag (gtag.js) - Google Analytics