3、安装kafka
wget https://archive.apache.org/dist/kafka/0.8.0/kafka_2.8.0-0.8.0.tar.gz
tar -zxvf kafka_2.8.0-0.8.0.tar.gz
配置kafka,修改文件server.properties
vim server.properties
broker.id=0
listeners=PLAINTEXT://:9092
log.dirs=/home/xxxx/kafkalog
zookeeper.connect=127.0.0.1:60301,127.0.0.1:60302,127.0.0.1:60303
zookeeper.connection.timeout.ms=6000
配置kafka下zookeeper
vim zookeeper.properties
上图中的dataDir和dataLogDir可以依据自己建立的文件夹路径填写。
启动和关闭kafka脚本
bin/kafka-server-start.sh -daemon config/server.properties &
(1)创建kafka脚本
vim kafkastart.sh
(2)创建关闭kafka脚本
vim kafkastop.sh
(3)添加脚本执行权限
chmod +x kafkastart.sh
chmod +x kafkastop.sh
(4)设置脚本开机启动自动执行
vim /etc/rc.d/rc.local
测试kafka
(1)创建主题
bin/kafka-topics.sh --create --zookeeper localhost:60301 --replication-factor 1 --partitions 1 --topic test
检查主题是否创建成功
bin/kafka-topics.sh --list --zookeeper localhost:60301
(2)启动producer
bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
如上图所示,输入hello kafka!后,回车
然后另外打开一个shell终端
在此终端下启动consumer
bin/kafka-console-consumer.sh --zookeeper localhost:60301 --topic test --from-beginning
由上图可见,终端1生产者下所输入的hello kafka!,在终端2下的消费者下显现,至此kafka的单机安装部署完成。
(6)关闭kafka
直接kill 进程
一、Zookeeper安装
1、解压缩安装、配置系统环境变量 ZOOKEEPER_HOME,PATH
2、单机模式
1、mv conf/zoo_sample.cfg /conf/zoo.cfg
2、vi zoo.cfg
修改dataDir=/home/Zachary/hadoop/hadoop-1.2.1/tmp/zookeeper,可修改clientPort和增加dataLogDir,在log4j.properties设置:zookeeper.log.dir=xxx;zookeeper.tracelog.dir=xxx,并修改bin/zkEnv.sh: ZOO_LOG_DIR=/home/Zachary/hadoop/hadoop-2.6.0/tmp/zookeeper
ZOO_LOG4J_PROP="INFO,ROLLINGFILE"
3、启动zkServer.sh start|stop|status;zkCli.sh -server rd3:61300 命令行操作(zkCli.sh默认是本机和2181端口)
3、集群模式
1、mv conf/zoo_sample.cfg /conf/zoo.cfg
2、修改clientPort=61300
3、vi zoo.cfg
修改dataDir=/home/Zachary/hadoop/hadoop-1.2.1/tmp/zookeeper
增加:rd3为ip或者为hostname 同一台机上端口需要改变 server下面添加的配置必须顶格
server.0=rd3:61301:61302
server.1=pcm:61301:61302
server.2=cip:61301:61302
4、在dataDir目录下,创建文件myid,写入值0
5、scp到其它server(cip,pcm),同时配置环境变量和创建dataDir,在pcm创建myid并写入值1,在cip创建myid并写入值2
6、启动,分别在各节点上执行zkServer.sh start ;zkServer.sh stop 关闭;可以用zkServer.sh status查看状态
7、zkCli.sh -server rd3:61300 命令行操作(zkCli.sh默认是本机和2181端口)
ls / ;create /hadoop zach;get /hadoop
3、伪集群模式:与集群模式不同出就是在同一台机子装多个zookeeper,配置不同的dataDir和不同的端口
二、Kafka安装
修改conf/server.properties中
broker.id=0 --brokerid 集群唯一
zookeeper.connect=yeexun02:61300,yeexun03:61300,yeexun04:61300/kafka --zookeeper连接
log.dirs=/opt/mq/data/kafka --消息日志路径
num.partitions=3 --一个topic分成几个管道
default.replication.factor=2 --副本数
port=61100 --端口
#delete.topic.enable=true --可以删除topic
在运行脚本kafka_run_class.sh里面编辑 中找到LOG_DIR="$base_dir/logs"修改即可
/opt/mq/kafka/bin/kafka-server-start.sh -daemon /opt/mq/kafka/config/server.properties
分享到:
相关推荐
Kafka 集群搭建与使用详解 Kafka 是一种分布式流媒体平台,由 Apache 开源项目提供。它主要用来构建实时数据管道和流媒体处理系统。本文档将详细介绍 Kafka 集群的搭建和使用,包括创建、删除、生产者、消费者等...
本篇文档将详细介绍如何在Linux环境中搭建Kafka集群,同时结合Hadoop和Spark的分布式安装,构建一个完整的数据处理平台。 首先,搭建Kafka集群的基础条件包括: 1. 至少一台Linux服务器,但为了高可用性,推荐多台...
下面,我们将深入探讨Kafka的搭建过程及相关组件。 **一、Kafka的基本概念** 1. **主题(Topic)**:Kafka中的主题是数据的分类,类似于数据库的表,每个主题可以分为多个分区。 2. **分区(Partition)**:每个...
在本压缩包“kafka搭建.zip”中,我们聚焦于Apache Kafka的集群搭建过程,它是一个分布式流处理平台,常用于大数据实时处理、消息传递和日志聚合等场景。Kafka集群的构建离不开Zookeeper,这是一个分布式协调服务,...
### Kafka环境搭建详解 #### 一、概述 Apache Kafka 是一款分布式的流处理平台,具有高吞吐量、低延迟等特点,广泛应用于日志收集、流处理和消息系统等领域。本文将详细介绍如何在Windows和Linux环境下搭建Kafka...
Kafka是Linkedin于2010年12月份开源的消息系统,它主要用于处理活跃的流式数据。活跃的流式数据在Web应用中非常常见,这些数据包括网站的PV、用户访问了什么内容、搜索了什么内容等。这些数据通常以日志的形式记录...
在本文中,我们将深入探讨如何在Windows操作系统上搭建Apache Kafka的单机环境。Apache Kafka是一款分布式流处理平台,常用于构建实时数据管道和流应用。Kafka以其高吞吐量、低延迟和容错性而著称,是大数据领域的...
版本kafka_2.13-2.5.0. 官网下载太慢了,备份一下. 直接可以用 启动方法 方法一:加守护进程启动 bin/kafka-server-start.sh -daemon config/server.properties 方法二:通过后台来启动 nohup kafka-server-start.sh ...
搭建Kafka集群涉及到对虚拟机的安装配置、JDK环境的搭建、Zookeeper的安装配置等关键步骤。下面详细介绍各个知识点。 首先,虚拟机的安装是搭建Kafka集群的基础。文中提到了使用VMWare来安装三台虚拟机,并分配了...
本文将详细介绍如何搭建Redis和Kafka环境,并探讨它们各自的核心特性和应用场景。 首先,我们来了解Redis。Redis是一个高性能的键值数据库,常用于缓存、会话管理以及提供实时数据服务。它的主要特点是数据结构丰富...
【标题】:“kafka搭建套装.zip”所包含的是一份完整的Apache Kafka搭建教程与环境配置解决方案,适合初学者和有经验的开发者进行快速部署和问题排查。 【描述】:“20200326这里存放的是今日我搭建kafka过程中使用...
### Flume + Kafka环境搭建详解 #### 一、概述 Flume 和 Kafka 是大数据领域非常重要的两个组件。Flume 主要用于收集、聚合和移动大量日志数据,它具有高可靠性和可扩展性。Kafka 则是一个分布式流处理平台,能够...
### Kafka分布式集群搭建详解 #### 一、概述 Kafka是一种高性能、分布式的消息发布与订阅系统,被广泛应用于日志收集、流处理、消息传递等多个领域。为了提高系统的可用性与扩展性,通常会采用分布式集群的方式...
在本文中,我们将深入探讨如何使用给定的压缩包文件 "kafka搭建所需包_CodingPark" 来在Linux环境中搭建Apache Kafka和Zookeeper。Apache Kafka是一款分布式流处理平台,而Zookeeper则是一个分布式协调服务,它们是...
【Kafka集群搭建及测试】 Kafka是一种分布式流处理平台,常用于实时数据处理和大数据管道。本文档将详细介绍如何在三台Ubuntu 16虚拟机上搭建Kafka集群,并进行基本的测试,确保其正常运行。 **1. 准备工作** 在...
Kafka 集群搭建与使用 Kafka 是一种高吞吐量的分布式发布订阅消息系统,使用 Scala 编写。Kafka 拥有作为一个消息系统应该具备的功能,但是确有着独特的设计。Kafka 集群的搭建和使用是基于 Kafka 的设计理念和架构...
《Kafka搭建详解:从Windows单机到Linux集群》 Kafka是一款由Apache开发的分布式流处理平台,常用于实时数据处理和消息传递。本文将详细介绍如何在Windows单机环境、Linux单机环境以及Linux集群环境下搭建Kafka,...
dmhs搭建dm到kafka同步.md
kafka集群搭建方案 kafka集群搭建是大数据处理和实时数据处理的重要组件。下面是kafka集群搭建的详细方案: 一、准备工作 1. 关闭防火墙 关闭防火墙是kafka集群搭建的前提条件。可以使用systemctl disable ...