kafka笔记
1/kafka是一个分布式的消息缓存系统
2/kafka集群中的服务器都叫做broker
3/kafka有两类客户端,一类叫producer(消息生产者),一类叫做consumer(消息消费者),客户端和broker服务器之间采用tcp协议连接
4/kafka中不同业务系统的消息可以通过topic进行区分,而且每一个消息topic都会被分区,以分担消息读写的负载
5/每一个分区都可以有多个副本,以防止数据的丢失
6/某一个分区中的数据如果需要更新,都必须通过该分区所有副本中的leader来更新
7/消费者可以分组,比如有两个消费者组A和B,共同消费一个topic:order_info,A和B所消费的消息不会重复
比如 order_info 中有100个消息,每个消息有一个id,编号从0-99,那么,如果A组消费0-49号,B组就消费50-99号
8/消费者在具体消费某个topic中的消息时,可以指定起始偏移量
集群安装
1、解压
2、修改server.properties
broker.id=1
zookeeper.connect=weekend05:2181,weekend06:2181,weekend07:2181
3、将zookeeper集群启动
4、在每一台节点上启动broker
bin/kafka-server-start.sh config/server.properties
5、在kafka集群中创建一个topic
bin/kafka-topics.sh --create --zookeeper weekend05:2181 --replication-factor 3 --partitions 1 --topic order
6、用一个producer向某一个topic中写入消息
bin/kafka-console-producer.sh --broker-list weekend:9092 --topic order
7、用一个comsumer从某一个topic中读取信息
bin/kafka-console-consumer.sh --zookeeper weekend05:2181 --from-beginning --topic order
8、查看一个topic的分区及副本状态信息
bin/kafka-topics.sh --describe --zookeeper weekend05:2181 --topic order
启动时把标准输出定位到空文件上去(1>/tmp/null),把异常信息输出到1上去(2>&1) &表示后台运行
bin/kafka-server-start.sh config/server.properties 1>/tmp/null 2>&1 &
相关推荐
**Kafka笔记** Kafka是一种分布式流处理平台,由LinkedIn开发并在Apache软件基金会下开源。它最初设计的目标是构建一个高吞吐量、低延迟的消息系统,现在已经成为大数据领域的重要组件,广泛应用于日志收集、实时...
【标题】"Kafka笔记资料代码.zip"是一个与Apache Kafka相关的学习资源压缩包,其中包含了对Kafka这一大数据处理框架的深入理解和实践操作。Kafka是一个分布式流处理平台,广泛应用于实时数据管道和流应用中。 ...
kafka笔记kafka笔记kafka笔记kafka笔记kafka笔记kafka笔记
Kafka笔记 Kafka是LinkedIn开发的一个内部基础设施系统,旨在处理持续数据流。Kafka的设计理念是将数据看作是一个持续变化和不断增长的流,基于这样的想法构建出一个数据系统,一个数据架构。Kafka外在表现很像消息...
Kafka是一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。在本课程中,你将学习到,Kafka架构原理、安装配置使用、详细的...
kafka笔记,记录从部署到底层原理各个方面 适合小伙伴们进行学习
Kafka 是一个开源的分布式流处理平台,最初由 LinkedIn 开发,后来成为 Apache 软件基金会的顶级项目。Kafka 设计的核心理念是处理持续的数据流,它不仅是一个消息中间件,而且是一个强大的流处理平台,能够支持实时...
kafka学习笔记(一) ================= 本人整理的学习笔记,该笔记目前只有第一版,适合初学者初步了解kafka
**Kafka概述** Kafka是Apache软件基金会的一个关键项目,由LinkedIn公司最初设计,并最终以Scala和Java语言实现。作为一个高性能、分布式的流处理平台,Kafka被广泛应用于实时数据管道和流应用之中。它的核心功能是...
【Kafka学习笔记】 Kafka是由LinkedIn开发的分布式日志系统,后来成为Apache顶级开源项目。它是一个设计为高吞吐、低延迟的系统,特别适用于处理和存储大量实时数据。Kafka的主要特点包括分布式、分区、多副本以及...
自己整理的B站多易涛哥Kafka的笔记,欢迎浏览,有问题请随时提出,互相交流。
kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列学习笔记,kafka消息队列...
Kafka 是一个高性能、分布式的消息中间件,常用于大数据实时处理和流数据平台。它的核心设计目标是提供高吞吐量、低延迟的消息传递服务,同时保证数据的可靠性和持久性。 1. **高吞吐量与分布式架构**:Kafka 能够...
本套学习笔记将带你深入理解Kafka的核心概念、架构设计以及实战技巧。 一、Kafka概述 Kafka是一个高吞吐量的分布式发布订阅消息系统,它的主要特性包括持久化、分区、复制和并行处理。Kafka的设计目标是提供低延迟...
afka的消费模式与消费者组Kafka提供了两种消费模式:单消费者模式和消费者组模式。单消费者模式中,一个消费者实例负责消费所有分区,适合小规模的低并发场景。而消费者组模式则是Kafka高并发、高可用的核心特性,多...
Kafka 文章目录Kafka架构名次解释Producer(生产者)命令使用脚本常用参数举例分区策略发送返回值幂等性Consumer(消费者)命令使用脚本常用参数举例分配策略Topic(主题)命令使用脚本常用参数举例Kafka高读写 一个...
### Kafka学习详细文档笔记 #### 一、入门 **1、简介** Kafka是由LinkedIn开源的一款分布式的流处理平台,其核心功能在于消息传递。它能够处理大量的实时数据流,并且具备高性能、高吞吐量的特点。Kafka采用发布...
IT十八掌第三期配套笔记! 1、kafka消息系统的介绍 2、producer有分区类 3、kafka支持的副本模式 4、kafka消费者偏移量考察 5、kafka自定义消费者 6、kafka自定义生产者 7、kafka带分区生产者 8、flume集成kafka的几...
【Kafka学习笔记】 Kafka是一款高性能的分布式消息中间件,广泛应用于大数据实时处理和流处理领域。它具有高吞吐量、低延迟、可扩展性以及容错性等特点,常用于日志收集、监控数据聚合、用户行为追踪等多个场景。 ...