`

Kafka使用心得(2)—kafka介绍

 
阅读更多

Kafka使用心得

1. Kafka简单理解

 kafka是一个可靠的消息中间件,它的直接作用是将生产者和消费者进行解耦。和自己简单实现一个消息队列相比,kafuka具有可靠性、可扩展性、灵活性等优点。

可靠性:kafuka的消息会落盘,因此保证了消息不会被丢弃。

可扩展性:kafuka是一个分布式系统,很容易通过增加机器来进行水平扩展。

灵活性:kafuka的消息可以被多个消费者组进行消费,消息的终点很灵活。

 

2. Kafka框架

 

 

从图中能够看出Kafka包含了三个模块:生产者,消费者,存储节点。

 

2.1 生产者
 生产者就是生产消息的部门,可以按照一定的规则将消息发送到存储节点。这部分接触不过,就不过多讲解。

 

2.2存储节点

这部分是kafka的核心,kafka的高可用、高性能在这里实现。相关的一些名词有:

topic:消息的类型

partition:消息存储的分区,一个topic可以具有多个partition,一般来说一个partition的数据量不宜过大,一台机器可以处理的过来。

offset:每条消息在partition的位置。offset是partition的属性,每个partition都有自己一套offset。

brokers:kafka的一个实例,其实可以认为是部署kafka的一台机器,但一台机器上也可能有多个broker,每个broker占用该机器的不同端口。

leader:leader是针对partition来说的,每个partition可以有多个备份,每个备份都分布在不同的broker上,其中有一个是leader,对partition中信息的读取是从leader进行读取的,其它broker和leader进行同步。

offset manager:offset的管理者,管理offset,可以通过offset manager对offset进行管理。

 

2.3消费者

消费者被称为消费组,每一组消费者之间是没有相互关系的。通过引入消费组,kafka支持多个消费组,kafka的数据可以有多个去处。当只有一个消费组的时候是点对点的消息通信,当有多个消费组的时候是广播形式的消息通信。

kafka的消费者在0.9.0版本之前两套API,分别是High Consumer API和Simple Consumer API。在0.9.0以后(包括)新增了Kafka Client接口,New一个Client就可以使用Client里的函数进行消费,非常方便。

(ps:0.8.2已经有了Client,但该Client里的Consumer有问题,不能使用,只有Product能用)。

 

3. Kafka缺点

 

Kafka的文档太乱,Kafka目前发展比较快,每个版本都会有非常多的功能发布,非常多的功能调整。因此,导致不同版本的学习成本增加,但幸好新版本会兼容老版本的接口。0.8版本之前,没有Client,只有API接口调用,之后才封装了Client。

  • 大小: 68.1 KB
分享到:
评论

相关推荐

    kafka学习之路

    例如,Kafka会使用ZooKeeper来管理Broker列表、主题配置以及消费者的偏移量信息。 **4. Kafka的设计要点** - **高性能:** Kafka采用了高效的日志文件存储机制,并利用零拷贝技术提高读写性能。 - **可扩展性:** ...

    kafka学习资料.zip

    - 心得总结通常包含了实际使用中的经验教训和技巧,对于提升Kafka应用水平非常有价值。 6. **安装与配置** - 安装包提供了Kafka的二进制文件,包含启动脚本和配置文件,用户可以按照官方文档的指导进行安装和配置...

    大数据学习,主要涉及Kafka、ZooKeeper、Hive、HBase、Spark.zip

    大数据学习Coding Now那个项目规划的太乱了,所以想着把自己大数据相关的东西单独提出了,所以本项目只是记录自己的心得和看过的资源吧,至于刚才看过的比较好的文章还是会放置立即编码中“古今之成大事业、大学问者...

    study-spring-kafka

    说明手册本工程是按照 (使用事件和消息队列实现分布式事务)这个文章实现的。目前实现了注册用户成功...这篇文章学习心得:1.上面文章中的第2个图的EventPublish应该是EventProcess,至于为什么要把EventPublish和EventP

    微博热搜情绪分析.docx

    通过这个项目,学生可以学习如何使用 Python 爬虫技术获取数据,使用 Kafka 消息队列技术处理数据,使用 Spark 基于内存的分布式计算技术对数据进行计算和分析,并使用可视化工具对计算结果进行展示。 二、项目环境...

    sparkStreaming-offset-to-zk:手动管理spark streaming集成kafka的数据偏移量到zookeeper中

    下面是使用过程中记录的一些心得和博客,感兴趣的朋友可以了解下:项目简介该项目提供了一个在使用spark streaming2.3+kafka1.3的版本集成时,手动存储偏移量到zookeeper中,因为自带的checkpoint弊端太多,不利于...

    Spring 异步多线程动态任务处理的使用心得

    本文将深入探讨在Spring中如何利用多线程和动态任务来实现异步处理,并分享一些实践心得。 首先,我们要理解Spring的异步处理机制。Spring通过`@Async`注解实现了方法级别的异步执行。当一个带有`@Async`的方法被...

    streaming-offset-to-zk:一个手动管理spark streaming集成kafka时的偏移量到zookeeper中的小项目

    下面是使用过程中记录的一些心得和博客,感兴趣的朋友可以了解下: (1) (2) (3) (4) (5) (6) (7) (8) 项目简介 该项目提供了一个在使用spark streaming2.1+kafka0.9.0.0的版本集成时,手动存储偏移...

    读书心得--大型分布式网站架构设计与实践(陈康贤)

    书里可能会介绍RabbitMQ、Kafka等MQ产品,以及它们在处理高并发、异步任务中的应用场景。 6. **服务化与微服务**:服务化是将复杂系统拆分为可独立部署的服务,微服务更是强调小而自治的服务单元。书中会讨论服务...

    消息中间件学习案例与总结

    常见的消息中间件类型包括MQ(Message Queue)、RabbitMQ、Kafka、ActiveMQ等。 消息中间件的核心功能包括: 1. **异步处理**:通过消息队列,应用程序可以将耗时的任务放入队列,后续再由专门的消费者进程处理,...

    lnmp-code-analysis:PHP7Redis5NginxLinuxMysqlKafkaElasticSearchEtcd等等往复原理以及源码分析

    此文用于汇总PHP7 / Redis5 / Nginx / Linux / Mysql / Kafka / ElasticSearch / Etcd / Zookeeper等学习源码过程中的思考,整理与心得体会,后面会不断更新 个人博客链接地址如下: 【梦幻人生-用技术来点缀自己的...

    [详细完整版]大数据心得.doc

    ### 大数据心得知识点概述 #### 一、大数据时代的背景与意义 - **时代背景**:随着信息技术的迅速发展,互联网、移动通信等技术的进步,数据量呈现出爆炸性增长的趋势。这种现象不仅体现在日常生活中的社交媒体、...

    spring-boot-example:spring boot 相关实例合集,各Demo工程介绍详见README.md

    博客介绍 整合Apollo应用配置中心 Aop 整合阿里云Acm应用配置中心 基于切面与redis实现统一方法缓存 整合Dubbo 整合elasticsearch 拦截器 基于boot+Quartz定时任务调度平台 kafka 基于Redis分布式限流组件设计与使用...

    Mesos中文手册

    文档中还介绍了如何使用Marathon和Bamboo这样的Mesos框架,以及与之相关的用户文档和最佳实践。 为了配合文档的丰富内容,Mesos社区也提供了交流社区、Meetup技术沙龙和微信群,为社区成员提供交流和讨论的平台。...

    SpringCloud笔记.rar

    SpringCloud是中国开发者广泛使用的微服务框架,它基于Spring Boot实现,提供了一整套微服务解决方案。这份"SpringCloud笔记.rar"文件显然包含了作者在学习狂神(一位知名的IT教育从业者)关于SpringCloud课程时整理...

    android应用架构师职位描述与岗位职责任职要求.docx

    因此,需要深入理解安卓的消息机制、事件传递机制,娴熟自定义控件,并有UI优化实践及UI架构心得和经验。 2. 软件功能实现:安卓应用架构师需要依据项目进度与需求完成软件功能实现。这需要具备良好的编程习惯和...

    卓越亚马逊软件开发类笔试题

    可以使用消息队列服务(如RabbitMQ或Kafka)来处理这些事件并异步发送通知。 此外,为了优化性能和用户体验,可以使用缓存(如Redis)来存储用户最近的活动,减少数据库查询频率。同时,为了保护用户隐私,应设置...

    大厂超级详细的Java面试题.zip

    8. **中间件**:可能包含消息队列(如RabbitMQ、Kafka)、分布式服务治理(如Dubbo、Zookeeper)、分布式事务解决方案(如2PC、TCC)等内容。 9. **LeetCode解题算法**:通过LeetCode平台的题目来训练和提升算法...

    大数据面试题及面试经验分享.zip

    7. **流处理技术**:Kafka、Flink或Storm等流处理框架的使用场景和基本原理,例如消息队列Kafka的发布订阅模式,Flink的事件时间和处理时间等。 8. **数据清洗与预处理**:面试中可能会讨论数据清洗的挑战,如缺失...

    基于springboot+vue的MOBA类游戏攻略分享平台.zip

    这是一个基于SpringBoot和Vue.js开发的MOBA类游戏攻略分享平台的项目,旨在为玩家提供一个交流游戏策略、技巧和心得的在线社区。这个平台融合了现代化的Web技术和后端框架,以提供高效、易用的用户体验。下面将详细...

Global site tag (gtag.js) - Google Analytics