5月23日Confluent官方宣布Apache Kafka 0.10正式发布。该版本包含了很多新功能和优化,这里列出比较重要的几项:
- Streams
如果你有这样的需求,从Kafka拉取数据进行流处理然后再推送回Kafka,那么你会喜欢0.10的Kafka Streams。Kafka Streams是一个类库,它实现了一系列流处理动作(例如join,filter,aggregate等),能够帮助你构建一个功能齐全的低延迟的流处理系统。它支持有状态或无状态的处理,并且能够被部署在各种框架和容器中(例如YARN,Mesos,Docker),也可以集成在Java应用里。
- 机架感知
和Hadoop一样,Kafka现在也实现了机架感知。如果所有备份都在单个机架上,那么一旦这个机架出问题,那么所有的备份都将失效。现在Kafka会让备份分布在不同的机架上,显著的提高了可用性。
- Message中加入Timestamp
在Message中加入了Timestamp,如果没有被用户声明,该字段会被自动设为被发送的时间。这使得Kafka Streams实现了基于时间事件的流处理,你也可以使用Timestamp来实现消息的追踪查找。除次之外Message中还加入了checksum(但并不是保存在Kafka中,只是取出来之后计算),可以以比较小的代价比对Message。
- SASL增强
Kafka0.9提供了SASL/Kerberos,在0.10中增加了更多的SASL功能,比如SASL/Plaintext
- Kafka Connect Rest API
在之前的版本中,用户只能通过log来监控Connector的状态。在0.10中增加了监控和控制的API,可以列出所有的Connector状态,并且可以暂停或重启任务。
- Kafka Consumer Max Record
在0.9中,如果想要控制Consumer的单次请求返回数据量,只能控制timeout的大小,0.10加入新的Consumer参数max.poll.records来控制返回的数据条数。
相关推荐
在你提供的压缩包"Kafka0.10软件包以及安装步骤 - 副本.rar"中,包含了Kafka 0.10版本的安装资料和可能的配置文件,这对于初学者或需要升级到0.10版本的用户来说非常有用。Kafka 0.10是一个重要的里程碑,引入了更多...
【Kafka 0.10.2.1 集群搭建详解】 Kafka 是一个分布式流处理平台,常用于实时数据管道和流应用。在0.10.2.1版本中,Kafka 提供了更稳定和高效的数据处理能力。搭建 Kafka 集群涉及多个步骤,包括环境准备、配置、...
Kafka 0.10.0.1是Kafka发展历史上的一个重要里程碑,它引入了多项改进和新特性,如更强大的消费者API、更好的故障恢复机制和增强的安全性。然而,值得注意的是,这个版本在发布时,虽然官方并未明确声明最低JDK要求...
Kafka的核心特性包括: 1. **高效的消息队列**:Kafka设计为高吞吐量的发布/订阅消息系统,可以处理每秒数十万条消息。 2. **持久化存储**:Kafka将消息持久化到磁盘,可以配置保留策略,保证消息的可靠传输。 3. *...
本文将深入探讨Kafka的核心特性、0.10.0.0版本的新功能以及如何在JDK1.7中部署和使用Kafka。 一、Kafka核心特性 1. 高吞吐量:Kafka设计之初的目标就是处理大规模的数据流,它能以MB/s的速度处理数十亿的消息。 2...
现在我们来看看0.10.2.0版本的关键特性: 1. **高可用性**:Kafka通过复制机制保证了数据的高可用,每个分区都有多个副本,当主副本故障时,其他副本可以接管。 2. **持久化**:Kafka将消息存储在磁盘上,可以设置...
首先,Kafka 0.10.0.1是Kafka的一个重要里程碑,它引入了多项关键改进和新特性。这个版本加强了对安全性的支持,包括SSL/TLS加密和SASL认证,使得Kafka在企业级应用中更加可靠。此外,它优化了Producer的性能,提升...
本篇文章将深入探讨Kafka 2.11-0.10.1.1这一特定版本的特性、工作原理及其在实际应用中的价值。 一、Kafka简介 Kafka是一种高吞吐量、可扩展的分布式发布订阅消息系统,设计目标是处理实时数据流。它能够处理PB...
在本文中,我们将深入探讨Kafka 2.11-0.10.0.1这一特定版本的关键特性、架构和实际应用。 一、Kafka的核心概念 1. 主题(Topics):主题是Kafka中的数据存储单元,类似于数据库中的表。用户可以创建多个主题,每个...
- **新工具**:提供了更多的管理工具,如Kafka Connect用于集成其他系统,Kafka Streams用于轻量级流处理。 3. **Kafka架构**: - **Broker**:Kafka集群中的服务器节点,负责存储和转发消息。 - **Zookeeper**...
在本文中,我们将深入探讨`kafka_2.10-0.10.1.0`版本的特性和功能。 1. **Kafka的基本概念** - **主题(Topics)**:主题是数据的分类,类似于数据库中的表,消息按照主题进行组织。 - **分区(Partitions)**:...
2. **Kafka 0.10.1.0特性** - **新消费者API**:0.10.1.0版本引入了新的消费者API,提供了更高级别的抽象,简化了消费者编程模型,支持自动分区平衡和幂等性写入。 - **幂等性生产者**:幂等性生产者确保即使在...
二、Kafka 0.10.2.2的主要特性 1. 支持幂等性生产者:在0.10.2.2版本中,Kafka引入了幂等性生产者,确保同一消息不会被重复写入,增强了数据一致性。 2. 高级消费者API:这个版本提供了更加强大且易用的Java和...
4. **实时处理**:Kafka支持实时数据处理,允许应用程序实时消费新产生的数据流。 5. **可扩展性**:Kafka集群可以通过添加更多节点轻松扩展,以应对更大的数据量和更高的并发需求。 三、使用场景 1. **日志收集*...
2. **Kafka的特性**: - **高吞吐量**:Kafka设计时考虑了大数据的处理速度,能够处理每秒数十万条消息。 - **持久化**:Kafka将消息写入磁盘,可配置保留策略,如按时间或大小进行删除。 - **容错性**:通过副本...
2. **Kafka的特性**: - **高吞吐量**:设计时考虑了大规模数据传输,能处理数百万条消息每秒。 - **持久化**:消息被写入磁盘,可配置为保留一定时间或达到特定大小后删除,确保数据可靠性。 - **复制与容错**:...
这个压缩包文件 "kafka_2.12-0.10.2.1.tgz" 提供了 Kafka 的特定版本,即 0.10.2.1,针对 Scala 2.12 编译的版本。Scala 是一种多范式编程语言,它结合了面向对象和函数式编程的概念,使得 Kafka 这样的复杂系统开发...
在这个版本,即Kafka 2.10-0.10.1.0,主要面向的是Java 2.10 SDK,提供了稳定且高效的特性,适用于各种大数据应用场景。本文将深入探讨在Windows操作系统上安装、配置和使用Kafka 2.10-0.10.1.0的全过程,以及如何...
其设计灵感来源于传统的消息系统,但Kafka有其独特的架构和特性,能够应对大规模的数据处理。 首先,Kafka具有主题和日志的结构。主题是消息的分类目录,用于发布和订阅消息。每一个主题都包含一个分区日志,该分区...
2. **Kafka的特性**: - **高吞吐量**:Kafka设计为高吞吐量的消息系统,能够处理每秒数十万条消息。 - **持久化**:消息默认会被持久化到硬盘,以防止数据丢失。 - **复制**:通过副本机制,Kafka能提供高可用性...