1 kafka集群搭建
1.zookeeper集群 搭建在110, 111,112 2.kafka使用3个节点110, 111,112 修改配置文件config/server.properties broker.id=110 host.name=192.168.1.110 log.dirs=/usr/local/kafka_2.10-0.8.2.0/logs 复制到其他两个节点,然后修改对应节点上的config/server.pro 3.启动,在三个节点分别执行 bin/kafka-server-start.sh config/server.properties >/dev/null 2>&1 & 4 创建主题 bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 3 --topic test 5 查看主题详细 bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test --topic test Topic:test PartitionCount:3 ReplicationFactor:3 Configs: Topic: test Partition: 0 Leader: 110 Replicas: 110,111,112 Isr: 110,111,112 Topic: test Partition: 1 Leader: 111 Replicas: 111,112,110 Isr: 111,112,110 Topic: test Partition: 2 Leader: 112 Replicas: 112,110,111 Isr: 112,110,111 6 去zk上看kafka集群 [zk: localhost:2181(CONNECTED) 5] ls / [admin, zookeeper, consumers, config, controller, zk-fifo, storm, brokers, controller_epoch] [zk: localhost:2181(CONNECTED) 6] ls /brokers ----> 查看注册在zk内的kafka [topics, ids] [zk: localhost:2181(CONNECTED) 7] ls /brokers/ids [112, 110, 111] [zk: localhost:2181(CONNECTED) 8] ls /brokers/ids/112 [] [zk: localhost:2181(CONNECTED) 9] ls /brokers/topics [test] [zk: localhost:2181(CONNECTED) 10] ls /brokers/topics/test [partitions] [zk: localhost:2181(CONNECTED) 11] ls /brokers/topics/test/partitions [2, 1, 0] [zk: localhost:2181(CONNECTED) 12]
2 kafka java调用:
2.1 java端生产数据, kafka集群消费数据:
1 创建maven工程,pom.xml中增加如下: <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka_2.10</artifactId> <version>0.8.2.0</version> </dependency> 2 java代码: 向主题test内写入数据 import java.util.Properties; import java.util.concurrent.TimeUnit; import kafka.javaapi.producer.Producer; import kafka.producer.KeyedMessage; import kafka.producer.ProducerConfig; import kafka.serializer.StringEncoder; public class kafkaProducer extends Thread{ private String topic; public kafkaProducer(String topic){ super(); this.topic = topic; } @Override public void run() { Producer producer = createProducer(); int i=0; while(true){ producer.send(new KeyedMessage<Integer, String>(topic, "message: " + i++)); try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } } } private Producer createProducer() { Properties properties = new Properties(); properties.put("zookeeper.connect", "192.168.1.110:2181,192.168.1.111:2181,192.168.1.112:2181");//声明zk properties.put("serializer.class", StringEncoder.class.getName()); properties.put("metadata.broker.list", "192.168.1.110:9092,192.168.1.111:9093,192.168.1.112:9094");// 声明kafka broker return new Producer<Integer, String>(new ProducerConfig(properties)); } public static void main(String[] args) { new kafkaProducer("test").start();// 使用kafka集群中创建好的主题 test } } 3 kafka集群中消费主题test的数据: [root@h2master kafka]# bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginnin 4 启动java代码,然后在看集群消费的数据如下: message: 0 message: 1 message: 2 message: 3 message: 4 message: 5 message: 6 message: 7 message: 8 message: 9 message: 10 message: 11 message: 12 message: 13 message: 14 message: 15 message: 16 message: 17 message: 18 message: 19 message: 20 message: 21
3 kafka 使用Java写消费者,这样 先运行kafkaProducer ,在运行kafkaConsumer,即可得到生产者的数据:
import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.Properties; import kafka.consumer.Consumer; import kafka.consumer.ConsumerConfig; import kafka.consumer.ConsumerIterator; import kafka.consumer.KafkaStream; import kafka.javaapi.consumer.ConsumerConnector; /** * 接收数据 * 接收到: message: 10 接收到: message: 11 接收到: message: 12 接收到: message: 13 接收到: message: 14 * @author zm * */ public class kafkaConsumer extends Thread{ private String topic; public kafkaConsumer(String topic){ super(); this.topic = topic; } @Override public void run() { ConsumerConnector consumer = createConsumer(); Map<String, Integer> topicCountMap = new HashMap<String, Integer>(); topicCountMap.put(topic, 1); // 一次从主题中获取一个数据 Map<String, List<KafkaStream<byte[], byte[]>>> messageStreams = consumer.createMessageStreams(topicCountMap); KafkaStream<byte[], byte[]> stream = messageStreams.get(topic).get(0);// 获取每次接收到的这个数据 ConsumerIterator<byte[], byte[]> iterator = stream.iterator(); while(iterator.hasNext()){ String message = new String(iterator.next().message()); System.out.println("接收到: " + message); } } private ConsumerConnector createConsumer() { Properties properties = new Properties(); properties.put("zookeeper.connect", "192.168.1.110:2181,192.168.1.111:2181,192.168.1.112:2181");//声明zk properties.put("group.id", "group1");// 必须要使用别的组名称, 如果生产者和消费者都在同一组,则不能访问同一组内的topic数据 return Consumer.createJavaConsumerConnector(new ConsumerConfig(properties)); } public static void main(String[] args) { new kafkaConsumer("test").start();// 使用kafka集群中创建好的主题 test } }
相关推荐
Kafka 集群搭建与使用 ...Kafka 集群搭建与使用需要了解 Kafka 的设计理念和架构,了解 Kafka 的概念和组件,以及 Kafka 的性能和数据保留机制。同时,Kafka 也具有广泛的应用场景,能够满足不同的业务需求。
Kafka集群搭建和使用过程涉及多个技术要点和配置项,包括SASL安全机制、ACL权限设置、Kafka基础概念以及安装配置步骤等。下面将详细介绍这些知识点。 首先,SASL(Simple Authentication and Security Layer)是为C...
生产者和消费者可以使用 Java、Python、Scala 等语言开发。 五、Kafka 的应用场景 Kafka 广泛应用于实时数据处理、日志处理、消息队列等领域。 结论:本文档详细介绍了 Kafka 集群的搭建和使用,包括创建、删除、...
8. **编写Java程序**:使用Java API与Kafka交互,创建生产者和消费者类。生产者负责发送消息到特定主题,消费者则从主题中接收消息。这需要导入相关的Apache Kafka和SLF4J库。 9. **测试Java程序**:运行Java程序,...
Kafka的生产者和消费者客户端设计非常轻量级,它们不需要维护集群状态信息,这些信息是由Zookeeper负责保存的。因此,即使生产者或消费者客户端离线,也不会对集群造成额外影响。由于分区数量决定了leader的数量,...
1. **解耦**:允许生产者和消费者独立发展,只要它们遵循共同的接口。 2. **可恢复性**:即使部分系统故障,消息仍可在系统恢复后处理,降低整体系统受影响的程度。 3. **缓冲**:控制数据流速,平衡生产者和消费者...
7. 配置生产者和消费者:编写像`RequestServiceServlet.java`这样的程序,作为Kafka的生产者或消费者,根据需要实现数据的发送和接收。 8. 测试集群:发布消息到Kafka集群,验证生产者、消费者以及整个集群的正确性...
### Kafka 概述 Kafka 是一款开源的分布式消息系统,以其高吞吐量、...此外,我们还学习了 Kafka 生产者和消费者的 Java API 使用方法,以及 JMS 规范的相关概念。这些知识对于搭建高效稳定的大数据处理系统至关重要。
5. ** broker**:Kafka集群中的节点,负责存储和转发消息。 **二、Kafka的搭建步骤** 1. **环境准备**:首先,你需要安装Java开发环境,因为Kafka是基于Java的。然后,下载Kafka的最新稳定版本,并解压到指定目录...
Java调用Kafka时,可以使用Kafka的Java API创建生产者和消费者,进行消息发布与订阅。 Zookeeper是一个分布式协调服务,用于管理集群中的配置信息、命名服务和分布式同步。在Zookeeper集群中,每个节点都需配置相应...
Kafka 通常作为日志系统使用,它支持创建主题(topics)、生产者(producers)向主题发布消息,消费者(consumers)从主题中订阅并消费消息。在分布式环境中,Kafka 通过 ZooKeeper 进行集群协调,确保数据的高可用...
9. **测试集群**:可以使用`kafka-console-producer.sh` 和 `kafka-console-consumer.sh`命令来测试生产与消费消息。 通过以上步骤,你便成功地在Linux环境中搭建了Zookeeper和Kafka的集群。这只是一个基础的配置,...
spring-kafka中提供了多种消息监听器容器和消息生产者,支持同步和异步消息的生产和消费。此外,还可以使用webflux集成Kafka,以响应式的方式构建数据管道,适用于高并发的场景。 集群搭建是Kafka作为分布式消息...
关于标签"Kafka",Kafka是一个高性能、可扩展的开源消息系统,它支持发布订阅模型和生产者消费者模式。它的主要特性包括高吞吐量、持久化、分区、复制等。Kafka通常用于大数据实时处理、日志聚合、流式处理等多个...
Kafka分区是提高Kafka性能的关键所在,当你发现你的集群性能不高时,常用手段就是增加Topic的分区,分区里面的消息是按照从新到老的顺序进行组织,消费者从队列头订阅消息,生产者从队列尾添加消息。 五、常用的...
### Kafka集群及Kafka-Manager安装部署 ...通过上述步骤,可以成功地在本地环境中搭建起Kafka集群以及Kafka-Manager,并进行基本的消息生产和消费操作。这对于理解Kafka的工作原理、实现高效的数据流处理非常有帮助。
我们将重点关注生产者和消费者的代码实现,以及与Hadoop等大数据框架的集成。 Kafka是一个开源的流处理平台,由LinkedIn开发并贡献给Apache软件基金会。它的核心设计是作为一个高吞吐量、低延迟的消息队列,能够...