<!--[if !supportLists]-->1. <!--[endif]-->下载 kafka_2.10-0.9.0.1.tgz
<!--[if !supportLists]-->2. <!--[endif]-->解压 kafka_2.10-0.9.0.1.tgz 进入kafka_2.10-0.9.0.1\bin\windows 目录中
<!--[if !supportLists]-->1》 <!--[endif]-->启动zookeeper ;
zookeeper-server-start.bat ../../config/zookeeper.properties
<!--[if !supportLists]-->2》 <!--[endif]-->启动kafka server 服务
kafka-server-start.bat ../../config/server.properties
<!--[if !supportLists]-->3》 <!--[endif]-->建立标题;建立一个只有一个分区的 test 标题
kafka-topics.bat --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
语法:kafka-topics.bat --create --zookeeper zookeeper服务地址:端口 --replication-factor 数量 --partitions 分区数量 --topic 标题
<!--[if !supportLists]-->4》 <!--[endif]-->查看已经建立的标题
kafka-topics.bat --list --zookeeper localhost:2181
语法:kafka-topics.sh --list --zookeeper zookeeper服务地址:端口
<!--[if !supportLists]-->5》 <!--[endif]-->启动生产者,输入信息:
/kafka-console-producer.bat --broker-list localhost:9092 --topic test
<!--[if !supportLists]-->6》 <!--[endif]-->启动消费者,查看信息
kafka-console-consumer.bat --zookeeper localhost:2181 --topic test --from-beginning
下面我们使用java 代码实现启动生产者 和启动消费者(效果和第5,6步相同)
<!--[if !supportLists]-->一.<!--[endif]-->生产者java
package mq.apche.client;
import java.util.Date;
import java.util.Properties;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.clients.producer.RecordMetadata;
/**
* version:kafka_2.10-0.9.0.1
* @author dell
*
*/
publicclass TestProducer {
publicvoid productSend() {
Properties props = new Properties();
// 用于建立与kafka集群连接的host/port组;集群格式:host:port,host:port
props.put("bootstrap.servers", "localhost:9092");
// producer需要server接收到数据之后发出的确认接收的信号,此项配置就是指procuder需要多少个这样的确认信号。此配置实际上代表了数据备份的可用性。
// 以下设置为常用选项:(1)acks=0:设置为0表示producer不需要等待任何确认收到的信息。副本将立即加到socket
// buffer并认为已经发送。没有任何保障可以保证此种情况下server已经成功接收数据,同时重试配置不会发生作用(因为客户端不知道是否失败)回馈的offset会总是设置为-1;(2)acks=1:
// 这意味着至少要等待leader已经成功将数据写入本地log,但是并没有等待所有follower是否成功写入。这种情况下,如果follower没有成功备份数据,而此时leader又挂掉,则消息会丢失。(3)acks=all:
// 这意味着leader需要等待所有备份都成功写入日志,这种策略会保证只要有一个备份存活就不会丢失数据。这是最强的保证。,
props.put("acks", "all");
// 设置大于0的值将使客户端重新发送任何数据,一旦这些数据发送失败。注意,这些重试与客户端接收到发送错误时的重试没有什么不同。允许重试将潜在的改变数据的顺序,
// 如果这两个消息记录都是发送到同一个partition,则第一个消息失败第二个发送成功,则第二条消息会比第一条消息出现要早。
// 默认:0
props.put("retries", 1);
// producer将试图批处理消息记录,以减少请求次数。这将改善client与server之间的性能。这项配置控制默认的批量处理消息字节数。不会试图处理大于这个字节数的消息字节数。发送到brokers的请求将包含多个批量处理,其中会包含对每个partition的一个请求。较小的批量处理数值比较少用,并且可能降低吞吐量(0则会仅用批量处理)。
// 较大的批量处理数值将会浪费更多内存空间,这样就需要分配特定批量处理数值的内存大小。
// 默认值:16384
props.put("batch.size", 16384);
props.put("linger.ms", 1);
// producer用于压缩数据的压缩类型。默认是无压缩。正确的选项值是none、gzip、snappy。
// 压缩最好用于批量处理,批量处理消息越多,压缩性能越好; 默认:none
props.put("compression.type", "none");
// producer可以用来缓存数据的内存大小。如果数据产生速度大于向broker发送的速度,producer会阻塞或者抛出异常,以“block.on.buffer.full”来表明。
// 这项设置将和producer能够使用的总内存相关,但并不是一个硬性的限制,因为不是producer使用的所有内存都是用于缓存。一些额外的内存会用于压缩(如果引入压缩机制),同样还有一些用于维护请求。
// 默认值:33554432
props.put("buffer.memory", 3355);
// key的序列化方式,若是没有设置,同serializer.class
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
// value序列化类方式
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
KafkaProducer<String, String> producer = new KafkaProducer<String, String>(props);
for (inti = 0; i < 100; i++) {
try {
Thread.sleep(300);
} catch (InterruptedException e1) {
e1.printStackTrace();
}
longruntime = new Date().getTime();
String topic = "test";// 主题
String key = "" + i;// 值
String msg = "my_msg=============================================" + runtime;
msg = msg +msg;
Future<RecordMetadata> result = producer.send(new ProducerRecord<String, String>(topic, key, msg));
producer.flush();
try {
RecordMetadata data = result.get();
String dmsg = data.topic();
System.out.println(dmsg + ";partition " + data.partition());
} catch (InterruptedException e) {
e.printStackTrace();
} catch (ExecutionException e) {
e.printStackTrace();
}
}
producer.close();
}
publicstaticvoid main(String[] args) {
TestProducer t = new TestProducer();
t.productSend();
}
}
二 消费者java 代码
package mq.apche.client;
import java.util.Arrays;
import java.util.Properties;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
/**
* /**
* version:kafka_2.10-0.9.0.1
* @author dell
*
*/
publicclass TestCustumer {
publicvoid custumerRev() {
Properties props = new Properties();
//服务器地址
props.put("bootstrap.servers", "localhost:9092");
//组编号;默认值为空
props.put("group.id", "test1");
//默认为true; true表示同步到zookeeper
props.put("enable.auto.commit", "true");
//consumer向zookeeper提交offset的频率
props.put("auto.commit.interval.ms", "1000");
props.put("session.timeout.ms", "30000");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
consumer.subscribe(Arrays.asList("test","pay")); //标题
while (true) {
ConsumerRecords<String, String> records = consumer.poll(100);
for (ConsumerRecord<String, String> record : records)
//输出生产者生产的信息
System.out.printf("=========offset = %d, key = %s, value = %s",
record.offset(), record.key(), record.value());
System.out.println("");
}
}
publicstaticvoid main(String[] args) {
TestCustumer test = new TestCustumer();
test.custumerRev();
}
}
//apache-kafka
compile group: 'org.apache.kafka', name: 'kafka_2.10', version: '0.9.0.1'
Api地址:https://kafka.apache.org/documentation.html#newconsumerconfigs
相关推荐
kafka_2.11-0.9.0.1.tgz 亲测可用 Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。 这种动作...
赠送jar包:kafka-clients-0.10.0.1.jar; 赠送原API文档:kafka-clients-0.10.0.1-javadoc.jar; 赠送源代码:kafka-clients-0.10.0.1-sources.jar; 赠送Maven依赖信息文件:kafka-clients-0.10.0.1.pom; 包含...
赠送jar包:kafka_2.11-0.10.0.1.jar; 赠送原API文档:kafka_2.11-0.10.0.1-javadoc.jar; 赠送源代码:kafka_2.11-0.10.0.1-sources.jar; 赠送Maven依赖信息文件:kafka_2.11-0.10.0.1.pom; 包含翻译后的API文档...
4. 监控与管理:通过Kafka提供的监控工具,如`kafka-console-consumer.sh`和`kafka-run-class.sh`,监控主题和消费者状态。 六、大数据应用场景 1. 数据管道:Kafka作为实时数据流处理的基础设施,用于收集、存储和...
**Kafka 2.10-0.9.0.1 源码解析与镜像制作** 在深入探讨 Kafka 的源码之前,先来理解 Kafka 是什么。Kafka 是一个分布式流处理平台,由 LinkedIn 开发并在 Apache 软件基金会下开源。它主要用于实时数据流处理和...
标题中的"kafka_2.10-0.10.0.1.tgz"标识的是Apache Kafka的一个特定版本,这是Apache Kafka的二进制发行版,适用于Java 2.10平台,版本号为0.10.0.1。Kafka是一个分布式流处理平台,由LinkedIn开发并贡献给了Apache...
- 使用Kafka自带的监控工具,如`kafka-topics.sh`、`kafka-consumer-groups.sh`等。 - 集成第三方监控系统,如Prometheus和Grafana,实现可视化监控。 总之,Kafka作为一种成熟的消息队列解决方案,在大数据处理...
《Apache Kafka 0.9.0.1:构建实时数据管道》 Apache Kafka 是一个分布式流处理平台,被广泛用于构建实时数据管道和流应用程序。这个名为 "kafka_2.11-0.9.0.1" 的压缩包包含了 Kafka 的一个特定版本——0.9.0.1,...
- 使用`./kafka-console-producer.sh --broker-list localhost:9092 --topic test`和`./kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning`进行消息的生产和消费,操作...
赠送jar包:kafka-clients-0.9.0.0.jar; 赠送原API文档:kafka-clients-0.9.0.0-javadoc.jar; 赠送源代码:kafka-clients-0.9.0.0-sources.jar; 赠送Maven依赖信息文件:kafka-clients-0.9.0.0.pom; 包含翻译后...
- 使用bin/kafka-topics.sh脚本创建主题,指定主题名、分区数量和副本数量。 4. **生产者与消费者编程** - **生产者示例**:使用Kafka的Java API,编写生产者代码,通过new Producer()创建实例,然后使用send()...
Kafka提供了`kafka-topics.sh`、`kafka-consumer-groups.sh`等管理工具,用于创建、查询和管理主题、消费者组。JMX接口也可用于远程监控Kafka集群的性能指标。 7. **安全性** 0.10.1.0版本开始支持SSL加密和SASL...
Kafka提供了丰富的命令行工具,如`kafka-topics.sh`、`kafka-consumer-groups.sh`等,用于查看和管理Topics、Partitions、Consumer Groups等。 十一、注意事项 1. Kafka默认使用9092端口,确保没有其他服务占用。 ...
同时,为了创建主题和管理分区,可能还需要使用Kafka提供的命令行工具,如`kafka-topics.sh`和`kafka-console-producer.sh`。 Kafka的高吞吐量和低延迟得益于其设计,如将数据分片到多个分区并跨多个节点复制,确保...
7. 发布和消费消息:你可以使用`kafka-console-producer.bat`和`kafka-console-consumer.bat`工具来测试消息的发布和订阅。例如,发布消息到`test-topic`,然后从该主题消费消息。 集群扩展与高可用: 8. 如果需要...
6. 创建主题:使用`bin/kafka-topics.sh`创建主题,例如 `bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic my-topic`。 四、使用Kafka进行消息生产和消费...
5. 创建主题:`./kafka_2.12-2.5.0/bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 1 --partitions 1 --topic my-topic` 6. 生产和消费消息:使用Kafka提供的命令行工具或...
kafka_2.11-0.10.1.0.tgzKafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素...
标题中的"kafka_exporter-1.6.0.linux-amd64.tar.gz"是一个针对Linux AMD64架构的Kafka Exporter版本1.6.0的压缩文件,通常用于在Prometheus监控环境中收集和暴露Kafka集群的度量数据。 Kafka Exporter是一款开源...