在 0.9.0.0 之后的 Kafka,出现了几个新变动,一个是在 Server 端增加了 GroupCoordinator 这个角色,
另一个较大的变动是将 topic 的 offset 信息由之前存储在 zookeeper 上改为存储到一个特殊的 topic(__consumer_offsets)中
/kafka/bin/kafka-server-start.sh -daemon /kafka/config/server.properties
JMX_PORT=9991 /kafka/bin/kafka-server-start.sh -daemon /kafka/config/server.properties
/kafka/bin/kafka-server-stop.sh
[使用zk] --zookeeper localhost:2181
[使用内置] --bootstrap-server localhost:9092
增加Topic的partition数
kafka-topics.sh --bootstrap-server localhost:9092 --alter --topic mytest --partitions 5
查看 topic 指定分区 offset 的最大值或最小值
time 为 -1 时表示最大值,为 -2 时表示最小值:
kafka-run-class.sh kafka.tools.GetOffsetShell --topic mytest --time -1 --broker-list 127.0.0.1:9092 --partitions 0
kafka-topics.sh --bootstrap-server localhost:9092 --topic mytest --delete
从头开始
kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mytest --from-beginning
从尾部开始 从尾部开始取数据,必需要指定分区:
kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mytest --offset latest --partition 0
kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mytest --offset latest --partition 0
kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mytest --offset latest --partition 0 --max-messages 1
指定Group
kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mytest -group test_group --from-beginning
消费者Group列表
kafka-consumer-groups.sh --bootstrap-server localhost:9092 --list
查看Group详情[用来判断是否有延迟数据]
kafka-consumer-groups.sh --bootstrap-server localhost:9092 --group test_group --describe
删除Group
kafka-consumer-groups.sh --bootstrap-server localhost:9092 --group test_group --delete
平衡Leader
kafka-preferred-replica-election.sh --bootstrap-server localhost:9092
或
kafka-leader-election.sh --bootstrap-server localhost:9092 --topic test --partition=2 --election-type preferred
--partition:指定需要重新分配leader的partition编号
自带压测工具
kafka-producer-perf-test.sh --topic test --num-records 100 --record-size 1 --throughput 100 --producer-props bootstrap.servers=localhost:9092
相关推荐
### Kafka常用命令归纳 #### 一、环境设置与概述 本文档主要针对Kafka的日常运维及开发过程中经常使用的命令进行归纳整理。所涉及的命令适用于以下环境: - **Zookeeper地址**: localhost:2181 - **Bootstrap ...
Git常用命令面试题 60道 Java并发编程最全面试题 123道 Kafka知识汇总 18道 Linux面试题 50道 Memcache 面试题 23道 MyBatis面试题 37道(含答案) MySQL高频面试题 40道(含答案) Netty面试题 20道 Nginx面试题 23...
1. Zookeeper常用命令:了解Zookeeper的基本命令,例如创建节点、删除节点、获取节点等。 2. Zookeeper的使用场景:了解Zookeeper在大数据技术中的使用场景,例如在Hadoop、Kafka、Storm等系统中的应用。 大数据...
Git常用命令面试题60道 Java并发编程最全面试题123道 Java基础面试题 91道 Java集合面试题 52道 Java虚拟机(JVM)面试题 51道 Java异常面试题 33道 JVM常见面试题解析 Kafka知识汇总 18道 大数据架构.vsdx 大数据...
- **MySQL**:常用命令,InnoDB与MyISAM存储引擎的区别,触发器的应用,视图的创建与使用。 - **Oracle**:PL/SQL编程,游标,表分区,闪回技术。 - **SQL Server**:T-SQL,事务日志管理,全文搜索功能。 - **...
MLlib是Spark提供的机器学习库,包含各种常用的机器学习算法,如分类、回归、聚类、协同过滤等。 **2.3 GraphX** GraphX是Spark提供的图处理库,可以用来处理大规模的图形数据集。 #### 三、Spark生态系统 **3.1...
在Hadoop运行中,MapReduce机制是核心,常见的命令包括查看目录、上传文件、创建目录、获取文件、删除文件或目录、复制文件和移动文件等。 对比Hive和Hbase: - Hive是非关系型数据库,适合对一段时间内的数据进行...
10. **Git常用命令面试题 60道.pdf**:Git是分布式版本控制系统,面试中会考察基础的Git操作,如分支管理、合并冲突、远程仓库操作等。 以上各个领域的面试题,不仅覆盖了基础理论,也包括实践应用和优化技巧,对于...
10. **Git常用命令面试题 60道.pdf**:Git是分布式版本控制系统,用于跟踪代码变更。面试题可能包含基本命令、分支管理、合并冲突解决等。 这些面试题合集覆盖了Java开发者在面试中可能遇到的各种技术问题,对于...
此命令首先通过`ssh`远程登录到服务器 `$i` ,然后通过`ps -ef` 查找所有进程,并使用 `grep` 过滤出包含关键词`file-flume-kafka`的进程,再通过`grep -v grep`排除因`grep`命令本身产生的匹配项,最后使用`awk`...
使用Redis实现分布式锁需保证操作的原子性,Redis内部利用单线程和命令原子执行来实现。 **九、其他** 阅读源码能体现开发者的技术深度和对技术的热情。面试中可能被问及对JDK、Spring等开源库的理解。 以上内容...
10. **Git常用命令面试题 60道.pdf** - Git是分布式版本控制系统,面试题可能涵盖分支管理、合并、回滚、远程仓库操作等常见命令。 这些面试题的涵盖范围广泛,不仅测试了Java基础,还涉及到其生态系统中的各种...
#### 五、Hadoop常用命令及操作 1. **HDFS命令**: - `hdfs dfs -ls`:列出目录下的文件。 - `hdfs dfs -put`:上传文件到HDFS。 - `hdfs dfs -get`:从HDFS下载文件。 2. **MapReduce命令**: - `hadoop jar ...