本月博客排行
-
第1名
kaizi1992 -
第2名
arpenker -
第3名
wy_19921005
年度博客排行
-
第1名
龙儿筝 -
第2名
宏天软件 -
第3名
青否云后端云 - vipbooks
- gashero
- wy_19921005
- benladeng5225
- fantaxy025025
- e_e
- tanling8334
- kaizi1992
- arpenker
- sam123456gz
- zysnba
- javashop
- xiangjie88
- lemonhandsome
- wallimn
- ganxueyun
- Xeden
- xyuma
- zhanjia
- wangchen.ily
- jh108020
- johnsmith9th
- zxq_2017
- jbosscn
- forestqqqq
- ajinn
- daizj
- xpenxpen
- wjianwei666
- 喧嚣求静
- ranbuijj
- kingwell.leng
- silverend
- lchb139128
- kristy_yy
- jveqi
- lich0079
- lzyfn123
- java-007
- sunj
- yeluowuhen
- lerf
- xiaoxinye
- flashsing123
- zhangjijun
- lxguy
- lyndon.lin
最新文章列表
Kafka学习之Replication tools之Add Partition Tool
原文链接:https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools#Replicationtools-5.AddPartitionTool
此工具能做啥?
Kafka的partition表示并发度的单元:一个topic的消息可以分布到多个partition上,并存储在多个server上。一旦创建了一个topic,就要 ...
Kafka学习之Replication tools之Create Topic Tool
原文链接:https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools#Replicationtools-3.ListTopicTool
此工具能干啥?
如果设置auto.create.topics.enable为true,则Kafka会默认自动创建topic。会使用默认的partition数量,replication ...
Kafka学习之Replication tools之List Topic Tool
原文链接:https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools#Replicationtools-3.ListTopicTool
此工具能干啥?
此工具列出了一个指定的topic的列表的信息。如果在命令行中没有提供topic,则会向ZK查询,获得所有的topic并展示它们的信息,其中有topic的名字,part ...
Kafka学习之Replication tools之Preferred Replica Leader Election Tool
原文链接:https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools#Replicationtools-2.PreferredReplicaLeaderElectionTool
这工具做了啥?
为了支持replication功能,每一个partition可以有多个replica。一个partition的replica ...
Kafka学习之Replication tools之controlled shutdown
原文地址:https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools#Replicationtools-1.ControlledShutdown
controlled shutdown是啥意思?
在0.8版本中,每一个partition可以有多个replica。这些replica分布在多个broker上,提供了高可用。 ...
Kafka学习之broker配置(0.8.1版)
broker.id 默认值:无
每一个broker都有一个唯一的id,这是一个非负整数,这个id就是broker的"名字",这样就允许broker迁移到别的机器而不会影响消费者。你可以选择任意一个数字,只要它是唯一的。
log.dirs 默认值:/tmp/kafka-logs
一个用逗号分隔的目录列表,可以有多个,用来为Kafka存储数据。每当需要为一个新的pa ...
高性能消息系统——Kafka
什么是Kafka?引用官方原文: “Kafka is a distributed, partitioned, replicated commit log service.”它提供了一个非常特殊的消息机制,不同于传统的mq。官网:https://kafka.apache.org它与传统的mq区别? 更快!单机上万TPS 传统的MQ,消息被消化掉后会被mq删除,而kafka中消息被 ...
管中窥豹:腾讯大数据平台
腾讯有中国最全的社交数据,面对一个数据金矿,腾讯不可能坐视不理,腾讯基于hadoop研究了自己的大数据平台,最大的一个集群规模超过5600台。本文简单分析下腾讯的大数据平台的技术特点。
下面这个图是腾讯的技术架构图:
整个系统相对比较简单,主要有以下几大组件组成。
TDBank(Tencent Data Bank):数据实时收集与分发平台。将数据处理系统同数据源解耦,基于“发布-订阅 ...
kafka安装测试
kafka安装测试过程
kafka的性能在此不再赘述,百度一下很多,在此描述一下kafka的安装和测试过程:
安装kafka:
#tar -xzf kafka_2.9.2-0.8.1.tgz
#cd kafka_2.9.2-0.8.1
#mv kafka_2.9.2-0.8.1 kafka
开启zookeeper服务:
bin/zookeeper-server-star ...
kafka issues
0.8.1 Release
1. 需要将slf4j的jar包拷贝到kafka的lib目录下,否则运行producer和consumer的shell test会报错
2. 使用java的api,props.put("metadata.broker.list", "xxx.xxx.xxx.xxx:9092");如果brokerlist在server端kafka的 ...
Kafka 集群构建
最近要做实时计算相关的东西,目前每天约100G日志,还在不断增长,高峰时一天400G日志。
考虑过flume+activemq+storm+redis+hadoop, 考虑用kafka做mq的备用方案。
我这里用了公司的三台机器
192.168.197.170
192.168.197.171
192.168.197.172
一. Zookeeper集群构建
Zoo ...
KAFKA学习笔记2
Kafka[1]是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运行日志(CPU、内存、磁盘、网络、系统及进程状态)。
当前很多的消息队列服务提供可靠交付保证,并默认是即时消费(不适合离线)。高可靠交付对linkedin的日志不是必须的,故可通过降低可靠性来提高性能,同时 ...
kafka学习笔记1之简介
在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题:
l 我想分析一下用户行为(pageviews),以便我能设计出更好的广告位
l 我想对用户的搜索关键词进行统计,分析出当前的流行趋势。这个很有意思,在经济学上有个长裙理论,就是说,如果长裙的销量高了,说明经济不景气了,因为姑娘们没钱买各种丝袜了。
l 有些数据,我觉得存数据库浪费,直接存硬盘又怕到时候操 ...