hbase的replication使用

lc_koven

浏览: 354277 次
性别:
来自: 杭州

最近访客更多访客>>

<苍狼>

gaoming1990

libisthanks

m635674608

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hbase

HBase zk Hadoop Mapreduce ITeye

hbase-0.90.0的一个重要改进是引入了replication机制，使它的数据完整性得到了进一步的保障。虽然这一功能还不太完善，但是今后必然会变得更加重要。

hbase的replication机制很像mysql statement-based replication。它是通过WALEdit和hlog来实现的。当请求发送给master cluster时，hlog日志放入hdfs的同时进入replication队列，由slave cluster通过zookeeper获取并写入slave的表中。目前的版本仅支持一个slave cluster

具体配置如下：
1 需要保证主从cluster上有相同的table，并且结构一致，都enable
2 保证主从cluster的版本都在0.90.0以上
3 主从cluster的机器是两两互通的
4 master cluster的hbase-site.xml中需要添加以下选项：

<property>
  <name>hbase.replication</name>
  <value>true</value>
</property>

5 进入master cluster的shell,执行：
add_peer '1', "slave-zk-1,slave-zk-2,...:slave-2181:/slave-zk-parent"
6 开启要复制的family，进入hbase shell,执行:

    disable 'your_table'
    alter 'your_table', {NAME => 'family_name', REPLICATION_SCOPE => '1'}
    enable 'your_table'

此时replication己经开始了
7 要中止或继续replication,使用stop_replication或start_replication

在复制过程中，可以通过查看regionserver的日志来跟踪复制的进度：
Considering 1 rs, with ratio 0.1
Getting 1 rs from peer cluster # 0
Choosing peer yourip:62020

要检查复制的数据是否完整，可以利用hbase提供的小工具verifyrep:

hbase org.apache.hadoop.hbase.mapreduce.replication.VerifyReplication --starttime=1265875194289 --stoptime=1265878794289 1 TestTable

这里的1是上面的peer_id

更完整的说明见：http://hbase.apache.org/replication.html

查看图片附件

分享到：

对提高hbase写性能的一些思考 | zookeeper清除日志文件工具

2011-04-02 00:05
浏览 11631
评论(1)
分类:互联网
查看更多

1 楼 Jonathan-Wei 2013-12-24

这里的主从cluster的机器是两两互通的是指ssh无密码访问么？是不是两个集群启动的用户名必须一致？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论