put批量提交hbase性能改善

ganliang13

浏览: 254375 次
性别:
来自: 北京

最近访客更多访客>>

fantesy84

lzb

sosohotsummer

祥云朵朵

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hbase

hbase put 批量性能改善

在使用HBase Put API的时候，有几个会影响性能的因素。

1.Put List Size
HBase的Put支持单条插入，也支持批量插入。

2. AutoFlush
AutoFlush指的是在每次调用HBase的Put操作，是否提交到HBase Server。 默认是true,每次会提交。如果此时是单条插入，就会有更多的IO,从而降低性能

3.Write Buffer Size
Write Buffer Size在AutoFlush为false的时候起作用，默认是2MB,也就是当插入数据超过2MB,就会自动提交到Server

4.WAL
WAL是Write Ahead Log的缩写，指的是HBase在插入操作前是否写Log。默认是打开，关掉会提高性能，但是如果系统出现故障(负责插入的Region Server挂掉)，数据可能会丢失。

下面是一个简单的测试:

table: 4个family 每行插入的数据4KB,每次提交1000行

WAL=false,autoFlush=false,buffer=25165824 insert complete,costs:0.4453ms/row

WAL=false,autoFlush=true,buffer=0 insert complete,costs:0.6ms/row

WAL=true,autoFlush=true,buffer=0 insert complete,costs:1.8797ms/row

可以看出在WAL关闭,并且设置比较合适的buffer size,可以将性能提高到4到5倍.

测试代码:

public class TestInsert {
    static HBaseConfiguration hbaseConfig;

    public static void main(String[] args) throws Exception {
        Configuration HBASE_CONFIG = new Configuration();
        HBASE_CONFIG.set("hbase.zookeeper.quorum", "gms5,gms6");
        HBASE_CONFIG.set("hbase.zookeeper.property.clientPort", "2181");
        hbaseConfig = new HBaseConfiguration(HBASE_CONFIG);
        insert(false,false,1024*1024*24);
        insert(false,true,0);
        insert(true,true,0);
    }

    private static void insert(boolean wal,boolean autoFlush,long writeBuffer)
            throws IOException {
        String tableName="etltest";
        HBaseAdmin hAdmin = new HBaseAdmin(hbaseConfig);
        if (hAdmin.tableExists(tableName)) {
            hAdmin.disableTable(tableName);
            hAdmin.deleteTable(tableName);
            HTableDescriptor t = new HTableDescriptor(tableName);
            t.addFamily(new HColumnDescriptor("f1"));
            t.addFamily(new HColumnDescriptor("f2"));
            t.addFamily(new HColumnDescriptor("f3"));
            t.addFamily(new HColumnDescriptor("f4"));
            hAdmin.createTable(t);
            System.out.println("table created");
        }
        HTable table = new HTable(hbaseConfig, tableName);
        table.setAutoFlush(autoFlush);
        if(writeBuffer!=0){
            table.setWriteBufferSize(writeBuffer);
        }
        List<Put> lp = new ArrayList<Put>();
        long all = System.currentTimeMillis();
        int count = 10000;
        byte[] buffer = new byte[1024];
        Random r = new Random();
        for (int i = 1; i <= count; ++i) {
            Put p = new Put(String.format("row d",i).getBytes());
            r.nextBytes(buffer);
            p.add("f1".getBytes(), null, buffer);
            p.add("f2".getBytes(), null, buffer);
            p.add("f3".getBytes(), null, buffer);
            p.add("f4".getBytes(), null, buffer);
            p.setWriteToWAL(wal);
            lp.add(p);
            if(i00==0){
                table.put(lp);
                lp.clear();
            }
        }
        System.out.println("WAL="+wal+",autoFlush="+autoFlush+",buffer="+writeBuffer);
        System.out.println("insert complete"+",costs:"+(System.currentTimeMillis()-all)*1.0/count+"ms");
    }
}

分享到：

Java操作Hbase进行建表、删表以及对数据进 ... | hbase 数据模型详解

2013-05-06 18:27
浏览 9480
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

put批量提交hbase性能改善

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

put批量提交hbase性能改善

评论

发表评论

相关推荐

hbase关于对表操作API实现

mapreudce 通过读取hbase表删除hbase 数据

基于mapreduce 读文件直接入 hbase

基于mapreduce hbase操作血的教训

hbase 优化

HBase 之HFileOutputFormat

Java操作Hbase进行建表、删表以及对数据进行增删改查,条件查询

hbase 数据模型详解

hbase shell 应用示例

hbase-0.94.2安装

最近访客更多访客>>