HBase常用功能和HBase+MapReduce使用总结 -

aoyouzi

浏览: 1988782 次
性别:
来自: 北京

最近访客更多访客>>

dy.f

zhaoshijie

lbq136957978

juzhibest

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

HBase常用功能和HBase+MapReduce使用总结

博客分类：

技术总结
NOSql

HBase MapReduce 总结

1.HBase如果加了列限定，如果该列不存在时返回的结果为empty.

看下面的代码：

1 2	`Get get =` `new` `Get(Bytes.toBytes("100"));` `get.addColumn(Bytes.toBytes("info"), Bytes.toBytes("name"));`

这里加入了列限定，也就是只返回列族info下面的name字段。但是如果name字段根本不存在，返回的Result在调用result.isEmpty()时则返回为true,也就是说就算其他字段存在，也什么都没返回来，包括rowkey也没有返回来。当然，如果是限定多个列，只要一个列存在就可以正常返回。所以需要注意。

2.HBase在scan时指定的StartRow里面不能加-

看下面的代码：

1

2

3

4

 Scan scan =  new  Scan();

  scan.setStartRow(Bytes.toBytes("3136947-"));

  scan.setStopRow(Bytes.toBytes("3136947-"  +  1));

我的本意是查询rowkey以 3136947- 开头的行，但是因为我的里面有一个-（“杠”），所以什么都没返回，去掉-后正常。这说明这里是不能使用-，-也并不是转义字符，转义后也还是scan不出来的。不知道其他字符是不是也不行，没有测试。所以需要注意。

3.HBase在scan时过滤掉指定列不存在的记录

如果想返回某个字段必须存在的行，不存在该字段的记录过滤掉不返回，方法如下：

 Scan scan =  new  Scan();

         scan.setStartRow(Bytes.toBytes("3136947"));

         scan.setStopRow(Bytes.toBytes("3136947"  +  1));

         scan.addColumn(Bytes.toBytes("info"),

                 Bytes.toBytes("name"));

         SingleColumnValueFilter filter =  new  SingleColumnValueFilter(Bytes.toBytes("info"),

                 Bytes.toBytes("name"),

                 CompareFilter.CompareOp.NOT_EQUAL, Bytes.toBytes("0"));

         filter.setFilterIfMissing(true);

         scan.setFilter(filter);

注意：如果是判断某个列是否存在，必须在addColumn里面加上该列，也就是必须返回的字段里面必须包含该列，否则也不会返回，因为在处理的时候是调用addColumn然后才会调用过滤器。

这里的过滤器里面指定该列的字段值必须不等于0(当然，如果你的name里有等于0的当然不能使用0),并且设置setFilterIfMissing为true，也就是设置为如果该列不存在就过滤掉这条数据，默认为false。

http://blog.sina.com.cn/s/blog_68674da70102vabb.html

分享到：

在集群中Java 通过调用API操作HBase | Hbase几种数据入库（load）方式比较

2016-05-21 21:34
浏览 668
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HBase常用功能和HBase+MapReduce使用总结

1.HBase如果加了列限定，如果该列不存在时返回的结果为empty.

2.HBase在scan时指定的StartRow里面不能加-

3.HBase在scan时过滤掉指定列不存在的记录

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HBase常用功能和HBase+MapReduce使用总结

1.HBase如果加了列限定，如果该列不存在时返回的结果为empty.

2.HBase在scan时指定的StartRow里面不能加-

3.HBase在scan时过滤掉指定列不存在的记录

评论

发表评论

相关推荐

万字总结Java 9~15新特性

架构制图：工具与方法论

性能优化

【冬察冬见】FFmpeg系列学习笔记

有关创新的一些思考

浅谈面试官的培养

冬察冬见·全视角再议晋升

冬察冬见·晋升-晋升的那些事儿1

物联网MQTT实战

大小公司都适用的架构选型工具箱（涵盖上百个组件）

elasticsearch使用踩坑

【冬察冬见】读书日话高效读书

【冬察冬见·荐书】4·23世界读书日 80本书单推荐承包你一年的书单

精讲Kafka

快速上手 AB Test

优雅的微服务架构下的鉴权

知识图谱的构建

宜信微服务架构落地及其演进

MySQL性能优化神技

REST协议解密(原创)

最近访客更多访客>>