Hadoop的Text类getBytes字节数据put到HBase后有多余字符串问题

BlackWing

浏览: 201669 次
性别:
来自: 广州

最近访客更多访客>>

yr_zhang

haeng

dotjar

swu45

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

HBase
hadoop

hbase hadoop Text

转载请标明出处：http://blackwing.iteye.com/blog/1978501

org.apache.hadoop.io.Text里面的getBytes方法有个小坑。

先看现场：

String s = "91223224-20131120-96413376-150";
		Text t = new Text();
		t.set(s);
		Put put = new Put(t.getBytes());//*1
		put.add("kq".getBytes(), "0".getBytes(),"1".getBytes());
		List<Put> puts = new ArrayList<Put>();
		puts.add(put);
		Put put2 = new Put(t.toString().getBytes());//*2
		put2.add("kq".getBytes(), "1".getBytes(),"2".getBytes());
		puts.add(put2);
		try {
			table.batch(puts);
			table.flushCommits();
			table.close();
		} catch (Exception e) {
			e.printStackTrace();
		}

其中标注的地方就是差别所在。如果按照*1方式put到hbase，跟按照*2方式put到hbase得到的数据如下：

91223224-20131120-96413376-150\x00\x00\x00
91223224-20131120-96413376-150

原因是getBytes获得的字节数组长度跟Text.getLength获得的长度不一致，不足的地方Text会自动补全。

String s = "91223224-20131120-96413376-150";
Text t = new Text();
t.set(s);
System.out.println(t.getLength()+"  |  "+t.getBytes().length);

输出结果是：30 | 33

所以如果要把Text的内容put到hbase，最保险的方式是先转换为String在获得字节数组Text.toString().getBytes()

分享到：

ClassNotFoundException: org.apache.hadoo ... | 通过nginx实现内网hadoop、hbase集群对外 ...

2013-11-21 15:53
浏览 2161
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop的Text类getBytes字节数据put到HBase后有多余字符串问题

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop的Text类getBytes字节数据put到HBase后有多余字符串问题

评论

发表评论

相关推荐

新版hadoop MultipleOutputs多文件输出

解决直接读HFile时因表数据写入而导致文件目录变化问题

解决Exception from container-launch: ExitCodeException exitCode=1的另类错误

LoadIncrementalHFiles是copy而不是move的疑惑

Hadoop生成HFile直接入库HBase心得

NullPointerException SerializationFactory.getSerializer解决

编译YCSB 解决Not a host:port pair问题

HBase使用SNAPPY压缩遇到compression test fail问题解决

HBase表增加snappy压缩

hadoop 1.0.3增加snappy压缩

把hadoop的metrics加入ganglia监控

ROOT不在线的另外一种原因及解决办法

enable和disable表时出现表未disable/enable异常处理

MultithreadedMapper多线程读取数据

shuffle & sort解释

hadoop的 IncompatibleClassChangeError

HBase的start key和end key疑惑

HBase的coprocessor分拆HRegion

分拆TableSplit 让多个mapper同时读取

GET查询HBase无结果时 Result的size也不为空

最近访客更多访客>>