`
longzhun
  • 浏览: 371787 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hbase总结(三)-Hbase与Hive的区别与联系

 
阅读更多

问题导读:

hive与hbase的底层存储是什么?

hive是产生的原因是什么?
habase是为了弥补hadoop的什么缺陷?





共同点:

1.hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储

区别:

2.Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作

的缺陷的项目 。

 

3.想象你在操作RMDB数据库,如果是全表扫描,就用Hive+Hadoop,如果是索引访问,就用HBase+Hadoop 。

 

4.Hive query就是MapReduce jobs可以从5分钟到数小时不止,HBase是非常高效的,肯定比Hive高效的多。

 

5.Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑。

 

6.hive借用hadoop的MapReduce来完成一些hive中的命令的执行

 

7.hbase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作。

 

8.hbase是列存储。

 

9.hdfs作为底层存储,hdfs是存放文件的系统,而Hbase负责组织文件。

 

10.hive需要用到hdfs存储文件,需要用到MapReduce计算框架。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics