`
cwqcwk1
  • 浏览: 86852 次
文章分类
社区版块
存档分类
最新评论

使用impala/hive查询hbase数据

 
阅读更多

之前做过hadoop的测试,测试了hive/impalahbase数据的查询,这里以hive为例,impala查询hbase数据也类似

hbase访问方式

NativeJAVAAPI

最常规的高效访问方式

HbaseShell

Hbase的命令行供,以JRuby接口,最简单接入,适合HBase管理

ThriftGateway

利用Thrift序列号技术,支持C++/PHP/Python等多种语言,适合其他异构系统在线访问Hbase数据

RESTGateway

支持REST风格的HTTPAPI访问HBase,无语言限制

MapReduce

直接使用MapReduce作业处理Hbase数据,使用Pig/Hive处理HBase数据

这里,hive查询hbase数据就是通过MapReduce访问方式。


hive查询hbase数据

1、创建Hbase表和插入记录

$hbaseshell

hbase(main):001:0>create'test','cf'

hbase(main):002:0>put'test','row1','cf:a','value1a'

hbase(main):003:0>put'test','row1','cf:b','value1b'

hbase(main):004:0>put'test','row2','cf:a','value2a'

hbase(main):005:0>put'test','row2','cf:b','value2b'

2、创建Hive外部表

$hive

hive>CREATEEXTERNALTABLEhbase_test(keystring,astring,bstring)

>ROWFORMATSERDE'org.apache.hadoop.hive.hbase.HBaseSerDe'

>STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'

>WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,cf:a,cf:b")

>TBLPROPERTIES("hbase.table.name"="test");

OK

Timetaken:0.201seconds

3Hive下查询hbase表数据

hive>select*fromhbase_test;

OK

row1value1avalue1b

row2value2avalue2b

Timetaken:0.219seconds,Fetched:2row(s)

hive无法查询hbase原因

1hdfs权限问题

当前用户在hive下要有权值执行MapReduce操作,最简单的检查方式是执行“select*fromtestwhere1;”这种带where子句查询。

权限不足会报这个错误:

Permissiondenied:user=root,access=READ,inode="/user"

解决办法:

sudo-uhdfshadoopfs-chmod-R777/user

2、扩展表字段问题

hive表字段要和hbase列记录字段要对应,支持stringint等类型,hive会做格式转换


参考:http://blog.csdn.net/mycwq/article/details/39518897

分享到:
评论

相关推荐

    impala与hive的区别1

    - Impala和Hive都是基于Hadoop的数据查询系统,但在应用场景上有区别。Hive适合长时间的批处理查询,而Impala则专为实时交互式SQL查询设计,适合快速数据分析。 - 它们共享一些特性,如元数据、SQL语法、文件格式...

    Impala-Kudu-HBase-Spark安装文档

    1. **Impala** 是由Cloudera开发的一款MPP(大规模并行处理)查询引擎,设计用于快速查询存储在Hadoop生态系统中的数据。它可以直接读取HDFS和HBase的数据,无需预先进行数据转换或加载到关系数据库中,提供低延迟的...

    impala依赖cdh版本的hadoop-hbase-hive相关jar包.zip

    在IT行业中,Impala、Hive和HBase是大数据处理领域的重要组件,它们与Hadoop紧密相连,构建了CDH(Cloudera Distribution Including Apache Hadoop)生态系统的一部分。本压缩包"impala依赖cdh版本的hadoop-hbase-...

    详解hbase与hive数据同步

    详解HBase与Hive数据同步 HBase与Hive数据同步是大数据处理中常见的一种数据集成方式。HBase是一种NoSQL数据库,适合存储大量半结构化和非结构化数据,而Hive是基于Hadoop的数据仓库工具,用于数据分析和处理。两者...

    Impala与Hive的比较

    ##### 2.1 数据查询工具的角色定位 虽然Impala和Hive均构建在Hadoop之上,但它们针对不同场景进行了优化设计: - **Hive**:更适合于执行长时间的批处理查询分析任务,适用于对数据进行大规模的预处理和转换。 -...

    新手指导hadoop、hbase、hive版本对应关系查找表

    Hive是一个建立在Hadoop上的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能(HiveQL),可以将SQL语句转换为MapReduce任务进行运行。 对于不同版本的Hadoop、HBase和Hive,它们...

    大规模数据查询Hive及Impala技术原理及架构.pdf

    ### 大规模数据查询Hive及Impala技术原理及架构 #### 第一部分:Hive数据查询分析技术和实例介绍 **一、Hive简介** Hive 是一个基于 Hadoop 的数据仓库工具,它允许用户轻松地将结构化数据文件映射为表,并利用 ...

    impala jdbc hive

    标题中的“impala jdbc hive”指的是使用Java的JDBC(Java Database Connectivity)接口来连接和操作Impala与Hive这两个大数据处理系统。JDBC是Java编程语言中用于规范客户端程序如何访问数据库的应用程序编程接口,...

    大数据Impala架包

    Impala允许用户无需将数据从HDFS或HBase中提取出来,就能直接在原地进行实时分析,极大地提升了大数据查询的效率。 描述中提到的“用于JDBC连接Impala的工具包”,意味着这个压缩包包含了实现Java Database ...

    Hbase学习文档

    Hive和Impala是两种大数据处理工具,常用于SQL查询。对接HBase,可以使非SQL背景的开发者也能方便地对HBase数据进行查询。 1. HBase与Hive集成:通过Hive的HBase Storage Handler,可以在Hive中直接查询HBase表。这...

    hive的安装与配置头歌.zip

    7. **查询数据**:使用 HQL(Hive Query Language)进行数据查询,类似于 SQL。例如: ```sql SELECT * FROM table_name; ``` 除了基础安装配置,还需要了解一些高级主题,如分区表、桶表、视图、外部表、Hive ...

    python3.6链接hive和impala的所有依赖包.zip

    在Python 3.6环境下,连接到Hive和Impala数据库需要一系列的依赖包,这些依赖包涵盖了数据处理、网络通信、数据库接口等多个方面。在本文中,我们将深入探讨这些必要的依赖及其作用。 首先,Hive是Apache软件基金会...

    大数据基础面试题hadoop,zookeeper,hbase,hive,spark,kafka,flink,clickhouse

    Hive 是构建在 Hadoop 上的数据仓库工具,用于将结构化的数据文件映射为一张数据库表,并提供 SQL 类似的查询语言(HQL)来查询数据。Hive 是分析大量数据的利器,尤其适合离线批处理。 5. **Spark**: Spark 是...

    基于 Impala 构建实时用户行为分析引擎.pdf

    这些数据被导入到Hadoop的HDFS或者HBase等存储系统中,然后通过Impala进行实时查询和分析。例如,我们可以使用Impala来实时追踪用户的浏览路径、点击率、停留时间等,以便快速响应用户需求,优化产品体验,或者进行...

    yum安装CDH5.5 hive、impala的过程详解

    使用Hive命令行或Impala Shell验证Hive和Impala是否正常工作,创建测试表并插入数据,执行查询以确保能正确读取数据。 通过以上步骤,你已经在CDH5.5环境中成功安装了Hive和Impala,并进行了必要的配置。确保所有...

    hive开发资料.pdf

    Hive 也支持与其他数据源集成,如 HBase、Impala 或 Spark SQL,以实现更高效的数据处理。此外,随着 Hadoop 生态系统的不断发展,Hive 还提供了与 Hive 交互的多种工具和库,如 Hue、Beeline 和 Oozie,以适应不同...

    完美卸载cloudera

    [root@master ~]# rm -rf /data/dfs /data/impala /data/yarn /dfs /impala /yarn /var/run/hadoop-* /var/run/hdfs-* /usr/bin/hadoop* /usr/bin/zookeeper* /usr/bin/hbase* /usr/bin/hive* /usr/bin/hdfs /usr/...

Global site tag (gtag.js) - Google Analytics