`

hive 读取查询 hbase 数据

阅读更多

常出现的可能是版本问题,

我hbase使用的是0.96.x hive使用0.13.1版本

如果版本不对会报错。

将hbase lib下的相关包全部移至hive的lib里面,

如下包:

guava-12.0.1.jar

hbase-client-0.96.1.1-cdh5.0.2.jar

hbase-common-0.96.1.1-cdh5.0.2.jar

hbase-common-0.96.1.1-cdh5.0.2-tests.jar

hbase-protocol-0.96.1.1-cdh5.0.2.jar

hbase-server-0.96.1.1-cdh5.0.2.jar

htrace-core-2.01.jar

zookeeper-3.4.5-cdh5.0.2.jar

还有参数的设置

hive-site.xml

添加属性

hbase.zookeeper.quorum=192.168.8.163,192.168.8.164,192.168.8.165

然后开始写脚本

简单的实现就是hbase有多少个qulifier,就在hive的建表语句里建多少列,

有的人会对qulifier上百或上万列以上无法处理

这里hive支持map<String,String>

即key 是qulifier的数据,value是value 解决了以上难题。

CREATE external TABLE guid_uid_relationship_hbase (value map<string,string>, row_key string) 
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = "relation:,:key")
TBLPROPERTIES ("hbase.table.name" = "guid_uid_relationship");

  其中relation是family名字

即可开始查询

附上查询语句

select * from pms.guid_uid_relationship_hbase where array_contains(map_keys(value),'uid_157754941');

select * from guid_uid_relationship_hbase where value['uid_157754941']=157754941;

 over

 

 

分享到:
评论

相关推荐

    浅谈Hive vs. HBase

    - **HQL**:Hive 提供了一种称为 HiveQL 的查询语言,它支持 SQL 查询风格,使得熟悉 SQL 的用户能够轻松进行数据查询、汇总和分析。 - **灵活性**:MapReduce 开发者可以通过编写自定义的 mapper 和 reducer 来扩展...

    Hive、MySQL、HBase数据互导

    【Hive、MySQL、HBase数据互导】是大数据领域常见的数据处理操作,涉及三个不同的数据存储系统。Hive是一个基于Hadoop的数据仓库工具,它允许使用类SQL的查询语言HiveQL对大规模数据进行批处理和分析。MySQL是一种...

    scala-hive-HBASE-Api.7z

    4. 执行操作:使用提供的API进行数据查询、插入、更新和删除等操作。 5. 错误处理和关闭连接:确保在操作完成后关闭连接,避免资源泄漏。 对于Scala,你可以利用其强大的类型系统和高阶函数来编写简洁且可维护的...

    hive、Hbase、mysql的区别.docx

    总结来说,Hive适合大数据分析和报表生成,Hbase适合实时数据查询和海量数据存储,而MySQL适用于需要高并发、实时事务处理的场景。选择哪种数据库取决于具体的应用需求,如数据量、查询性能、事务处理和数据一致性...

    建立Hive和Hbase的映射关系,通过Spark将Hive表中数据导入ClickHouse

    这样,Hive查询可以通过HBase的表获取数据,反之亦然。映射的关键在于定义正确的SerDe(序列化/反序列化)类和配置参数,以确保Hive能理解HBase的行键和列族结构。 接下来,Spark作为一个分布式计算框架,提供了一...

    hive所有jar文件

    Hive-HBase连接器允许用户在Hive中创建外部表,将这些表映射到HBase的数据表,从而可以在Hive的SQL环境中直接对HBase数据进行查询和分析。在实际操作中,用户需要将这些JAR文件放入Hive的lib目录下,这是Hive加载其...

    spark-2.4.0-hive-hbase-Api.7z

    3. 从HBase中读取数据,转换成Spark DataFrame,方便进一步的数据处理和分析。 4. 利用Spark的MLlib库进行机器学习模型训练,预测和分类等任务。 在实际项目中,这些组件的集成可以帮助企业构建大规模数据处理平台...

    hadoop、hbase、hive等相关面试问题

    HBase数据结构 **知识点解析:** HBase的数据模型主要由行键(Row Key)、列族(Column Family)和列限定符(Column Qualifier)组成。每个单元格包含一个时间戳版本,这使得HBase能够存储多个版本的数据。 - **...

    HBase与hive整合 和 hive与hdfs结合的效率对比1

    HBase是一款基于Hadoop的分布式数据库,适用于实时查询和大规模数据存储,而Hive则是一个数据仓库工具,侧重于离线批处理和分析。本文将深入探讨HBase与Hive的整合方式,以及二者在查询性能上的对比。 一、HBase与...

    hbase与hive数据同步共4页.pdf.zip

    4. **HBase-Hive Bridge**: 通过建立HBase与Hive之间的桥接,使得Hive可以直接查询HBase中的数据,但这种方式可能会影响HBase的性能,因为它增加了HBase的读取压力。 5. **Apache Phoenix**: 这是一个SQL层,可以...

    hbase备份和数据恢复

    也可以使用HBaseSerDe来解析HBase数据。 三、HBase和HDFS互导 1. HBase到HDFS:可以通过HBase的Export工具,将HBase表的数据导出到HDFS文件,然后进行进一步处理或备份。 2. HDFS到HBase:可以使用HBase的Import...

    datax数据从hive导入mysql数据缺失解决

    Hive 通常用于存储海量数据并进行批处理分析,而 MySQL 则用于存储结构化数据并提供快速查询服务。为了实现两者之间的数据交换,DataX 作为一种开源的数据同步工具被广泛应用。 #### 问题描述 在使用 DataX 将数据...

    impala依赖cdh版本的hadoop-hbase-hive相关jar包.zip

    当Hive与HBase结合时,可以通过Hive查询HBase中的数据,形成Hive外部表。hive-beeline.jar是Hive的命令行接口,方便用户执行HQL查询。 Hadoop-YARN(Yet Another Resource Negotiator)是Hadoop的资源管理系统,...

    大规模数据查询Hive及Impala技术原理及架构.pdf

    ### 大规模数据查询Hive及Impala技术原理及架构 #### 第一部分:Hive数据查询分析技术和实例介绍 **一、Hive简介** Hive 是一个基于 Hadoop 的数据仓库工具,它允许用户轻松地将结构化数据文件映射为表,并利用 ...

    hbase资料_hbase-default.xml.zip

    `hbase.hregion.flushsize`设定Region刷写到HDFS的阈值,`hbase.hregion.majorcompaction.interval`和`hbase.hregion.minorcompaction.interval`分别是大、小合并的间隔时间,影响数据的紧凑性和读取效率。...

    kettle 从oracle数据库导数据到hive 表

    在企业级数据处理场景中,随着大数据技术的发展,越来越多的企业选择将原有的关系型数据库(如 Oracle)中的数据迁移到基于 Hadoop 生态系统的数据仓库(如 Hive、HBase)中。这种迁移不仅可以充分利用大数据平台的...

    聊聊Hbase存储优化那些事(下).pdf

    若需将Hbase数据导出,可以通过Hive的Hbase外表,将Hbase数据关联到Hive表,然后执行SELECT ... INTO OUTFILE语句导出数据到文件。 大数据处理和分析是现代企业决策、创新和运营的关键。通过Hbase和Hive的结合,...

    Hive2.x系列驱动,

    标题 "Hive2.x系列驱动" 指的是Hive版本2.x的客户端连接器,这些驱动程序使得应用程序能够与Hive服务器进行交互,执行SQL查询并获取数据。Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL语言处理存储在HDFS...

    实验4 HBase_Hive1

    - **数据查询**:使用Hive SQL进行数据查询,例如查询出现次数大于300的词语,以及查询并输出前100个出现次数最多的词。 #### 三、实验注意事项 - **截图要求**:实验报告中需附上用于展示每一步操作结果的屏幕截图...

Global site tag (gtag.js) - Google Analytics