hive 读取查询 hbase 数据 - 追求专业 - ITeye博客

`

xiangjinqi

浏览: 170882 次
性别:
来自: 武汉

最近访客更多访客>>

babyxingqing

为了ta

jxjyzzc

无缘高富帅

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

hive 读取查询 hbase 数据

博客分类：

hive
hbase

阅读更多

常出现的可能是版本问题，

我hbase使用的是0.96.x hive使用0.13.1版本

如果版本不对会报错。

将hbase lib下的相关包全部移至hive的lib里面，

如下包：

guava-12.0.1.jar

hbase-client-0.96.1.1-cdh5.0.2.jar

hbase-common-0.96.1.1-cdh5.0.2.jar

hbase-common-0.96.1.1-cdh5.0.2-tests.jar

hbase-protocol-0.96.1.1-cdh5.0.2.jar

hbase-server-0.96.1.1-cdh5.0.2.jar

htrace-core-2.01.jar

zookeeper-3.4.5-cdh5.0.2.jar

还有参数的设置

hive-site.xml

添加属性

hbase.zookeeper.quorum=192.168.8.163,192.168.8.164,192.168.8.165

然后开始写脚本

简单的实现就是hbase有多少个qulifier,就在hive的建表语句里建多少列，

有的人会对qulifier上百或上万列以上无法处理

这里hive支持map<String,String>

即key 是qulifier的数据，value是value 解决了以上难题。

CREATE external TABLE guid_uid_relationship_hbase (value map<string,string>, row_key string) 
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = "relation:,:key")
TBLPROPERTIES ("hbase.table.name" = "guid_uid_relationship");

其中relation是family名字

即可开始查询

附上查询语句

select * from pms.guid_uid_relationship_hbase where array_contains(map_keys(value),'uid_157754941');

select * from guid_uid_relationship_hbase where value['uid_157754941']=157754941;

over

分享到：

storm 实时 | 数据平台之sqoop实践

2014-10-22 17:50
浏览 1827
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

浅谈Hive vs. HBase: - **HQL**：Hive 提供了一种称为 HiveQL 的查询语言，它支持 SQL 查询风格，使得熟悉 SQL 的用户能够轻松进行数据查询、汇总和分析。 - **灵活性**：MapReduce 开发者可以通过编写自定义的 mapper 和 reducer 来扩展...

Hive、MySQL、HBase数据互导: 【Hive、MySQL、HBase数据互导】是大数据领域常见的数据处理操作，涉及三个不同的数据存储系统。Hive是一个基于Hadoop的数据仓库工具，它允许使用类SQL的查询语言HiveQL对大规模数据进行批处理和分析。MySQL是一种...

scala-hive-HBASE-Api.7z: 4. 执行操作：使用提供的API进行数据查询、插入、更新和删除等操作。 5. 错误处理和关闭连接：确保在操作完成后关闭连接，避免资源泄漏。对于Scala，你可以利用其强大的类型系统和高阶函数来编写简洁且可维护的...

hive、Hbase、mysql的区别.docx: 总结来说，Hive适合大数据分析和报表生成，Hbase适合实时数据查询和海量数据存储，而MySQL适用于需要高并发、实时事务处理的场景。选择哪种数据库取决于具体的应用需求，如数据量、查询性能、事务处理和数据一致性...

建立Hive和Hbase的映射关系，通过Spark将Hive表中数据导入ClickHouse: 这样，Hive查询可以通过HBase的表获取数据，反之亦然。映射的关键在于定义正确的SerDe（序列化/反序列化）类和配置参数，以确保Hive能理解HBase的行键和列族结构。接下来，Spark作为一个分布式计算框架，提供了一...

hive所有jar文件: Hive-HBase连接器允许用户在Hive中创建外部表，将这些表映射到HBase的数据表，从而可以在Hive的SQL环境中直接对HBase数据进行查询和分析。在实际操作中，用户需要将这些JAR文件放入Hive的lib目录下，这是Hive加载其...

spark-2.4.0-hive-hbase-Api.7z: 3. 从HBase中读取数据，转换成Spark DataFrame，方便进一步的数据处理和分析。 4. 利用Spark的MLlib库进行机器学习模型训练，预测和分类等任务。在实际项目中，这些组件的集成可以帮助企业构建大规模数据处理平台...

hadoop、hbase、hive等相关面试问题: HBase数据结构 **知识点解析：** HBase的数据模型主要由行键（Row Key）、列族（Column Family）和列限定符（Column Qualifier）组成。每个单元格包含一个时间戳版本，这使得HBase能够存储多个版本的数据。 - **...

HBase与hive整合和 hive与hdfs结合的效率对比1: HBase是一款基于Hadoop的分布式数据库，适用于实时查询和大规模数据存储，而Hive则是一个数据仓库工具，侧重于离线批处理和分析。本文将深入探讨HBase与Hive的整合方式，以及二者在查询性能上的对比。一、HBase与...

项目实战——Spark将Hive表的数据写入ElasticSearch（Java版本）: Hive是一个基于Hadoop的数据仓库工具，它允许用户使用SQL语法进行数据查询和分析。在本项目中，我们首先需要从Hive表中提取数据。Hive提供了丰富的接口供外部应用访问，包括Hive JDBC和Hive SerDe（Serializer/...

hbase与hive数据同步共4页.pdf.zip: 4. **HBase-Hive Bridge**: 通过建立HBase与Hive之间的桥接，使得Hive可以直接查询HBase中的数据，但这种方式可能会影响HBase的性能，因为它增加了HBase的读取压力。 5. **Apache Phoenix**: 这是一个SQL层，可以...

hbase备份和数据恢复: 也可以使用HBaseSerDe来解析HBase数据。三、HBase和HDFS互导 1. HBase到HDFS：可以通过HBase的Export工具，将HBase表的数据导出到HDFS文件，然后进行进一步处理或备份。 2. HDFS到HBase：可以使用HBase的Import...

datax数据从hive导入mysql数据缺失解决: Hive 通常用于存储海量数据并进行批处理分析，而 MySQL 则用于存储结构化数据并提供快速查询服务。为了实现两者之间的数据交换，DataX 作为一种开源的数据同步工具被广泛应用。 #### 问题描述在使用 DataX 将数据...

impala依赖cdh版本的hadoop-hbase-hive相关jar包.zip: 当Hive与HBase结合时，可以通过Hive查询HBase中的数据，形成Hive外部表。hive-beeline.jar是Hive的命令行接口，方便用户执行HQL查询。 Hadoop-YARN（Yet Another Resource Negotiator）是Hadoop的资源管理系统，...

大规模数据查询Hive及Impala技术原理及架构.pdf: ### 大规模数据查询Hive及Impala技术原理及架构 #### 第一部分：Hive数据查询分析技术和实例介绍 **一、Hive简介** Hive 是一个基于 Hadoop 的数据仓库工具，它允许用户轻松地将结构化数据文件映射为表，并利用 ...

kettle 从oracle数据库导数据到hive 表: 在企业级数据处理场景中，随着大数据技术的发展，越来越多的企业选择将原有的关系型数据库（如 Oracle）中的数据迁移到基于 Hadoop 生态系统的数据仓库（如 Hive、HBase）中。这种迁移不仅可以充分利用大数据平台的...

hbase资料_hbase-default.xml.zip: `hbase.hregion.flushsize`设定Region刷写到HDFS的阈值，`hbase.hregion.majorcompaction.interval`和`hbase.hregion.minorcompaction.interval`分别是大、小合并的间隔时间，影响数据的紧凑性和读取效率。...

聊聊Hbase存储优化那些事（下）.pdf: 若需将Hbase数据导出，可以通过Hive的Hbase外表，将Hbase数据关联到Hive表，然后执行SELECT ... INTO OUTFILE语句导出数据到文件。大数据处理和分析是现代企业决策、创新和运营的关键。通过Hbase和Hive的结合，...

Hive2.x系列驱动，: 标题 "Hive2.x系列驱动" 指的是Hive版本2.x的客户端连接器，这些驱动程序使得应用程序能够与Hive服务器进行交互，执行SQL查询并获取数据。Hive是一个基于Hadoop的数据仓库工具，它允许用户使用SQL语言处理存储在HDFS...

Global site tag (gtag.js) - Google Analytics