HIVE Indexex 索引 - 松篁 - ITeye博客

`

k_lb

浏览: 834033 次
性别:
来自: 郑州

最近访客更多访客>>

u012363178

rattersnake

LuffyMother

uclnn

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

kitleer：据我所知，国内有款ETL调度监控工具TaskCTL，支持ket ...
kettle调度

HIVE Indexex 索引

阅读更多

Creating an Index -- 创建一个索引

CREATE TABLE employees (
  name         STRING,
  salary       FLOAT,
  subordinates ARRAY<STRING>,
  deductions   MAP<STRING, FLOAT>,
  address      STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
)
PARTITIONED BY (country STRING, state STRING);

Let’s index on the country partition only:

CREATE INDEX employees_index
ON TABLE employees (country)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler'
WITH DEFERRED REBUILD
IDXPROPERTIES ('creator = 'me', 'created_at' = 'some_time')
IN TABLE employees_index_table
PARTITIONED BY (country, name)
COMMENT 'Employees indexed by country and name.';

Bitmap Indexes

Hive v0.8.0 adds a built-in bitmap index handler. Bitmap indexes are commonly used
for columns with few distinct values. Here is our previous example rewritten to use the
bitmap index handler:

CREATE INDEX employees_index
ON TABLE employees (country)
AS 'BITMAP'
WITH DEFERRED REBUILD
IDXPROPERTIES ('creator = 'me', 'created_at' = 'some_time')
IN TABLE employees_index_table
PARTITIONED BY (country, name)
COMMENT 'Employees indexed by country and name.';

Rebuilding the Index

ALTER INDEX employees_index
ON TABLE employees
PARTITION (country = 'US')
REBUILD;

Showing an Index

SHOW FORMATTED INDEX ON employees;

Dropping an Index

DROP INDEX IF EXISTS employees_index ON TABLE employees;

分享到：

HIVE Schema Design 模式设计 | HIVE VIEW 视图

2013-01-22 21:10
浏览 382
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hive视图和索引.md: Hive视图和索引，基础篇

hive客户端安装_hive客户端安装_hive_: 在大数据处理领域，Hive是一个非常重要的工具，它提供了一个基于Hadoop的数据仓库基础设施，用于数据查询、分析和管理大规模数据集。本教程将详细讲解如何在Linux环境下安装Hive客户端，以便进行数据操作和分析。 ...

HIVE安装及详解: "HIVE安装及详解" HIVE是一种基于Hadoop的数据仓库工具，主要用于处理和分析大规模数据。下面是关于HIVE的安装及详解。 HIVE基本概念 HIVE是什么？HIVE是一种数据仓库工具，主要用于处理和分析大规模数据。它将...

尚硅谷大数据视频_Hive视频教程: 7. **视图与索引**：学习如何创建和使用视图简化复杂查询，以及Hive的索引机制，虽然Hive的索引功能相对有限，但仍然可以提高某些查询的速度。 8. **数据倾斜与优化**：了解数据倾斜问题，这是大数据处理中的常见...

hive2.1.1中orc格式读取报数组越界错误解决方法: 它提供了压缩、索引和列式存储等特性，能够极大地提高查询性能。然而，有时候在使用ORC格式读取数据时，可能会遇到“数组越界”错误，这通常是由于软件bug或者不兼容性导致的。 “数组越界”错误是Java编程语言中...

Hive_JDBC.zip_hive java_hive jdbc_hive jdbc pom_java hive_maven连: 在大数据处理领域，Apache Hive是一个基于Hadoop的数据仓库工具，它允许用户使用SQL（HQL，Hive Query Language）查询存储在Hadoop集群中的大型数据集。Hive JDBC（Java Database Connectivity）是Hive提供的一种...

Ambari下Hive3.0升级到Hive4.0: 在大数据领域，Apache Ambari 是一个用于 Hadoop 集群管理和监控的开源工具，而 Hive 是一个基于 Hadoop 的数据仓库系统，用于处理和分析大规模数据集。本话题聚焦于如何在 Ambari 环境下将 Hive 3.0 升级到 Hive ...

Hive驱动1.1.0.zip: 在大数据处理领域，Hive是一个基于Hadoop的数据仓库工具，它允许用户使用SQL（HQL，Hive Query Language）查询和管理存储在Hadoop分布式文件系统（HDFS）中的大量结构化数据。Hive 1.1.0是Hive的一个版本，提供了...

Hive3.1.2编译源码: 使用hive3.1.2和spark3.0.0配置hive on spark的时候，发现官方下载的hive3.1.2和spark3.0.0不兼容，hive3.1.2对应的版本是spark2.3.0，而spark3.0.0对应的hadoop版本是hadoop2.6或hadoop2.7。所以，如果想要使用高...

连接hive依赖的jar包_hive连接方式: 在大数据处理领域，Hive是一个基于Hadoop的数据仓库工具，它可以将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，使得用户可以使用SQL语句来处理存储在Hadoop分布式文件系统（HDFS）上的大数据。...

HIVE从入门到精通.pdf: - **数据存储**：Hive的数据存储建立在HDFS之上，不使用特定的数据格式，也不支持索引。用户可以自定义列和行的分隔符以解析数据。Hive支持表、外部表、分区和桶等数据模型。 #### 二、Hive的安装与配置 - **安装...

Hive总结.docx: - 利用索引加速查询。 - 合理选择计算引擎，Tez和Spark相对于MapReduce能提供更好的性能。 - 减少数据倾斜，通过数据预处理、分区优化等方式避免部分节点负担过重。【数据倾斜】数据倾斜是指在分布式计算过程中，...

DBeaver链接hive驱动包下载： hive-jdbc-uber-2.6.5.0-292.jar: 《DBeaver与Hive连接：hive-jdbc-uber-2.6.5.0-292.jar驱动详解》在大数据处理领域，Hive作为一个基于Hadoop的数据仓库工具，广泛用于数据查询和分析。而DBeaver，作为一款跨平台的数据库管理工具，以其用户友好的...

hive相关jar包: 在大数据处理领域，Hive是一个基于Hadoop的数据仓库工具，它允许用户使用SQL（HQL，Hive Query Language）查询和管理存储在Hadoop分布式文件系统（HDFS）中的大量数据。Hive提供了数据整合、元数据管理、查询和分析...

Hive表生成工具，Hive表生成工具Hive表生成工具: Hive表生成工具，Hive表生成工具Hive表生成工具

开发高效的hive程序: 3. 索引：Hive的索引功能虽然有限，但依然可以用于加速某些查询。创建Bucketing或Skewed Join索引可以帮助优化JOIN操作。 4. 内存调优：调整Hive的内存配置参数，如mapreduce.map.memory.mb和mapreduce.reduce....

《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf: 《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf《Hive数据仓库案例教程》教学课件第5章 Hive数据操作.pdf《Hive数据仓库案例教程》教学课件第...

13-Hive基本操作1: Hive支持创建索引以优化查询性能，但这个功能并不广泛使用，因为Hive主要针对大数据的离线分析。 11. **表的分区和桶**：分区允许将大表逻辑上划分为更小的部分，以便于查询优化。例如，`CREATE TABLE my_table ...

hive-site.xml: hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+hadoop配置文件hive+...

SpringBoot整合hive-jdbc示例: **SpringBoot整合Hive-JDBC详解** 在大数据处理领域，Hadoop生态中的Hive作为一个数据仓库工具，常常用于处理大规模的数据分析任务。而SpringBoot作为Java开发中的微服务框架，以其简洁的配置和快速的开发能力深受...

Global site tag (gtag.js) - Google Analytics