`
yugouai
  • 浏览: 505789 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Hive索引Demo

 
阅读更多

 

一、创建表

CREATE TABLE employees (  
  name         STRING,  
  salary       FLOAT,  
  subordinates ARRAY<STRING>,  
  deductions   MAP<STRING, FLOAT>,  
  address      STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
)  
PARTITIONED BY (country STRING, state STRING); 

 

二、创建PATITION:country索引

CREATE INDEX employees_index  
ON TABLE employees (country)  
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler'  
WITH DEFERRED REBUILD  
IDXPROPERTIES ('creator = 'me', 'created_at' = 'some_time')  
IN TABLE employees_index_table  
PARTITIONED BY (country, name)  
COMMENT 'Employees indexed by country and name.'; 

 

三、Bitmap Indexes

Hive从0.8.0版本开始,增加了built-in bitmap作为索引处理器。

bitmap一般用在列值含有比较少的distinct value,也就是说列值的相同数据比较多的情景。

CREATE INDEX employees_index  
ON TABLE employees (country)  
AS 'BITMAP'  
WITH DEFERRED REBUILD  
IDXPROPERTIES ('creator = 'me', 'created_at' = 'some_time')  
IN TABLE employees_index_table  
PARTITIONED BY (country, name)  
COMMENT 'Employees indexed by country and name.';

 

rebulid 索引

ALTER INDEX employees_index  
ON TABLE employees  
PARTITION (country = 'US')  
REBUILD;  

 

查看索引信息

SHOW FORMATTED INDEX ON employees;  

 

删除索引

DROP INDEX IF EXISTS employees_index ON TABLE employees;  

 

 

分享到:
评论

相关推荐

    用jest客户端将数据从hive导入elasticsearch

    在分析和使用这些代码时,理解Elasticsearch的索引结构、Jest的API以及Hive的查询语法至关重要。 总结来说,这个过程涉及了Java编程、Hive JDBC连接、Elasticsearch的Jest客户端和数据迁移策略。了解并熟练掌握这些...

    hive常用函数参考手册.docx

    2. **复杂类型访问**:通过索引或其他方式访问复杂类型的元素。 3. **复杂类型长度**:获取数组或映射的长度。 #### 六、特殊函数 特殊函数包括窗口函数和分析函数等: 1. **窗口函数**: - `LEAD` 和 `LAG`:...

    《Hadoop3.X大数据开发实战(视频教学版)》随书示例代码

    `05_hive_jdbc_demo`和`05_hive_udf_demo`涉及到Hive,一个基于Hadoop的数据仓库工具。前者通过JDBC接口演示了如何连接和查询Hive,后者则展示了如何自定义Hive的用户定义函数(UDF),扩展Hive的功能。 `07_flume_...

    手把手教你Hadoop环境搭建、词频统计demo及原理

    Hadoop生态圈包括许多相关的开源项目,如Hive(数据仓库工具)、Pig(数据分析工具)、Spark(快速大数据处理引擎)、HBase(NoSQL数据库)、Zookeeper(分布式协调服务)等,它们共同构成了一个强大的大数据处理...

    新版Hadoop视频教程 段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发

    09-倒排索引的mr实现.avi 10-多个job在同一个main方法中提交.avi 第五天 hadoop2.x中HA机制的原理和全分布式集群安装部署及维护 01-zookeeper.avi 02-zookeeper2.avi 03-NN高可用方案的要点1.avi 04-hadoop-...

Global site tag (gtag.js) - Google Analytics