一、创建表
CREATE TABLE employees ( name STRING, salary FLOAT, subordinates ARRAY<STRING>, deductions MAP<STRING, FLOAT>, address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT> ) PARTITIONED BY (country STRING, state STRING);
二、创建PATITION:country索引
CREATE INDEX employees_index ON TABLE employees (country) AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' WITH DEFERRED REBUILD IDXPROPERTIES ('creator = 'me', 'created_at' = 'some_time') IN TABLE employees_index_table PARTITIONED BY (country, name) COMMENT 'Employees indexed by country and name.';
三、Bitmap Indexes
Hive从0.8.0版本开始,增加了built-in bitmap作为索引处理器。
bitmap一般用在列值含有比较少的distinct value,也就是说列值的相同数据比较多的情景。
CREATE INDEX employees_index ON TABLE employees (country) AS 'BITMAP' WITH DEFERRED REBUILD IDXPROPERTIES ('creator = 'me', 'created_at' = 'some_time') IN TABLE employees_index_table PARTITIONED BY (country, name) COMMENT 'Employees indexed by country and name.';
rebulid 索引
ALTER INDEX employees_index ON TABLE employees PARTITION (country = 'US') REBUILD;
查看索引信息
SHOW FORMATTED INDEX ON employees;
删除索引
DROP INDEX IF EXISTS employees_index ON TABLE employees;
相关推荐
在分析和使用这些代码时,理解Elasticsearch的索引结构、Jest的API以及Hive的查询语法至关重要。 总结来说,这个过程涉及了Java编程、Hive JDBC连接、Elasticsearch的Jest客户端和数据迁移策略。了解并熟练掌握这些...
2. **复杂类型访问**:通过索引或其他方式访问复杂类型的元素。 3. **复杂类型长度**:获取数组或映射的长度。 #### 六、特殊函数 特殊函数包括窗口函数和分析函数等: 1. **窗口函数**: - `LEAD` 和 `LAG`:...
`05_hive_jdbc_demo`和`05_hive_udf_demo`涉及到Hive,一个基于Hadoop的数据仓库工具。前者通过JDBC接口演示了如何连接和查询Hive,后者则展示了如何自定义Hive的用户定义函数(UDF),扩展Hive的功能。 `07_flume_...
Hadoop生态圈包括许多相关的开源项目,如Hive(数据仓库工具)、Pig(数据分析工具)、Spark(快速大数据处理引擎)、HBase(NoSQL数据库)、Zookeeper(分布式协调服务)等,它们共同构成了一个强大的大数据处理...
09-倒排索引的mr实现.avi 10-多个job在同一个main方法中提交.avi 第五天 hadoop2.x中HA机制的原理和全分布式集群安装部署及维护 01-zookeeper.avi 02-zookeeper2.avi 03-NN高可用方案的要点1.avi 04-hadoop-...