1.目录篇
创建表目录
create database companys
create database companys location table
create database companys location table with dbproperties('name'='kedde','data'='2012-01-02')
查看database信息,无法查看当前表目录
describe database companys
describe database extended companys
改变默认的表目录
use companys
删除表目录
drop database financials
修改表目录属性,无法删除表属性
alter database financials setdbproperties('owner'='dirk')
2.表篇
新建表 mydb必须是存在的,location可以不存在,hive会新建
CREATE TABLE IF NOT EXISTS mydb.employees (
name STRING COMMENT 'Employee name',
salary FLOAT COMMENT 'Employee salary',
subordinates ARRAY<STRING> COMMENT 'Names of subordinates',
deductions MAP<STRING, FLOAT>
COMMENT 'Keys are deductions names, values are percentages',
address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
COMMENT 'Home address')
COMMENT 'Description of the table'
TBLPROPERTIES ('creator'='me', 'created_at'='2012-01-02 10:00:00', ...)
LOCATION '/user/hive/warehouse/mydb.db/employees';
新建表,copy已有表结构schema,不包含数据
create table if not exists mydb.empoyees link mydb.employees;
查看表
show tables;
show tables in companys;
show tables 'emp.*'; #注意是.*
查看表信息
describe extended companys.tables;
规定分隔符为/t
row format delimited fields terminated by '/t';
相关推荐
在大数据处理领域,Hadoop 和 Hive 是两个非常关键的组件。Hadoop 是一个开源框架,主要用于存储和处理大规模数据,而 Hive 则是构建在 Hadoop 上的数据仓库工具,它提供了 SQL 式的查询语言(HQL)来方便地对大数据...
+ 解压缩 Hive 软件包到/usr/local/src/目录下 + 设置 Hive 软件包的环境变量 ### 1.4.2 实验任务二:设置 Hive 环境 * 步骤一:关闭防火墙服务 + 使用 systemctl 命令关闭防火墙服务 + 设置防火墙服务开机不...
3. 修改 hive 目录归属用户和组。 5. 实验总结 通过本实验,您已经学习了如何安装和配置 Hive 组件,掌握了 Hive 组件的安装配置和格式化和启动。 Hive 是基于 Hadoop 的数据仓库工具,用于对大规模数据进行处理和...
第1章:Hive基本架构及环境部署 1.MapReduce分析与SQL分析对比 2.Hive的介绍及其发展 3.Hive的安装部署及启动 4.Hive的基本架构讲解 5.安装MySQL作为元数据库存储 6.配置Hive使用MySQL作为元数据库存储 7.Hive中基本...
总之,HiveSQL的DML操作中的`LOAD DATA`命令是将数据文件移动到Hive表对应目录的关键步骤,它允许快速地将数据导入到表中,且支持覆盖原有数据或追加新数据。了解并熟练掌握这一操作对于高效处理大数据至关重要。
【Hive函数重要应用案例1】本章主要探讨在Hive中处理特殊数据格式的技巧,特别是涉及多字节分隔符和字段内包含分隔符的问题。在Hive中,通常使用单字节分隔符(如逗号、制表符)来加载文本数据,但在实际场景中,...
#### 第二章:虫子角色介绍 本书详细介绍了每种虫子的特性和使用方法: - **皇后蜂**:作为核心棋子,其安全至关重要。 - **甲虫**:用于压制对手或保护己方关键位置。 - **蚂蚁**:灵活性高,适合快速包围。 - **...
Hadoop 2.0 生态系统第二章 数据库及数据管理Hive2
### 高级软件人才培训专家-Hadoop课程资料-5-第五章 - 分布式SQL计算 Hive 语法与概念 #### 知识点概览 本章节主要围绕分布式SQL计算工具——Hive进行深入讲解,包括Hive的基本概念、语法结构以及如何通过Hive对...
### 大数据技术 Hadoop开发者第二期 MapReduce HDFS Hive Mahout HBase 相关知识点解析 #### 一、Hadoop 业界资讯 - **InfoWorld 授予 Apache Hadoop 年度技术创新奖章** - **背景**:2010年1月,InfoWorld 授予 ...
第8章 数据仓库hive 第9章 Hbase实战 第10章 大数据辅助框架 第11章 数据仓库 第12章 Zookeeper及Hadoop高可用(录播) 第13章 数据仓库项目(点播) 第14章 Scala函数式编程语言 第15章 spark 计算框架 第16章 ...
本篇内容主要围绕清华大学精品大数据实战课程中的第二章——Hadoop基础进行深入解析。Hadoop作为大数据处理的核心框架,是学习大数据技术的重要起点。通过这份32页的PPT课件,我们将深入了解Hadoop的基本概念、架构...
第二章通常会介绍Hadoop的基础知识,包括Hadoop的起源、设计哲学以及其在处理大规模数据时的核心组件。在这个上下文中,上传的气象数据文件很可能是用于示例或练习,帮助读者理解如何在Hadoop环境中存储、处理和分析...
标题中的“大数据导论-第二章-大数据处理架构Hadoop”揭示了这组课件主要集中在大数据的基础理论以及Hadoop这一关键的大数据处理框架上。Hadoop是Apache软件基金会的一个开源项目,它为大规模数据集提供了分布式计算...
第二章主要讲解大数据应用开发的思路和环境配置,涉及大数据系统读写操作的开发流程、Java开发环境的配置以及Hadoop环境的搭建。 第三章深入探讨了HDFS(Hadoop分布式文件系统),学生需掌握HDFS的基本操作和Java...
第二章 HDFS分布式文件系统 2.1_HDFS概述及应用场景-HDFS系统架构 2.2_关键特性介绍 第三章 MapReduce分布式离线批处理和Yarn资源协调 3.1_MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2_Yarn的资源...
第12章 Hive 1.1 安装Hive 1.1.1 Hive外壳环境 1.2 示例 1.3 运行Hive 1.3.1 配置Hive 1.3.2 Hive服务 1.3.3 Metastore 1.4 和传统数据库进行比较 1.4.1 读时模式(Schema on Read)vs.写时模式...
02第二章分布式文件系统.pdf 03第三章Hive分布式数据仓库.pdf 04第四章HBase技术原理,pdf O5第五章MapReduce和YARN技术原理.pdf 06第六章Spak基于内存的分布式计算。pdf 07第七章Flink流批体分布式实时处理引擎pdf ...