在上一讲<<云框架Hadoop之部署Hive>>上,我们谈到了hadoop的数据仓库hive.
下面我们说明一下hive的简单查询应用。
在hadoop环境下,shell下直接输入hive,就会出现hive shell操作界面。关于HIVE里的SQL,我习惯性的将HIVE的SQL语句叫做HQL,事实上HQL有很多和SQL类似的地方,还有一点要说明的是HQL数据存储位置是在Hadoop上的HDFS。
HIVE的数据类型 。HiveQL只支持以下几种基本数据类型TINYINT, SMALLINT, INT, BIGINT, DOUBLE, STRING。
支持的复杂数据类型有Structs, Maps, Arrays。
创建表。 Hive不同于其他数据库,它只有一个默认数据库"default" ,所有的table都保持在里面。
创建数据表:
CREATE TABLE test_change (a int, b int, c int);
解释:创建一个叫test_change的表,其中有字段a,b,c
create table test(a int,b int,c int);
查看表
SHOW TABLES;
如果你不知道表后缀,那么你也可以这样
SHOW TABLES 'page.*';
查看表结构
DESCRIBE TABLE;
删除表
DROP TABLE
修改表名
ALTER TABLE old_table_name RENAME TO new_table_name;
导入数据:
load data local inpath "/root/test.sql" overwrite into table test;
这里指的注意的一点是,test.sql里的数据内容是需要分隔符的,HIVE里面有自己的默认分隔符,我想
尽量用它默认的,这样就不会出现大问题
分享到:
相关推荐
Hadoop是一个开源框架,主要用于分布式存储和计算大规模数据集,而Hive则是一个基于Hadoop的数据仓库工具,提供了SQL-like查询语言(HQL)来方便地管理和分析存储在Hadoop上的大量数据。 **Hadoop的安装配置** 1. ...
Map-Reduce的过程解析.doc**、**Hadoop学习总结之五:Hadoop的运行痕迹.doc**、**Hadoop学习总结之二:HDFS读写过程解析.doc**:这些文档详细介绍了Hadoop分布式文件系统(HDFS)的基本概念、工作流程以及MapReduce...
该文档保护了目前比较流行的大数据平台的原理过程梳理。Hadoop,Hive,Hbase,Spark,MapReduce,Storm
Hadoop是分布式计算框架,而Hive是基于Hadoop的数据仓库工具,用于数据 warehousing 和 SQL-like 查询。另一方面,Sqoop是一个专门用于在Hadoop和关系数据库之间传输数据的工具。 首先,我们来看Hadoop HA(High ...
Hadoop是一个开源框架,主要用于分布式存储和计算大规模数据,而Hive则是建立在Hadoop之上的一种数据仓库工具,它提供了一种SQL-like的查询语言(HQL)来处理和分析大数据。下面将详细介绍这两个组件的安装过程以及...
这表明它可能包含了学习和实践Hadoop、Hive、Django和Echarts等技术的基础知识和应用场景,对学习者来说是一个很好的实战项目。 在压缩包子文件的文件名称列表中,"ok_x"可能是项目源代码或相关资源的文件名,具体...
在IT行业中,Hadoop、Hive和Pig是大数据处理领域的三大重要工具,它们共同构建了一个高效、可扩展的数据处理框架。以下是对这些技术的详细解释: **Hadoop** 是一个开源的分布式计算框架,由Apache软件基金会开发。...
Hadoop为大数据的存储和处理提供了一个强大的基础架构,而Hive则在这一基础上提供了更高级别的数据抽象和易用性。它们共同为处理日益增长的气象数据集提供了一种高效率、可扩展且安全的方案。同时,针对大数据的个人...
1、基于Hadoop+Hive构建数据仓库,使用django+echarts构建前端web网站对业务指标进行可视化呈现项目源码+说明(毕设).zip 2、该资源包括项目的全部源码,下载可以直接使用! 3、本项目适合作为计算机、数学、电子...
3. SQL查询:掌握HQL(Hive Query Language)的基本操作,如SELECT、JOIN、GROUP BY、HAVING、窗口函数等。 4. 存储和文件格式:了解Hive支持的不同文件格式(如TextFile、Parquet、ORC、Avro),以及它们各自的优...
Hadoop作为大数据生态的底层框架,Hive作为建立在Hadoop之上的数据仓库工具,二者在实际应用中都有着非常广泛的应用。淘宝作为国内知名的电商平台,其对Hadoop和Hive的调优以及开发经验具有较高的参考价值。 在对...
在IT行业中,大数据处理与分析是至关重要的领域,而Hadoop作为开源的分布式计算框架,是这个领域的核心组件。本压缩包"hadop安装文件.rar"提供了关于Hadoop及其相关组件(如Hive、HBase、Sqoop和MySQL)的安装步骤,...
大数据处理框架:Hadoop与Hive深度解析.docx
1. **Hadoop**:Hadoop是Apache软件基金会开发的一个开源框架,用于分布式存储和处理大规模数据。它的主要组成部分包括HDFS(Hadoop Distributed File System)和MapReduce。HDFS提供了高容错性的文件存储,而...
通过这些文件,用户不仅可以学习到Hadoop和Hive的基本概念、安装和使用,还能了解到ClickHouse这种新型的数据分析工具,以及如何管理和操作大数据集群。这将对想要从事大数据处理和分析工作的人员非常有帮助。
Hive是一个数据仓库基础构架,建立在Hadoop之上,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。ZooKeeper是一个开源的分布式协调服务,它为分布式应用提供一致性服务。 为了整合这些组件,首先...
标题中的“HDP3.1.5源码下载—hadoop hbase hive”指的是Hortonworks Data Platform(HDP)的3.1.5版本,它是一个全面的大数据解决方案,包含了对Hadoop、HBase和Hive等组件的源代码支持。这个版本是大数据开发者和...
Hive是一个建立在Hadoop之上的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL查询语言HQL(Hive Query Language),允许熟悉SQL的开发者能够快速上手处理大规模数据集。Hive支持普通的SQL查询,同时还...
分布式计算框架:MapReduce 集群资源管理器:YARN 单机伪集群环境搭建 集群环境搭建 常用 Shell 命令 Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 二、Hive 简介及核心概念 Linux 环境下 Hive 的安装...