hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
hive安装:
1.tar -xzvf hive*
2.hdfs hadoop fs -mkdir /tmp
hdfs hadoop fs -mkdir /user/hive/warehouse
hdfs hadoop fs -chmod g+w /tmp
hdfs hadoop fs -chmod g+w /user/hive/warehouse
3.export HADOOP_HOME=
4.cd hive/bin ./hive进入hive shell环境
常用命令:
show databases;查看数据仓库;
use test;切换database;
create database test1;创建数据库;
describe database test;查看数据库结构;
drop database test1;
dfs -ls 可以看hadoop hdfs目录下的文件;
create table tab_name(id int,name string);创建表
load data local inpath '/home/a.txt' into table tab_name;把文件导入hive表
select * from tab_name;
这个时候查出的数据是null,因为hive并不知道怎么解析txt中的数据。
需要重新创建这张表
drop table tab_name;
create table tab_name(id int,name string) row format delimited fields terminated by ',';
select * from tab_name;现在就有了
dfs fs ./hive/warehouse/tab_name这个时候hive只是把这个文件拷贝到hdfs文件系统当中。
load data local inpath '/home/a.txt' into table tab_name;再调用一次,load相同文件,这个时候hdfs中就有两个文件。其实还是同一个文件。只是文件名不同。
load data local inpath '/home/b.txt' into table tab_name;再调用一次,load不同文件。
hive不会做任何数据的转换,只是对你存储数据的结构做一个描述,来解析文件中的数据。
load data local inpath '/home/a.txt' overwrite into table tab_name;原来表中的文件都会被清空,将新的数据插入到hdfs。
select * from tab_name where id = 2;这时候hive就启动一个mapreduce任务,做一个查找。只有有条件,都会产生mapreduce任务,对hdfs进行一个查找。
分享到:
相关推荐
Hive基本操作命令大全 Hive是一个基于Hadoop的数据仓库工具,可以使用SQL语言来查询和管理大规模数据。本文档将详细介绍Hive的基本操作命令,从创建表、加载数据、查询数据到数据管理等方面进行整理。 创建表 ...
Hive基本命令整理 作为大数据处理的重要工具,Hive 提供了许多实用的命令来帮助开发人员高效地处理和分析数据。下面是 Hive 中的一些基本命令整理,涵盖了表的创建、加载数据、查看结构信息、更新表名、添加新列、...
从提供的文件内容中,我们可以提取到关于Hive安装与配置的相关知识点,同时也包括了MySQL的安装知识,因为MySQL是Hive常用的后端数据库。接下来,我将详细介绍这些知识点。 **Hive的安装与配置** 1. Hive是一个...
以下是安装 Hive 的基本步骤: 1. **下载 Hive**:访问 Apache 官网(https://hive.apache.org/),下载最新稳定版本的 Hive。 2. **解压并配置环境变量**:将下载的 Hive 压缩包解压到合适的位置,然后在系统的...
Hadoop之Hive安装 本篇文章将指导您如何在CentOS 6.4下安装Hive,并解决可能遇到的错误。 环境及软件介绍 本篇文章使用的环境是CentOS 6.4-x86_64-bin-DVD1.iso,软件版本为Hadoop 2.2.0和Hive 0.12.0,以及MySQL...
以上就是关于Hive基本命令操作的一些核心知识点,包括创建表、查看表结构、数据加载以及查询等。在实际操作中,根据业务需求选择合适的数据模型(如分区表)并正确地管理数据,能够极大地提高数据处理的效率和便利性...
通过以上步骤,可以完成Hive的基本安装与配置。无论是最简安装还是标准安装,都需要根据实际情况选择合适的方案。在生产环境中推荐使用标准安装,这样可以更好地支持多用户并发访问,并且易于维护和管理。同时,对于...
完成以上步骤后,Hive 就完成了基本的安装和配置。接下来可以启动 Hive,执行 SQL 查询,测试是否能够正常工作。 ### 结论 本文详细介绍了如何在 Linux 系统下安装和配置 Hive,包括下载、解压、配置环境变量、配置...
hive 基本操作的命令和hive 实用命令等,有利与学习hive和mysql
hive 常用命令大全,包含分区域表、函数,常用命令等
以下是对Hive安装及相关知识的详细讲解: **一、Hive简介** Hive最初由Facebook开发,用于解决海量日志数据分析的问题。它将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,使得非专业的编程人员也能对...
Hive 教程--命令 Hive 是一种数据库技术,可以定义数据库和表来分析结构化数据。主题结构化数据分析是以表方式存储数据,并通过查询来分析。 创建数据库 创建数据库是 Hive 中最基本的操作之一。Hive 中的数据库...
### Hive常用命令详解 Hive是一款基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类似SQL的查询语言HQL,让使用者能够方便地进行数据查询与分析。以下是对给定文件中提到的Hive常用...
Hive 常用的 SQL 命令操作 Hive 是一个基于 Hadoop 的数据仓储工具,提供了类似于 MySQL 的 SQL 查询语言,支持各种复杂的数据操作。下面是 Hive 中常用的 SQL 命令操作。 1. 查看所有函数 Hive 提供了很多的函数...
6. 将Hive的安装目录和bin目录加入到系统的环境变量中,这样可以在任何路径下使用Hive命令。这通常在/etc/profile文件中完成。 7. 启动和关闭Hadoop集群的命令,包括启动YARN和HDFS的脚本以及停止它们的脚本,这些...
根据提供的文件信息,以下是对Hive数据库安装及基本使用的知识点总结。 ### Hive数据库的安装及基本使用 #### 一、CentOS7安装MySQL 5.7 1. **安装wget** 使用yum工具安装wget,这是用于从网络上下载文件的工具...
Hive支持基本的SQL操作,如SELECT、JOIN、GROUP BY等。对于大数据查询,可考虑以下优化策略: - 分桶(Bucketing)和分区(Partitioning):通过预分桶或分区减少数据扫描量。 - 优化JOIN操作:避免全表JOIN,利用...
### HBase 常用命令总结 ...以上总结了HBase和Hive中常用的命令,这些命令可以帮助用户更高效地管理、查询和分析大规模数据集。在实际应用中,根据具体需求灵活运用这些命令能够大大提高数据分析和处理效率。
3. 导入数据到`stocks`表,这是通过LOAD DATA命令实现的,将csv文件的数据加载到Hive表中。 4. 创建未分区的外部表`dividends_unpartitioned`,然后从csv文件导入数据。外部表的元数据由Hive管理,但数据本身的位置...