`

Hive CLI

 
阅读更多

 

1、创内部建表,hive把数据移动到仓库目录,hive管理数据,所以drop表时会把元数据和数据一起删除

create table user (id int, name string) row format delimited fields terminated by '\t'

2、将本地文件系统上的数据导入到表中

load data local inpath '/root/user.txt' into table user;
#删除表对应目录已有的数据
load data local inpath '/root/user.txt' overwite into table user

3、hive cli中运行hdfs 命令

dfs -ls /;
dfs -mkdir /data;
4、创建外部表,外部数据的位置需要在创建表时指定,数据不由hive管理,不会把数据移动到自己的仓库目录,drop外部表时hive只会删除元数据而不会删除数据
create external table stubak (id int, name string) row format delimited fields terminated by '\t' location '/stubak';
5、创建分区表,按照nation分区,分区就是创建子文件夹,user/nation=China/user.txt
#创建分区表
create table user(id int, name string) partitioned by (nation string) row format delimited fields terminated by '\t';
#加载分区表数据
load data local inpath './user.txt' inset into table user partition (nation='China')
load data local inpath './user.txt' overwrite into table user partition (nation='China')
#查看分区
show partitions table;
 6、自定义函数
#将jar包添加classpath
add jar /root/NUDF.jar;
#创建临时函数getNation 
create temporary function getNation as 'hive.udf.NationUDF';
#调用
select id, name, getNation(nation) from beauty;
#将查询结果保存到HDFS
create table result row format delimited fields terminated by '\t' as select * from beauty order by id desc;
create table result row format delimited fields terminated by '\t' as select id, getNation(nation) from beauties;
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    hive-cli-1.1.0.jar

    大数据hadoop中hive-1.1.0 的cli ,jar包,hive-cli-1.1.0.jar

    HiveCLI和Beeline命令行的基本使用.md

    HiveCLI和Beeline命令行的基本使用,基础篇

    cli正常显示中文的hive-0.10.0

    经过对源码的改造,这个特别的Hive 0.10.0版本能够支持在命令行界面(CLI)中正确地显示中文注释。这对于中国开发者来说是一个重大的改进,使得他们在管理Hive表时可以更加方便地阅读和理解注释内容。 改造的焦点...

    hive所有jar文件

    Hive和HBase是两种大数据处理工具,它们在大数据生态系统中各自扮演着重要角色。Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL-like语法(HQL,Hive Query Language)对大规模数据集进行分析。而HBase是...

    hive jar 包

    hive-cli.jar hive-common.jar hive-contrib.jar hive-hbaseec.jar hive-hbase-handler.jar hive-hwi.jar hive-jdbc.jar hive-metastorejar hive-serde.jar hive-service.jar hive-shims.jar hadoop-core-1.0.4.jar

    windows hive cmd 下载

    在Windows环境中,Hive是Apache Hadoop项目的一部分,它提供了一个命令行接口(CLI),名为Hive命令行工具,用于处理大数据集。Hive的主要功能是将结构化的数据文件映射为一张数据库表,并提供SQL(HQL,Hive SQL)...

    hive客户端安装_hive客户端安装_hive_

    现在你可以通过Hive命令行接口(CLI)与Hive交互了: ``` hive ``` 在Hive CLI中,你可以创建数据库、表,加载数据,执行SQL查询等操作。 七、连接Hive与Hadoop 确保Hive知道Hadoop的位置,编辑$HIVE_HOME/conf/...

    Hive数据文件以及CLI操作命令

    Hive指令样例.txt 文件则包含了Hive CLI(Command Line Interface)的操作命令。这些命令涵盖了Hive的基本操作,例如: 1. **创建数据库**:`CREATE DATABASE IF NOT EXISTS mydb;` 这个命令会创建一个名为mydb的新...

    hive_windows可执行文件

    - **hive**:这是Hive的可执行脚本,用于启动Hive CLI或与Hive服务器通信。 - **hiveserver2**:Hive Server 2是Hive的服务端组件,允许远程客户端连接并执行Hive查询。 - **hplsql**:可能是一个用于执行Hive和...

    Apache Hive 中文手册.docx

    Hive CLI主要用于交互式查询,而Beeline是基于JDBC的CLI,兼容多种数据库,提供更好的性能和错误处理。Beeline的引入是逐步替代Hive CLI的,因为它支持更多的SQL标准和改进的用户体验。 **Hive批处理和交互式模式**...

    hive安装包

    2. **启动Hive**:运行`bin/hive`启动Hive CLI,或者启动Hive Server以供远程连接。 3. **创建表**:使用HQL创建数据表,并指定存储位置(通常是HDFS的一个路径)。 4. **加载数据**:将数据从本地文件系统或HDFS...

    apache-hive-3.1.2-bin.tar.gz

    4. **Hive CLI**:Hive命令行接口,用户可以在这里输入HQL查询并查看结果。 5. **Hive Server2**:提供了更安全、高性能的Hive服务,支持多种客户端连接方式,如Beeline、JDBC和ODBC。 Spark 3.0.0是Apache Spark的...

    apache-hive-2.1.0-bin.tar.zip

    3. **Hive CLI (Command Line Interface)**:命令行接口,用户可以通过它提交查询并查看结果。 4. **Hive JDBC/ODBC Drivers**:允许其他应用程序通过JDBC或ODBC标准连接到Hive,支持多种编程语言进行数据操作。 5. ...

    apache-hive-1.2.2-bin_编译版本.tar.gz

    9. **管理元数据**:Hive 的元数据(如表结构、分区等)存储在 metastore 中,可以通过 Hive CLI 或其他工具进行管理。 10. **性能优化**:Hive 提供了多种优化策略,如分区、桶化、倾斜表处理、统计信息收集等,以...

    windows下hive的可执行文件

    6. **启动Hive**:运行`hive`命令启动Hive CLI,或者启动`hiveserver2`服务以供远程连接。 7. **创建数据库和表**:在Hive CLI中,用户可以创建数据库、定义表结构,并导入数据。 8. **执行查询**:使用HQL进行...

    apache-hive-2.1.0-bin.tar.gz

    2. **Hive CLI (Command Line Interface)**:Hive的命令行接口,让用户可以通过输入HQL语句来执行查询和管理数据仓库。 3. **Hive Server**:提供了远程访问Hive的接口,支持多种客户端连接方式,如Beeline(一个...

    apache-hive-0.14.0-bin.tar.gz

    4. **Beeline**:Hive 0.14.0引入了Beeline作为新的SQL客户端,它是Hive CLI的替代品,提供了更好的性能和JDBC/ODBC支持。 5. **HiveQL**:Hive的查询语言,与SQL高度兼容,但有其特有的语法和功能,如支持动态分区...

    hive执行计划可视化工具

    - **Beeline或Hive CLI增强工具**:有些第三方工具可以增强Hive的命令行接口,添加执行计划的可视化功能。 压缩包文件列表中的"dist"可能是工具的分发目录,其中可能包含可执行文件、配置文件和其他支持文件,用于...

    hive相关jar包

    5. **hive-service-0.11.0.jar**:这个文件包含了 Hive 服务端的相关组件,如 CLI(命令行接口)、Beeline(JDBC/ODBC 支持)等,使得用户可以通过网络连接到 Hive Server。 6. **guava-r07.jar**:Guava 是 Google...

    hive如何去安装与配置

    在Hive CLI中,可以创建表、加载数据、执行查询等操作,验证Hive是否正常工作。例如: ```sql CREATE TABLE test_table (id INT, name STRING); LOAD DATA LOCAL INPATH '/path/to/data.txt' INTO TABLE test_table...

Global site tag (gtag.js) - Google Analytics