写的不够全,后面有时间再补吧<个人汉语水平有限,语言组织平平,见谅>
hive CLI语言手册
【hive命令行操作】
可以使用命令 ./hive -H或./hive -help 查看帮助
(为hive0.9.0版使用)
usage: hive
-d,--define <key=value> hive中的变量替换应用
-e <quoted-query-string> 将hive的命令行不显示执行过程
-f <filename> 非交互执行hive脚本,脚本来源于一个可执行文件
-H,--help 打印帮助
-h <hostname> 指定连接hive的服务端IP
--hiveconf <property=value> 指定hive执行过程中的临时配置
--hivevar <key=value> 同上
-i <filename> 初始化sql文件
-p <port> 指定连接hive服务端的端口号
-S,--silent 静默模式执行hive的shll命令
-v,--verbose 冗长模式(将hive的执行详细信息显示在操作台)
--database <dbname> 指定使用的数据库
举例:
1.hive 查询
$HIVE_HOME/bin/hive -e 'select a.col from tab1 a'
2.设置hive的驱动参数 [具体hive参数后续文档做详细说明]
$HIVE_HOME/bin/hive -e 'select a.col from tab1 a' --hiveconf hive.exec.scratchdir=/home/my/hive_scratch --hiveconf mapred.reduce.tasks=32
3.通过静默的方式将输出结果输出到指定的文本
$HIVE_HOME/bin/hive -S -e 'select a.col from tab1 a' > a.txt
4.使用非交互的方式执行本地脚本
$HIVE_HOME/bin/hive -f /home/my/hive-script.sql
5.使用非交互的方式执行hadoop支持的文件系统中的脚本文件
$HIVE_HOME/bin/hive -f hdfs://<namenode>:<port>/hive-script.sql
$HIVE_HOME/bin/hive -f s3://mys3bucket/s3-script.sql
6.在初始化脚本之前进入到交互模式
$HIVE_HOME/bin/hive -i /home/my/hive-init.sql <未验证>
【备注】
hiverc 文件
当没有使用-i指定初始化sql文件时,hive将尝试加载$HIVE_HOME/bin/.hiverc 和 $HOME/.hiverc作为初始化文件
分享到:
相关推荐
Hive CLI主要用于交互式查询,而Beeline是基于JDBC的CLI,兼容多种数据库,提供更好的性能和错误处理。Beeline的引入是逐步替代Hive CLI的,因为它支持更多的SQL标准和改进的用户体验。 **Hive批处理和交互式模式**...
同时,Hive还支持通过CLI(命令行接口)、Web界面或者通过编程语言如Python、Shell调用Hive进行操作。 Hive的Select操作提供了GroupBy、Order和SortBy等查询功能,以支持数据的聚合与排序。Hive Join用于将两个或多...
Cloudera Hive 是一个基于 Hadoop 的数据仓库工具,它允许使用 SQL 类语法查询和管理存储在分布式文件系统中的大规模数据集。Hive 提供了一种结构化的方式,将无结构或半结构化的数据转化为可查询的数据表,使得数据...
5. **Hive CLI和Web UI**:CLI是命令行交互方式,适合开发者和管理员使用;Web UI则提供了图形化的操作界面,使得非技术用户也能方便地进行查询和管理。 在解压这个“Hive安装包”后,你会看到以下主要文件和目录:...
### Hive搭建与应用手册知识点详解 #### 一、Hive基础简介 1. **基础描述** Hive是一款基于Hadoop的数据仓库工具,主要用于处理数据提取、转化与加载(ETL)工作,支持对Hadoop中大规模存储的数据进行查询与分析。...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询...在大数据领域,Hive因其易于使用和与Hadoop生态系统的紧密集成而备受青睐。
- **WUI (Web User Interface)**:通过Web浏览器访问Hive服务,便于非技术用户使用。 - **元数据存储**:通常采用关系型数据库(如MySQL或Derby)来存储Hive的元数据信息,这些信息包括表的定义、列属性、表的属性...
### Hadoop 数据仓库 Hive 手册 #### 一、Hive 概述 Hive 是一个基于 Hadoop 的数据仓库工具,它为 Hadoop 提供了一层数据仓库基础设施。通过 Hive,用户能够更加方便地对存储在 Hadoop 分布式文件系统 (HDFS) 中...
6. **文档**:安装包可能包含了详细的用户手册、开发者指南和API文档,帮助用户理解和使用Hive的各项功能。 在实践Hive的过程中,你需要进行以下步骤: 1. **环境准备**:确保已安装Java开发环境(JDK)且版本符合...
### HIVE常用函数参考手册知识点概述 #### 一、函数分类 Hive中的函数可以根据其功能和作用范围分为几大类: 1. **简单函数**:这类函数通常针对单条记录进行操作,如数学运算、逻辑运算等。 2. **聚合函数**:...
使用Hive CLI或其他客户端工具连接Hive并执行简单的SQL查询,以验证安装是否成功。 通过以上步骤,可以完成Hadoop2.2.0 + HBase0.98.1 + Sqoop1.4.4 + Hive0.13的安装。在实际操作过程中,可能还会遇到各种具体...
- Beeline CLI: 使用 JDBC 驱动与 Hive 通信,提供了更多的灵活性。 - ODBC 驱动: 除了 JDBC 外,还支持 ODBC 驱动,便于使用其他语言和工具连接 Hive。 **2.3 Metastore** - **元数据存储**: Metastore 存储了...
CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 DML 操作 数据查询详解 三、Spark Spark Core Spark SQL Spark Streaming 五、Flink 核心概念综述 开发环境搭建 Data Source Data ...
- **启动Hive**:使用Hive命令行接口(CLI)进行交互式查询。 以上步骤详尽地介绍了从零开始构建一个Hadoop云计算环境,包括Hadoop的分布式集群配置,HBase和Hive的安装和基本设置。这份手册为初学者提供了实践...
这个“ODPS参考手册”是学习和使用ODPS的重要资源,它包含了ODPS的各项操作和功能的详细介绍。 在大数据领域,ODPS作为一款云端的数据仓库工具,其主要功能包括数据存储、数据处理和数据挖掘。ODPS基于Hadoop生态...
- **客户端工具**:使用 Impala 的 CLI 或者 JDBC/ODBC 连接器来进行测试。 ##### 3.8 Mysql 的安装配置 - **下载与安装**:从 MySQL 官网下载并安装 MySQL Server。 - **初始化数据库**:使用 `mysqld --...
- **5.5.2 运行Hive脚本**: 使用Hive SQL来处理结构化数据。 - **5.5.3 运行HDFS命令**: 直接操作Hadoop分布式文件系统。 - **5.5.4 运行MapReduce作业**: 提交并运行MapReduce程序。 - **5.5.5 通过JDBC使用数据**:...