执行一个查询
$HIVE_HOME/bin/hive -e 'select a.col from tab1 a'
之后过程中,会在终端上显示mapreduce的进度,执行完毕后,最后把查询结果输出到终端上,接着hive进程退出,不会进入交互模式。
使用静音模式执行一个查询
$HIVE_HOME/bin/hive -S -e 'select a.col from tab1 a'
加入-S,终端上的输出不会有mapreduce的进度,执行完毕,只会把查询结果输出到终端上。这个静音模式很实用,,通过第三方程序调用,第三方程序通过hive的标准输出获取结果集。
使用静音模式执行一个查询,把结果集导出
$HIVE_HOME/bin/hive -S -e 'select a.col from tab1 a' > tab1.csv
不进入交互模式,执行一个hive script
$HIVE_HOME/bin/hive -f /home/my/hive-script.sql
hive-script.sql是使用hive sql语法编写的脚本文件,执行的过程和-e类似,区别是从文件加载sql.
但是sql文件,对于bash来说,不能使用变量,而使用-e的方式,可以在bash里使用变量(但是对于sql文件的形式,可以利用程序基于变量动态生成sql文件,再执行,稍微麻烦点)。
这里可以和静音模式-S联合使用,通过第三方程序调用,第三方程序通过hive的标准输出获取结果集。
hive交互式模式
当$HIVE_HOME/bin/hive执行时,没有-e或者-f选项,会进入交互式shell模式。
命令 描述
quit
exit 退出交互式shell
reset 重置配置为默认值
set <key>=<value> 修改特定变量的值
注意: 如果变量名拼写错误,不会报错
set 输出用户覆盖的hive配置变量
set -v 输出所有Hadoop和Hive的配置变量
add FILE[S] <filepath> <filepath>*
add JAR[S] <filepath> <filepath>*
add ARCHIVE[S] <filepath> <filepath>* 添加 一个或多个 file, jar, archives到分布式缓存
list FILE[S]
list JAR[S]
list ARCHIVE[S] 输出已经添加到分布式缓存的资源。
list FILE[S] <filepath>*
list JAR[S] <filepath>*
list ARCHIVE[S] <filepath>* 检查给定的资源是否添加到分布式缓存
delete FILE[S] <filepath>*
delete JAR[S] <filepath>*
delete ARCHIVE[S] <filepath>* 从分布式缓存删除指定的资源
! <command> 从Hive shell执行一个shell命令
dfs <dfs command> 从Hive shell执行一个dfs命令
<query string> 执行一个Hive 查询,然后输出结果到标准输出
source FILE <filepath> 在CLI里执行一个hive脚本文件
例子
hive> set mapred.reduce.tasks=32;
hive> set;
hive> select a.* from tab1;
hive> !ls;
hive> dfs -ls;
分享到:
相关推荐
hive基本命令行操作
同时,我们还将使用Xshell6工具来远程连接到Hive服务器,并学习如何使用Hive命令行工具来执行查询操作。 一、Hive环境配置 1. 安装Hive 在本教程中,我们将使用VMware虚拟机来安装Hive环境。首先,我们需要下载...
1. Hive命令行界面(CLI):Hive命令行界面是Hive的用户交互界面,可以运行交互模式和批量模式的查询。交互模式即Hive Shell,而批量模式则可以执行单个或多个查询。 2. 命令行选项:在Hive命令行中,用户可以使用...
"HIVE安装及详解" HIVE是一种基于Hadoop的数据...* 使用HIVE命令行工具执行查询 * 使用HIVE API开发应用程序 * 使用HIVE与其他工具集成 HIVE是一种功能强大且灵活的数据仓库工具,广泛应用于大数据分析和处理领域。
5. **启动 Hive**:启动 Hive 服务,可以使用命令 `hive --service metastore` 启动 Metastore 服务,然后使用 `hive` 命令进入 Hive 命令行。 6. **创建表并加载数据**:在 Hive 命令行中,可以创建 Hive 表,定义...
通过覆盖`bin`目录的CMD文件,你可以确保使用的是最新版本的Hive命令行工具。但请记住,配置过程中可能遇到的问题需要根据实际情况去解决,比如查阅官方文档、社区讨论或在线教程。祝你安装成功,愉快地探索Hive的...
在Windows环境中,Hive是Apache Hadoop项目的一部分,它提供了一个命令行接口(CLI),名为Hive命令行工具,用于处理大数据集。Hive的主要功能是将结构化的数据文件映射为一张数据库表,并提供SQL(HQL,Hive SQL)...
现在你可以通过Hive命令行接口(CLI)与Hive交互了: ``` hive ``` 在Hive CLI中,你可以创建数据库、表,加载数据,执行SQL查询等操作。 七、连接Hive与Hadoop 确保Hive知道Hadoop的位置,编辑$HIVE_HOME/conf/...
一旦设置完成,你就可以通过Hive命令行或HiveServer2接口进行数据操作了。 总之,Apache Hive 2.3.9 是大数据开发中不可或缺的一部分,它提供了灵活的数据查询和管理工具,让数据分析师和开发人员能够高效地处理...
2. 使用Hive命令行模式导出数据:使用`hive -e "select day_id,user,count from user_table where day_id in ('2014-03-06','2014-03-07','2014-03-08','2014-03-09','2014-03-10');"> /home/test/test.dat;`语句...
输入命令`hive --service cli`启动Hive命令行客户端,并执行命令`show tables;`来检查是否正确安装Hive。 - **启动Hive Web界面:** 使用命令`hive --service hwi &`启动Hive的Web界面,并在浏览器中访问`...
这个压缩包文件"hive执行文件.zip"可能包含用于运行或更新Hive环境的必要组件,尤其是"bin"目录,这是Hive命令行工具和可执行文件所在的地方。"readme.txt"通常会提供关于如何安装、配置或使用这些文件的说明。 当...
可以通过Hive命令行界面使用`ADD JAR`语句来临时引入JAR,或者将其放在Hive的lib目录下使其全局可用。 5. **注册UDF**: 在Hive会话中,使用`CREATE TEMPORARY FUNCTION`或`CREATE FUNCTION`语句注册UDF。临时函数...
8. Hive的运行通常涉及到启动Hive服务,可以通过命令`hive`进入Hive命令行界面进行操作,也可以使用`beeline`。 9. 文件中提到的地址信息“北京市丰台区丰台南路永乐文化产业园*号楼(9号线丰台南路路地铁站东北侧...
安装完成后,可以通过Hive命令行工具检验与MySQL的连接是否正常,例如创建表、加载数据等操作。 以上是Hadoop、Hive和相关组件的基础配置步骤。在实际部署中,还需要考虑高可用性、安全性、性能优化等多个方面,...
4. **Hive CLI**:Hive命令行接口,用户可以在这里输入HQL查询并查看结果。 5. **Hive Server2**:提供了更安全、高性能的Hive服务,支持多种客户端连接方式,如Beeline、JDBC和ODBC。 Spark 3.0.0是Apache Spark的...
然而,需要注意的是,由于Hive JDBC是基于网络的,因此性能可能不如本地Hive命令行或使用Hive CLI。此外,Hive JDBC可能不适合频繁的短连接操作,因为建立和关闭连接会带来一定的开销。在大规模并发环境下,考虑使用...
Hive 命令行选项、交互式 Shell 命令及资源调用。 **3. Hive 其他操作** 包括 Limit、Top k、正则表达式列指定、Select(GroupBy、Order Sort By)、Join、参数设置、UDF(用户定义函数)等。 4. Hive 的 ...
- **bin**:包含用于运行 Hive 命令行接口(CLI)和其他脚本的可执行文件。 - **conf**:存放配置文件,如 `hive-site.xml`,用于设置 Hive 的运行参数。 - **lib**:包含 Hive 运行所需的库文件,如 JAR 包。 - **...
Hive 分析搜狗搜索日志与结果可视化,利用 hive 命令行完成搜狗日志各项数据分析,使用 Python 进行数据可视化。主要步骤 包括:安装部署 Hive、启动 Hadoop 集群、进入 Hive 命令行、创建数据库和数据表、加载 或...