HiveServer2 (HS2) is a server interface that enables remote clients to execute queries against Hive and retrieve the results. The current implementation, based on Thrift RPC, is an improved version of HiveServer and supports multi-client concurrency and authentication. It is designed to provide better support for open API clients like JDBC and ODBC.
Configure
<property>
<name>hive.server2.thrift.min.worker.threads</name>
<value>5</value>
<description>Minimum number of Thrift worker threads</description>
</property>
<property>
<name>hive.server2.thrift.max.worker.threads</name>
<value>500</value>
<description>Maximum number of Thrift worker threads</description>
</property>
<property>
<name>hive.server2.async.exec.threads</name>
<value>50</value>
<description>Number of threads in the async thread pool for HiveServer2</description>
</property>
<property>
<name>hive.server2.async.exec.shutdown.timeout</name>
<value>10</value>
<description>Time (in seconds) for which HiveServer2 shutdown will wait for async
threads to terminate</description>
</property>
<property>
<name>hive.server2.thrift.port</name>
<value>10000</value>
<description>Port number of HiveServer2 Thrift interface.
Can be overridden by setting $HIVE_SERVER2_THRIFT_PORT</description>
</property>
<property>
<name>hive.server2.thrift.bind.host</name>
<value>192.168.122.1</value>
<description>Bind host on which to run the HiveServer2 Thrift interface.
Can be overridden by setting $HIVE_SERVER2_THRIFT_BIND_HOST</description>
</property>
-----
<property>
<name>hive.server2.transport.mode</name>
<value>binary</value>
<description>Server transport mode. "binary" or "http".</description>
</property>
<property>
<name>hive.server2.thrift.http.port</name>
<value>10001</value>
<description>Port number when in HTTP mode.</description>
</property>
<property>
<name>hive.server2.thrift.http.path</name>
<value>cliservice</value>
<description>Path component of URL endpoint when in HTTP mode.</description>
</property>
<property>
<name>hive.server2.thrift.http.min.worker.threads</name>
<value>5</value>
<description>Minimum number of worker threads when in HTTP mode.</description>
</property>
<property>
<name>hive.server2.thrift.http.max.worker.threads</name>
<value>500</value>
<description>Maximum number of worker threads when in HTTP mode.</description>
</property>
Start
$HIVE_HOME/bin/hiveserver2
$HIVE_HOME/bin/hive --service hiveserver2
$HIVE_HOME/bin/hive --service hiveserver2 -H
References:
https://cwiki.apache.org/confluence/display/Hive/Setting+up+HiveServer2
相关推荐
然而,手动启动和停止Hive的服务,如HiveServer2和Metastore,可能会变得繁琐和耗时。为了解决这个问题,我们可以创建自定义的Shell脚本以及使用systemd服务来实现一键启停Hive的相关服务。 首先,我们来看一下提供...
### CDH 6.3.2 升级 Hive 至 3.x 后登录 HiveServer2 连接失败问题分析及解决方法 #### 一、问题背景与现象 在将 Cloudera Data Hub (CDH) 6.3.2 版本中的 Hive 升级到 3.x 版本后,用户在尝试通过 JDBC 连接到 ...
2. 创建一个JDBC连接字符串,格式通常为`jdbc:hive2://<HIVESERVER>:<PORT>/<DATABASE>`, 其中 `<HIVESERVER>` 是Hive服务器的地址,`<PORT>` 是Hive Thrift服务器监听的端口,`<DATABASE>` 是默认数据库名称。...
2. 启动Hiveserver2:Hiveserver2是Hive的远程服务接口,允许远程客户端通过网络连接到Hive。启动Hiveserver2的命令是`bin/hiveserver2`。 3. 监视运行状态:可以使用`jps`命令检查Hiveserver2进程是否正在运行,...
2.从hive导出数据到本地时注意指定的目录/home/bigdata/syg。如果指定的目录存在,hive会先删除该目录下的所有文件。如果目录不存在,则会创建。 insert overwrite local directory '/home/bigdata/syg' select * ...
有两种主要的服务类型:HiveServer1(旧版,主要用于Thrift协议)和HiveServer2(新版,支持更安全和高性能的HS2协议)。 3. **Hive CLI(Command Line Interface)**:命令行工具,让用户直接在终端上执行HQL查询...
HiveServer2:使远程客户端可以执行对Hive的查询并返回结果 【备注】 主要针对计算机相关专业的正在做毕设的学生和需要项目实战的大数据可视化、Java学习者。 也可作为课程设计、期末大作业。包含:项目源码、项目...
Beeline 是 Hive 提供的一个命令行工具,用于与 HiveServer2 进行交互。在企业环境中,为了确保数据的安全性,通常需要对访问 Hive 的用户进行身份验证。本文将指导你如何在 Hive 3.12 版本中设置 Hiveserver2 与 ...
site.xml`配置文件,添加Kerberos相关属性,如`hive.server2.authentication`设为`KERBEROS`,`hive.metastore.kerberos.principal`和`hive.server2.kerberos.principal`分别设定为Hive metastore和Hiveserver2的...
标题 "Hive2.x系列驱动" 指的是Hive版本2.x的客户端连接器,这些驱动程序使得应用程序能够与Hive服务器进行交互,执行SQL查询并获取数据。Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL语言处理存储在HDFS...
============Hive的beeline权限配置============ 1)HDFS修改core-site.xml配置 搜索 core-site.xml core-site.xml 的群集范围高级配置代码段(安全阀)添加 hadoop.proxyuser.hadoop.hosts * hadoop.proxyuser...
1. 对集群 HiveServer2 当前状态进行检查,获取节点 HiveServer2_1 和节点 HiveServer2_2 的主备状态。 2. 对节点 HiveServer2_1 和节点 HiveServer2_2 执行强制状态切换动作,并检查状态切换是否成功。 3. 对集群 ...
Hive的优点包括:HiveServer采用集群模式、双MetaStore超时重试机制高可靠、高容错、类SQL语法、内置大量函数、可扩展、多接口等。Hive的缺点包括:默认MR为执行引擎、MR延迟较高、不支持物化视图、不适用OLTP、暂不...
2. **配置Hadoop环境**: Hive是构建在Hadoop之上的,所以你需要先安装并配置Hadoop。Hadoop的`HADOOP_HOME`环境变量也需要设置正确,指向你的Hadoop安装目录。 3. **设置Hive环境变量**: - `HIVE_HOME`:指向...
8. 启动Hive:启动Hiveserver2服务,然后通过Hive CLI或者Beeline等客户端工具与Hive交互。 在Hive中,用户可以通过HQL(Hive Query Language)编写SQL-like的查询语句,对大数据集进行复杂的分析操作,例如分组...
HiveServer2 是 Hive 的一种服务形式,能够提供 JDBC 连接方式,用户可以通过 JDBC.Driver 来连接 HiveServer2,从而访问 Hive 数据库。HiveServer2 提供了强大的安全机制,能够实现身份验证和授权管理。本文将详细...
hive配置参数及含义, 在大数据维护中对hive的优化参数的配置明细
- **配置并运行HiveServer2**:HiveServer2是Hive的服务端,负责接收客户端的查询请求并执行。你需要下载Hive,设置Hive能找到Hadoop的路径,创建仓库目录,并启动HiveServer2。 - **通过Beeline连接HiveServer2**:...
HiveServer2是Hive服务的第二代版本,它提供了更高效、安全和多用户交互的能力,支持多种客户端连接方式,其中包括通过JDBC(Java Database Connectivity)接口。本压缩包文件"jdbc-hive"正是为了实现这种连接而准备...
1. `bin/`:包含Hive的可执行脚本,如`hive`命令行客户端和`hiveserver2`服务。 2. `lib/`:存放Hive依赖的各种JAR文件,包括升级后的Jetty库。 3. `conf/`:默认的配置文件,如`hive-default.xml`和`hive-site.xml`...