`

HIVE 设置参数

    博客分类:
  • hive
阅读更多

转自 http://www.tbdata.org/archives/716

 

 

对于一般的参数,hive有以下的几种设置方式:
1》配置文件:
2》命令行参数:
3》set参数声明:

配置文件包括:
用户自定义配置文件:$HIVE_CONF_DIR/hive-site.xml
默认配置文件:$HIVE_CONF_DIR/hive-default.xml
用户自定义配置会覆盖默认配置。
另外,hive也会读入hadoop的配置,因为hive是作为hadoop的客户端启动的。
hadoop的配置文件包括:
$HADOOP_CONF_DIR/hive-site.xml
$HADOOP_CONF_DIR/hive-default.xml

hive的配置会覆盖hadoop的配置。
配置文件的设定对本机的所有hive进程都有效。


命令行参数:
启动hive(客户端或者server方式)的时候,可以在命令行添加-hiveconf param=value来设定参数,例如:
hive -hiveconf hive.root.logger=INFO,console
这一设定对本次session有效(如果以server的方式启动,则对于所有请求的session有效)

参数声明:
通过set设定来实现:
set  mapred.reduce.tasks=100
作用域也是 session级别的。

这三种设置的方式,优先级依次递增:即参数声明的配置会覆盖命令行参数,命令行参数会覆盖配置文件。
注意:某些系统级参数,如log4j的参数,必须使用前两种方式来设置,因为那些参数的读取在session建立之前就完成。
另外 SerDe参数必须在DDL建表的时候进行声明

分享到:
评论

相关推荐

    hive参数配置说明大全

    Hive参数配置说明大全 Hive是一款基于Hadoop的数据仓库工具,用于数据的存储、查询和分析。在Hive中,参数配置起着非常重要的作用,它可以影响Hive的性能、安全性和执行效率。本文将对Hive的参数配置进行详细的解释...

    hive数仓、hive SQL 、 hive自定义函数 、hive参数深入浅出

    4. Hive参数调优: - 内存参数:如mapreduce.map.memory.mb、hive.server2.executor.memory.overhead等,合理设置可避免内存溢出。 - 执行引擎与优化器:可以选择Tez或Spark作为执行引擎,优化查询计划以提高性能...

    hive参数配置手册、hive参数配置大全

    非常全面的hive参数配置,总共有600多项,中文注释是用软件翻译的,勉强能看,引用请注明出处。

    hive参数优化总结

    可以通过设置相关参数来实现合并小文件,例如:set hive.merge.mapfiles = true、set hive.merge.mapredfiles = true 等。 2. 控制 Map 数和 Reduce 数 控制 Map 数和 Reduce 数是 Hive 中一个非常重要的优化手段...

    hive配置参数及含义

    hive配置参数及含义, 在大数据维护中对hive的优化参数的配置明细

    Hive常用参数配置详细记录

    Hive常用参数配置详细记录,总结的知识希望能够帮到有需要的人。

    hive参数优化文档

    ### Hive参数优化详解 #### 一、整体架构优化 在Hive的整体架构中进行优化,主要是为了提升查询处理效率及资源利用率。以下是一些关键点: 1. **表设计**: - **分区表**:根据查询维度进行分区,如日期分区等。...

    hive 参数设置

     -hiveconf : 用于定义hive执行时的属性,即配置参数,可覆盖hive-site.xml中配置的hive全局变量。 egg: hive -e查询: hive -S -e “use tv; select * from test;” hive -f 执行文件: hive -S -f test.hql ...

    hive&tez.zip

    这通常涉及修改`hive-site.xml`配置文件,设置`hive.execution.engine`为`tez`。同时,还需要确保Tez的依赖库已经添加到Hive的类路径中,以及Tez服务已经在集群上正确安装和运行。 总的来说,Apache Hive提供了SQL...

    hive优化总结

    5. Hive参数设置优化 Hive的参数设置也很重要。例如,可以设置hive.merge.mapfiles参数来关闭Hive的扫描表优化,以提高查询效率。同时,可以设置hive.optimize.cp参数来启用列裁剪和分区裁剪。 6. MapReduce操作...

    Hive脚本任务参数优化配置.doc

    本文将详细探讨Hive脚本任务参数的优化配置方法,旨在帮助用户更好地理解和调整Hive参数,以达到最佳的查询效率。 #### 二、Hive MR参数调优 1. **谓词下推(Predicate Push Down)**: - `set hive.optimize.ppd...

    Hive优化方法整理

    Hive 优化方法整理是 Hive 数据处理过程中的重要步骤,涉及到 Hive 的类 SQL 语句本身进行调优、参数调优、Hadoop 的 HDFS 参数调优和 Map/Reduce 调优等多个方面。 Hive 类 SQL 语句优化 1. 尽量尽早地过滤数据...

    hive2.0+开启审计日志.pdf

    此外,对于Beeline客户端的日志配置,它通过`bin/ext/beeline.sh`脚本中的`-Dlog4j.configurationFile=beeline-log4j2.properties`参数来指定`beeline-log4j2.properties`文件,该文件的配置与Hive Metastore审计...

    hive远程连接详细配置

    在 Hive 客户端配置中,我们需要配置 Hive 客户端连接到远程 metastore 服务器的参数。在这个配置文件中,我们可以看到两个重要的参数:`hive.metastore.local` 和 `hive.metastore.uris`。 * `hive.metastore....

    连接hive依赖的jar包_hive连接方式

    如果Hive服务器配置了Kerberos安全认证,还需要在DataGrip中配置Kerberos相关参数,如"principal"和"keytab"文件路径。此外,可能需要在本地环境中设置Kerberos环境变量,例如`KRB5_CONFIG`和`JAVA_OPTS`。 6. **...

    常用设置参数解释

    HIVE常用设置参数解释

    hive常用函数参数手册

    ### Hive常用函数参数手册 #### 一、简介 在大数据处理领域,Hive作为一个广泛使用的数据仓库工具,提供了丰富的内置函数来支持数据的处理与分析。本文档旨在介绍Hive中的常用函数及其用法,帮助用户更好地理解和应用...

    数据库工具连接hive的驱动包

    例如,调整Hive服务器的配置参数,使用连接池来管理多个数据库连接,或者通过设置合适的HQL查询优化选项,都可以提升整体性能。同时,由于Hive是分布式系统,网络延迟和并发控制也是需要考虑的因素。 总结来说,...

    hive客户端安装_hive客户端安装_hive_

    在大数据处理领域,Hive是一个非常重要的工具,它提供了一个基于Hadoop的数据仓库...在实际生产环境中,你可能还需要配置其他高级特性,如Hive与Hadoop安全性的集成、优化性能参数等,这都需要根据具体需求进行调整。

    Hive开发规范及要点

    六、Hive参数设置 1. 设置Hive执行参数:使用`set hive.cli.print.header=true;`语句可以设置Hive的执行参数。 2. 开启行转列功能:使用`set hive.cli.print.row.to.vertical=true;`语句可以开启行转列功能。 七、...

Global site tag (gtag.js) - Google Analytics