Hive 优化-限制用户误交大作业查询 - 浮夸 - ITeye博客

`

zenoh

浏览: 146316 次
性别:
来自: 上海

最近访客更多访客>>

qijojo

罗伯特X

瞬间永远

Absoler

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Seven7+：这个例子的源代码能否发一下啊
Flex的Tree开发——与Java后台交互，实现增删改查

Hive 优化-限制用户误交大作业查询

博客分类：

Hive

阅读更多

最近有些同事些sql进行查询时，sql语句里不指定partition字段，这样直接造成hive生成Hadoop的MapReduce任务时查询的数据量巨大，从而影响整个集群的性能。经研究可以通过配置Hive参数来预防此类错误，从而达到优化的目的。

在hive-site.xml中添加以下配置：

<property>
<name>hive.mapred.mode</name>
<value>strict</value>
</property>

这样，在提交类似一下SQL（where中不指定partition条件）时，将会抛出错误而不执行该sql：

hive> select *from access_raw limit 10;
FAILED: Error in semantic analysis: No partition predicate found for Alias "access_raw" Table "access_raw"

而正确书写SQL的方法为：

hive> select *from access_raw where log_date='2012-08-10' limit 10;

这样，就对sql语句进行了过滤。

分享到：

hadoop的mapreduce作业中经常出现Java hea ... | Hive 查询优化【引文】

2012-12-16 12:18
浏览 1816
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz: 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-...

apache-hive-2.1.1-bin.tar: apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-...

hive2.1.1-cdh6.3.2: 2. **hive-exec-2.1.1-cdh6.3.2.jar**：这个文件包含了Hive执行引擎的核心库，用于处理查询解析、优化、计划生成以及实际的数据处理任务。它是Hive服务端的一部分，通常在Hive服务器上运行，而非客户端。 3. **hive...

Hive-2.1.1-CDH-3.6.1 相关JDBC连接驱动 Jar 包集合: 02、hive-exec-2.1.1-cdh6.3.1.jar 03、hive-jdbc-2.1.1-cdh6.3.1.jar 04、hive-jdbc-2.1.1-cdh6.3.1-standalone.jar 05、hive-metastore-2.1.1-cdh6.3.1.jar 06、hive-service-2.1.1-cdh6.3.1.jar 07、libfb303-...

hive驱动包hive-jdbc-uber-2.6.5.0-292.jar（用户客户端连接使用）: 这个驱动允许用户通过编写SQL语句或者使用类似JDBC的API来连接和查询Hive服务器，执行数据分析任务。 **Dbeaver**是一个开源的通用数据库管理工具，支持多种数据库系统，包括Hive。在Dbeaver中，为了连接到Hive...

hive-exec-2.1.1.jar: Apache Hive 是一个构建在 Hadoop 之上的数据仓库基础设施，它允许用户以 SQL（结构化查询语言）的形式查询和管理大型数据集。Hive 提供了一种 SQL 接口来访问数据，这些数据通常存储在 Hadoop 的分布式文件系统...

hive-jdbc-3.1.2-standalone: hive-jdbc-3.1.2-standalone适用于linux

hive-jdbc-uber-3.1.2+yanagishima-18.0: Yanagishima不仅简化了对Hive、Presto和Trino等查询引擎的接口，还提供了权限控制，确保只有授权用户可以执行查询。它的核心功能包括SQL查询的提交、结果的展示以及查询历史的记录，为数据分析团队提供了一个便捷的...

hive-jdbc-2.1.1-cdh6.2.0-standalone.jar: hive-jdbc-2.1.1-cdh6.2.0（ieda等jdbc链接hive2.1.1）；cdh6.2.0安装的hive2.1.1

Apache Hive（apache-hive-3.1.3-bin.tar.gz）: Apache Hive（apache-hive-3.1.3-bin.tar.gz、apache-hive-3.1.3-src.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

Apache Hive（apache-hive-1.2.2-bin.tar.gz）: Apache Hive（apache-hive-1.2.2-bin.tar.gz、apache-hive-1.2.2-src.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

hive-jdbc-1.2.1-standalone.jar: hive-jdbc-1.2.1-standalone.jar hive-jdbc驱动jar包，欢迎下载

DBeaver链接hive驱动包下载： hive-jdbc-uber-2.6.5.0-292.jar: 《DBeaver与Hive连接：hive-jdbc-uber-2.6.5.0-292.jar驱动详解》在大数据处理领域，Hive作为一个基于Hadoop的数据仓库工具，广泛用于数据查询和分析。而DBeaver，作为一款跨平台的数据库管理工具，以其用户友好的...

hive-jdbc-jar-多版本.zip: 这里，`hostname:port`是Hive服务器的地址和端口，`principal`是Kerberos认证的Hive服务器主体，`username`和`password`是连接Hive的用户凭据。每个版本的Hive JDBC驱动都可能有其特定的兼容性和性能特性。选择...

hive-jdbc-uber-2.6.5.jar: hive-jdbc-uber-2.6.5.0-292.jar DbVisualizer (as of version 9.5.5) Below is an example configuration using DbVisualizer: Open the Diver Manager dialog ("Tools" > "Driver Manager...") and hit the ...

apache-hive-3.1.2-bin.tar.gz: Apache Hive 是一个基于Hadoop的数据仓库工具，它允许用户通过SQL-like语法查询、管理大量结构化数据。在大数据处理领域，Hive 提供了一个灵活、可扩展的框架，使得数据分析人员能够对存储在Hadoop分布式文件系统...

hive-jdbc-uber-2.6.5.0-292.jar驱动: Hive JDBC Uber 2.6.5.0-292驱动是Apache Hive与Java数据库连接（JDBC）之间的桥梁，允许用户通过编程语言（如Java、Python等）或者数据库管理工具（如Dbeaver）与Hive进行交互。这个驱动程序集成了所有必要的依赖，...

hive-jdbc-2.1.0-standalone.jar: hive-jdbc-2.1.0-standalone.jar

hive-hcatalog-core-1.2.1.jar: hive-hcatalog-core-1.2.1.jarhive-hcatalog-core-1.2.1.jarhive-hcatalog-core-1.2.1.jar

hive-jdbc-2.3.7-standalone.jar: hive-jdbc-2.3.7-standalone,可用dbeaver连接hive数据库，在工具中进行数据库记录的新增改查

Global site tag (gtag.js) - Google Analytics