[转]hive产生动态分区太多导致的问题 . - 小星星的技术blog - ITeye博客

`

dacoolbaby

浏览: 1270121 次
性别:
来自: 广州

最近访客更多访客>>

leoeco2000

peacherdiy

quduaitao

yangshuguozhi

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

jackhong1108：你可能只知道Oracle有like，不知道Oracle有其他的 ...
Hive使用regexp，RLIKE需要使用转义字符
pktangshao： a_bun 写道iijjll 写道使用wmsys.wm_con ...
Oracle 列转行函数 Listagg()
nayouzhenai：
Spring读取properties文件作为环境变量
a_bun： iijjll 写道使用wmsys.wm_concat()函数也 ...
Oracle 列转行函数 Listagg()
Horse_Chasing：鼓励鼓励鼓励鼓励鼓励鼓励鼓励鼓励鼓励鼓励
广州面试小结

[转]hive产生动态分区太多导致的问题 .

博客分类：

Hive

阅读更多

转自：http://blog.csdn.net/chenyi8888/article/details/8236726

做应用开发的也要帮助他们找BUG，真是头疼。遇到如下异常，度娘给出的答案如下：

过多的动态分区会导致job出现以下情况：

org.apache.hadoop.hive.ql.metadata.HiveException: org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No lease on /tmp/hive-maintain/hive_2012-11-28_22-39-43_810_1689858262130334284/_task_tmp.-ext-10002/part=33436268/_tmp.000004_0 File does not exist. Holder DFSClient_attempt_201211250925_9859_m_000004_0 does not have any open files.

解决方案：

加大动态分区数即可，下面是在当前session下设置。

SET hive.exec.max.dynamic.partitions=100000;
SET hive.exec.max.dynamic.partitions.pernode=100000;

分享到：

Sqoop环境变量异常 | Hive使用regexp，RLIKE需要使用转义字符

2013-07-12 09:18
浏览 3008
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz: 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-...

apache-hive-3.1.2-bin.tar.gz: 5. `metastore/`：元数据存储相关的库和脚本，Hive使用元数据来跟踪表和分区的信息。 6. `docs/`：文档和帮助资料。升级Jetty的过程可能包括下载源码，修改pom.xml文件以指定新版本，编译源码，然后将新编译的...

apache-hive-2.3.3-bin.tar.gz: 6. **HQL**：Hive的查询语言，语法类似于SQL，但有其特有的一些概念，如分区、桶、动态分区等。 7. **Hive Execution Engine**：负责将HQL转换为MapReduce任务或Tez任务（在Hive 2.x版本中，默认执行引擎是Tez，它...

hive数据分区时分区字段不可为中文。.doc: 如果使用中文字符作为分区键，则可能导致数据无法正确读取或者分区创建失败等问题。 - **建议使用英文字符**：为了确保数据的一致性和可读性，通常推荐使用英文字符作为分区键。 2. **字符编码问题**： - **默认...

修改hive表分区名称: 需要注意的是，如果Hive表的分区数据较多，该操作可能会耗时较长，请耐心等待。 #### 三、验证修改结果完成以上步骤后，还需要对修改结果进行验证： 1. **查询新分区的数据**：使用`SELECT * FROM test WHERE ...

apache-hive-3.1.2-bin.tar.gz.zip: apache-hive-3.1.2-bin.tar.gz, 下载自：https://mirrors.bfsu.edu.cn/apache/hive/hive-3.1.2/，上传至CSDN备份，本资源下载后需要解压缩zip文件，才是原本的apache-hive-3.1.2-bin.tar.gz文件

apache-hive-2.2.0-src.tar.gz: 7. **数据倾斜**：Hive 2.2.0 版本中可能已经包含了一些针对数据倾斜的优化策略，以解决在大数据场景下常见的问题，即某些键值导致的数据不均匀分布。 8. **UDF（用户自定义函数）**：Hive 允许用户开发自己的函数...

apache-hive-2.1.0-bin.tar.gz: 1. **Hive Metastore**：这是Hive的核心组成部分，用于存储元数据，如表结构、分区信息、列属性等。元数据通常存储在关系数据库中，如MySQL，以便于高效地管理和检索。 2. **Hive CLI (Command Line Interface)**：...

Apache Hive（hive-storage-2.8.1.tar.gz): Apache Hive（hive-storage-2.8.1.tar.gz、hive-storage-2.7.3.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache ...

Apache Hive（apache-hive-3.1.3-bin.tar.gz）: Apache Hive（apache-hive-3.1.3-bin.tar.gz、apache-hive-3.1.3-src.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

apache-hive-2.3.7-bin.tar.gz: 2. **加载数据**：将数据从外部源导入到 Hive 表中，可以是静态加载或动态加载。 3. **查询分析**：使用 HQL 编写查询语句，进行数据筛选、聚合、关联等操作。 4. **结果导出**：将查询结果导出到本地文件或其他数据...

Apache Hive（apache-hive-1.2.2-bin.tar.gz）: Apache Hive（apache-hive-1.2.2-bin.tar.gz、apache-hive-1.2.2-src.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

apache-hive-2.3.4-bin.tar.gz: 1. **元数据**：Hive管理着关于表、列、分区等的元数据，这些信息存储在元数据存储（如MySQL或Derby）中，用于解析HQL并规划执行计划。 2. **HQL**：Hive Query Language是Hive的主要接口，它允许用户使用类似SQL的...

apache-hive-2.1.1-bin.tar.gz: 6. **分区与桶**：为了提高查询效率，Hive 支持对表进行分区，通常按照时间、地区等维度进行。此外，还可以对表进行桶划分，进一步优化查询性能。 7. **支持多种数据格式**：Hive 可以处理各种类型的数据格式，如...

apache-hive-1.2.1-bin.tar.gz.zip: "Mr.zhou_Zxy.txt" 文件可能是个人笔记或教程，可能包含了用户 Zhou Zxy 在学习和使用 Hive 过程中的经验和技巧，包括如何配置 Hive，编写 HQL 示例，或者解决遇到的问题。在大数据处理场景中，Hive 主要应用于...

apache-hive-2.3.0-bin.tar.gz: Apache Hive 是一个基于Hadoop的数据仓库工具，它允许用户通过SQL-like语言（称为HQL，Hive Query Language）对大规模数据集进行分析和查询。Hive最初由Facebook开发，后来成为Apache软件基金会的一个顶级项目，广泛...

apache-hive-1.2.2-bin.tar.gz: 此外，Hive还支持分区和桶，提高查询效率。它的优点在于提供了一种易于理解和使用的SQL接口，使得数据分析人员无需深入学习底层分布式计算原理，就能高效地处理大数据。然而，由于Hive的查询执行是批处理的，对于...

hive-jdbc-uber-2.6.5.0-292.jar驱动: 1. **版本兼容性**：确保Hive JDBC驱动版本与运行的Hive服务版本兼容，否则可能导致连接问题或功能缺失。 2. **配置参数**：正确配置Hive服务器的地址、端口、用户名和密码，以及可能需要的安全认证参数。 3. **内存...

apache-hive-2.1.1-bin.tar.gz下的bin文件夹，包含hive.cmd: `hive.cmd`是Windows环境下执行Hive的命令脚本，它是一个批处理文件，用于启动Hive的交互式Shell。当用户在Windows系统上输入`hive`命令时，实际上就是在运行这个`hive.cmd`脚本。脚本内部会设置环境变量，如HADOOP_...

Global site tag (gtag.js) - Google Analytics