`
dacoolbaby
  • 浏览: 1266054 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

[转]hive产生动态分区太多导致的问题 .

    博客分类:
  • Hive
阅读更多

转自:http://blog.csdn.net/chenyi8888/article/details/8236726

 

做应用开发的也要帮助他们找BUG,真是头疼。遇到如下异常,度娘给出的答案如下:

 

过多的动态分区会导致job出现以下情况:

org.apache.hadoop.hive.ql.metadata.HiveException: org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No lease on /tmp/hive-maintain/hive_2012-11-28_22-39-43_810_1689858262130334284/_task_tmp.-ext-10002/part=33436268/_tmp.000004_0 File does not exist. Holder DFSClient_attempt_201211250925_9859_m_000004_0 does not have any open files.

 

解决方案:

加大动态分区数即可,下面是在当前session下设置。

SET hive.exec.max.dynamic.partitions=100000;
SET hive.exec.max.dynamic.partitions.pernode=100000;

分享到:
评论

相关推荐

    含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz

    含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-...

    apache-hive-3.1.2-bin.tar.gz

    5. `metastore/`:元数据存储相关的库和脚本,Hive使用元数据来跟踪表和分区的信息。 6. `docs/`:文档和帮助资料。 升级Jetty的过程可能包括下载源码,修改pom.xml文件以指定新版本,编译源码,然后将新编译的...

    apache-hive-2.3.3-bin.tar.gz

    6. **HQL**:Hive的查询语言,语法类似于SQL,但有其特有的一些概念,如分区、桶、动态分区等。 7. **Hive Execution Engine**:负责将HQL转换为MapReduce任务或Tez任务(在Hive 2.x版本中,默认执行引擎是Tez,它...

    hive数据分区时分区字段不可为中文。.doc

    如果使用中文字符作为分区键,则可能导致数据无法正确读取或者分区创建失败等问题。 - **建议使用英文字符**:为了确保数据的一致性和可读性,通常推荐使用英文字符作为分区键。 2. **字符编码问题**: - **默认...

    修改hive表分区名称

    需要注意的是,如果Hive表的分区数据较多,该操作可能会耗时较长,请耐心等待。 #### 三、验证修改结果 完成以上步骤后,还需要对修改结果进行验证: 1. **查询新分区的数据**:使用`SELECT * FROM test WHERE ...

    apache-hive-3.1.2-bin.tar.gz.zip

    apache-hive-3.1.2-bin.tar.gz, 下载自:https://mirrors.bfsu.edu.cn/apache/hive/hive-3.1.2/, 上传至CSDN备份,本资源下载后需要解压缩zip文件,才是原本的apache-hive-3.1.2-bin.tar.gz文件

    apache-hive-2.2.0-src.tar.gz

    7. **数据倾斜**:Hive 2.2.0 版本中可能已经包含了一些针对数据倾斜的优化策略,以解决在大数据场景下常见的问题,即某些键值导致的数据不均匀分布。 8. **UDF(用户自定义函数)**:Hive 允许用户开发自己的函数...

    apache-hive-2.3.7-bin.tar.gz

    2. **加载数据**:将数据从外部源导入到 Hive 表中,可以是静态加载或动态加载。 3. **查询分析**:使用 HQL 编写查询语句,进行数据筛选、聚合、关联等操作。 4. **结果导出**:将查询结果导出到本地文件或其他数据...

    Apache Hive(apache-hive-3.1.3-bin.tar.gz)

    Apache Hive(apache-hive-3.1.3-bin.tar.gz、apache-hive-3.1.3-src.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

    apache-hive-2.3.4-bin.tar.gz

    1. **元数据**:Hive管理着关于表、列、分区等的元数据,这些信息存储在元数据存储(如MySQL或Derby)中,用于解析HQL并规划执行计划。 2. **HQL**:Hive Query Language是Hive的主要接口,它允许用户使用类似SQL的...

    Apache Hive(apache-hive-1.2.2-bin.tar.gz)

    Apache Hive(apache-hive-1.2.2-bin.tar.gz、apache-hive-1.2.2-src.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

    apache-hive-1.2.1-bin.tar.gz.zip

    "Mr.zhou_Zxy.txt" 文件可能是个人笔记或教程,可能包含了用户 Zhou Zxy 在学习和使用 Hive 过程中的经验和技巧,包括如何配置 Hive,编写 HQL 示例,或者解决遇到的问题。 在大数据处理场景中,Hive 主要应用于...

    apache-hive-2.1.0-bin.tar.gz

    1. **Hive Metastore**:这是Hive的核心组成部分,用于存储元数据,如表结构、分区信息、列属性等。元数据通常存储在关系数据库中,如MySQL,以便于高效地管理和检索。 2. **Hive CLI (Command Line Interface)**:...

    apache-hive-2.3.0-bin.tar.gz

    Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询。Hive最初由Facebook开发,后来成为Apache软件基金会的一个顶级项目,广泛...

    apache-hive-1.2.2-bin.tar.gz

    此外,Hive还支持分区和桶,提高查询效率。它的优点在于提供了一种易于理解和使用的SQL接口,使得数据分析人员无需深入学习底层分布式计算原理,就能高效地处理大数据。然而,由于Hive的查询执行是批处理的,对于...

    apache-hive-1.2.1-bin.tar.gz

    3. **可扩展性**:Hive 可以通过添加更多的 Hadoop 数据节点来水平扩展,以处理更大的数据量。 4. **容错性**:由于 Hive 基于 Hadoop,它继承了 Hadoop 的容错机制。如果某个节点失败,任务可以被重新调度到其他...

    apache-hive-2.1.1-bin.tar.gz下的bin文件夹,包含hive.cmd

    `hive.cmd`是Windows环境下执行Hive的命令脚本,它是一个批处理文件,用于启动Hive的交互式Shell。当用户在Windows系统上输入`hive`命令时,实际上就是在运行这个`hive.cmd`脚本。脚本内部会设置环境变量,如HADOOP_...

    Hive错误之 Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误分析_xiaohu21的博客-CSDN博客.mht

    Hive错误之 Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误分析_xiaohu21的博客-CSDN博客.mht

    龙战于野大数据MR原理启动hive查询表分区.docx

    Hive提供了多种方式来创建表分区,包括静态分区和动态分区。 查询表分区 查询表分区是指根据查询条件来选择相应的分区进行查询。在Hive中,可以使用以下命令来查询表分区: `hive> show partitions table_name;` ...

Global site tag (gtag.js) - Google Analytics