`
li.oo
  • 浏览: 51518 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

impala + hive metastore遇到的问题

 
阅读更多

impala版本:1.1.1

hive:0.10.0-cdh4.4.0

hadoop:hadoop-2.0.0-cdh4.2.2

数据存储在hadoop的HDFS,文件格式是RCFile,用impala创建external table方式关联文件。一直都正常运行,但因为数据量太大,业务应用访问太慢,需要将table分区,但没想分区太多。出现了异常,异常内容如下:

ERROR: AnalysisException: Failed to load metadata for table: my_table CAUSED BY: TableLoadingException: TableLoadingException: Failed to load metadata for table: my_table CAUSED BY: TTransportException: java.net.SocketTimeoutException: Read timed out CAUSED BY: SocketTimeoutException: Read timed out

或者

AnalysisException:Failed to load metadata for table:my_table

CAUSED BY:TableLoadingException:Failed to load metadata for table:my_table

CAUSED BY: TTransportExeption: null

查找原因,发现impala与hive都不能正常读取metadata信息。但进程仍正常。只好kill掉进程再重启

1)ps -ef|grep metastore

2)返回hive进程pid,执行kill -9 pid

3)./hive --service metastore

4)service impala-server stop

5)service impala-server start

6)impala-shell -r

可以获取到metadata数据,看到表信息

但是仍然不能访问my_table

查询hive的log,在/tmp/root/hive.log目录下(可以在hive-site.xml中修改路径)

发现报java.lang.OutOfMemoryError:GC overhead limit exceed

修改hive/conf/hive-env.sh,将export HADOOP_HEAPSIZE=** 改大,并重启hive就可以了。(据说也可以升级impala到1.2.4版本解决)

如果进入impala-shell,访问某些表时仍有如下错误:

ERROR: TApplicationException:get_table failed:out of sequence response

执行:invalidate metadata my_table;

再执行你的sql语句应该就可以了。

 

 

分享到:
评论

相关推荐

    impala中substr()截取中文字符串乱码的问题

    然而,当涉及到处理中文字符时,Impala的内置函数`substr()`和`substring()`可能会遇到一些挑战,尤其是在截取中文字符串时可能出现乱码问题。这是因为这两个函数在设计时可能没有充分考虑多字节字符集,如UTF-8,而...

    Hue 常见问题解决方案,大数据平台的hue/hive常见问题总结 免费下载

    本文将围绕“Hue常见问题解决方案”这一主题,详细阐述Hue与Hive在大数据平台中可能遇到的问题以及相应的解决策略。 首先,我们来了解Hue的基本功能。Hue是Cloudera公司开发的一款开源Web应用程序,它提供了一个...

    大数据典藏版合集 大数据典藏版合集 大数据典藏版合集

    Hive MetaStore 在快手遇到的挑战与优化 转变,贝壳数据平台的演进 快手超大规模集群调度优化实践 有赞数据治理之提质降本 Impala 3.4 在网易的最新实践 美团酒旅数据治理实践 Impala 3.4 在网易的最新实践 取代 ...

    尚硅谷大数据视频_Hive视频教程

    通过这个视频教程,你不仅能够掌握Hive的基础知识,还能了解到实际项目中可能遇到的问题及解决方案,为你的大数据职业生涯打下坚实的基础。无论你是想要进行数据分析、数据挖掘还是构建数据仓库,本教程都将是你不可...

    厦门大学林子雨版大数据基础入门培训课程 教师培训交流讲义-模块11-基于Hadoop的数据仓库Hive 共48页.ppt

    【大数据基础入门培训课程——基于Hadoop的数据仓库Hive】模块11主要涵盖了Hive的基础知识,包括其系统架构、工作原理、高可用性(HA)原理,以及相关的数据分析工具Impala,还有Hive的编程实践。以下是这些知识点的...

    hue-3.7.1.tgz 工具

    你需要在这里配置Hue连接到Hadoop集群的参数,如HDFS的URL、Hive Metastore的位置、Impala的端点等。 4. **数据库设置**:Hue使用内置的SQLite或外部的MySQL/PostgreSQL作为其元数据存储。根据你的需求,配置相应的...

    大数据平台技术期末大作业(2023-2024-1).doc

    安全方面,采用Kerberos进行身份验证,Hive Metastore管理元数据,确保数据访问的安全性。此外,可以引入AI框架如TensorFlow或PyTorch,结合机器学习算法提供智能推荐服务。 三、平台设计分析 整体架构可划分为数据...

    Hue安装配置教程.zip

    4. 配置Hue:修改`desktop/conf/pseudo-distributed.ini`配置文件,设置与你的Hadoop集群相关的参数,例如HDFS的URL、Hive的Metastore服务地址等。 5. 初始化数据库:使用Hue内置的初始化脚本创建数据库表结构,...

    Cloudera产品高可用性配置说明1

    这份配置说明将详细介绍如何在Cloudera Data Hub (CDH)环境中实现高可用性,涵盖HDFS HA以及CDH其他组件如Hive Metastore、Hue和Impala与HDFS HA的集成。 1. **简介** Apache Hadoop集群常常承载着各种用户运行的...

    CDH5.8+Oryx2.2推荐系统环境搭建

    - **数据库配置**:安装过程中可能需要配置相关数据库连接,如Hive Metastore、HBase的ZooKeeper等。 - **安装成功验证**:安装完成后,检查所有组件的状态,确认无误。 **4. 安装Kafka** - **下载Kafka**:Kafka...

    6-6+58商业广告多维分析实践.pdf

    在对比项目中,如Hive、Spark SQL、Presto、Kylindr、Druid、Impala、Doris和ClickHouse,它们在明细查询、实时写入、精确去重、亚秒级响应和SQL支持方面存在差异。对于广告场景的多维分析,其特点是用户行为日志、...

    数据湖在xx的实践.pdf

    (2) 可与多种SQL引擎(如Hive、Impala、Spark)集成;(3) 基于HDFS的文件存储;(4) 具有元数据存储(Metastore)功能,方便管理和检索数据;(5) 提供高效的API,支持批流一体的处理。 在元数据管理方面,Iceberg...

Global site tag (gtag.js) - Google Analytics