impala版本:1.1.1
hive:0.10.0-cdh4.4.0
hadoop:hadoop-2.0.0-cdh4.2.2
数据存储在hadoop的HDFS,文件格式是RCFile,用impala创建external table方式关联文件。一直都正常运行,但因为数据量太大,业务应用访问太慢,需要将table分区,但没想分区太多。出现了异常,异常内容如下:
ERROR: AnalysisException: Failed to load metadata for table: my_table CAUSED BY: TableLoadingException: TableLoadingException: Failed to load metadata for table: my_table CAUSED BY: TTransportException: java.net.SocketTimeoutException: Read timed out CAUSED BY: SocketTimeoutException: Read timed out
或者
AnalysisException:Failed to load metadata for table:my_table
CAUSED BY:TableLoadingException:Failed to load metadata for table:my_table
CAUSED BY: TTransportExeption: null
查找原因,发现impala与hive都不能正常读取metadata信息。但进程仍正常。只好kill掉进程再重启
1)ps -ef|grep metastore
2)返回hive进程pid,执行kill -9 pid
3)./hive --service metastore
4)service impala-server stop
5)service impala-server start
6)impala-shell -r
可以获取到metadata数据,看到表信息
但是仍然不能访问my_table
查询hive的log,在/tmp/root/hive.log目录下(可以在hive-site.xml中修改路径)
发现报java.lang.OutOfMemoryError:GC overhead limit exceed
修改hive/conf/hive-env.sh,将export HADOOP_HEAPSIZE=** 改大,并重启hive就可以了。(据说也可以升级impala到1.2.4版本解决)
如果进入impala-shell,访问某些表时仍有如下错误:
ERROR: TApplicationException:get_table failed:out of sequence response
执行:invalidate metadata my_table;
再执行你的sql语句应该就可以了。
相关推荐
然而,当涉及到处理中文字符时,Impala的内置函数`substr()`和`substring()`可能会遇到一些挑战,尤其是在截取中文字符串时可能出现乱码问题。这是因为这两个函数在设计时可能没有充分考虑多字节字符集,如UTF-8,而...
本文将围绕“Hue常见问题解决方案”这一主题,详细阐述Hue与Hive在大数据平台中可能遇到的问题以及相应的解决策略。 首先,我们来了解Hue的基本功能。Hue是Cloudera公司开发的一款开源Web应用程序,它提供了一个...
Hive MetaStore 在快手遇到的挑战与优化 转变,贝壳数据平台的演进 快手超大规模集群调度优化实践 有赞数据治理之提质降本 Impala 3.4 在网易的最新实践 美团酒旅数据治理实践 Impala 3.4 在网易的最新实践 取代 ...
通过这个视频教程,你不仅能够掌握Hive的基础知识,还能了解到实际项目中可能遇到的问题及解决方案,为你的大数据职业生涯打下坚实的基础。无论你是想要进行数据分析、数据挖掘还是构建数据仓库,本教程都将是你不可...
【大数据基础入门培训课程——基于Hadoop的数据仓库Hive】模块11主要涵盖了Hive的基础知识,包括其系统架构、工作原理、高可用性(HA)原理,以及相关的数据分析工具Impala,还有Hive的编程实践。以下是这些知识点的...
你需要在这里配置Hue连接到Hadoop集群的参数,如HDFS的URL、Hive Metastore的位置、Impala的端点等。 4. **数据库设置**:Hue使用内置的SQLite或外部的MySQL/PostgreSQL作为其元数据存储。根据你的需求,配置相应的...
安全方面,采用Kerberos进行身份验证,Hive Metastore管理元数据,确保数据访问的安全性。此外,可以引入AI框架如TensorFlow或PyTorch,结合机器学习算法提供智能推荐服务。 三、平台设计分析 整体架构可划分为数据...
4. 配置Hue:修改`desktop/conf/pseudo-distributed.ini`配置文件,设置与你的Hadoop集群相关的参数,例如HDFS的URL、Hive的Metastore服务地址等。 5. 初始化数据库:使用Hue内置的初始化脚本创建数据库表结构,...
这份配置说明将详细介绍如何在Cloudera Data Hub (CDH)环境中实现高可用性,涵盖HDFS HA以及CDH其他组件如Hive Metastore、Hue和Impala与HDFS HA的集成。 1. **简介** Apache Hadoop集群常常承载着各种用户运行的...
- **数据库配置**:安装过程中可能需要配置相关数据库连接,如Hive Metastore、HBase的ZooKeeper等。 - **安装成功验证**:安装完成后,检查所有组件的状态,确认无误。 **4. 安装Kafka** - **下载Kafka**:Kafka...
在对比项目中,如Hive、Spark SQL、Presto、Kylindr、Druid、Impala、Doris和ClickHouse,它们在明细查询、实时写入、精确去重、亚秒级响应和SQL支持方面存在差异。对于广告场景的多维分析,其特点是用户行为日志、...
(2) 可与多种SQL引擎(如Hive、Impala、Spark)集成;(3) 基于HDFS的文件存储;(4) 具有元数据存储(Metastore)功能,方便管理和检索数据;(5) 提供高效的API,支持批流一体的处理。 在元数据管理方面,Iceberg...