mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000.

superlxw1234

浏览: 553747 次
性别:
来自: 西安

最近访客更多访客>>

huageng520

rattersnake

yuanyuan7891

ticojj

博主相关

博客

微博

相册

留言

关于我

博客专栏

: Hive入门
浏览量：44742

文章分类

社区版块

存档分类

博客分类：

java
hive
hadoop

hadoop hive

Failure Info:Job initialization failed: java.io.IOException: Split metadata size exceeded 10000000. 
Aborting job job_201205162059_1073852 at 
org.apache.hadoop.mapreduce.split.SplitMetaInfoReader.readSplitMetaInfo(SplitMetaInfoReader.java:48) at 
org.apache.hadoop.mapred.JobInProgress.createSplits(JobInProgress.java:817) at 
org.apache.hadoop.mapred.JobInProgress.initTasks(JobInProgress.java:711) at 
org.apache.hadoop.mapred.JobTracker.initJob(JobTracker.java:4028) at 
org.apache.hadoop.mapred.EagerTaskInitializationListener$InitJob.run(EagerTaskInitializationListener.java:79) at 
java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886) at 
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908) at java.lang.Thread.run(Thread.java:662)

出错原因：该job的job.splitmetainfo文件大小超过限制；

1. job.splitmetainfo，该文件记录split的元数据信息，job split ----> HDFS block && slave node

存放路径位于：${hadoop.tmp.dir}/mapred/staging/${user.name}/.staging/jobId/

2. 参数mapreduce.jobtracker.split.metainfo.maxsize控制该文件的最大大小，默认为：10000000（10M）

解决方法：

1. 修改mapreduce.jobtracker.split.metainfo.maxsize参数值，但需要重启jobtracker才能生效；

2. 该问题的根本原因还是因为input小文件或者目录太多导致的，所以建议合并小文件；

0
顶

0
踩

分享到：

hive中一些实用的小技巧 | hive新旧jar包冲突引起的错误java.lang.No ...

2012-06-21 15:46
浏览 7345
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000.

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000.

评论

发表评论

相关推荐

[一起学Hive]之十七-从Hive表中进行数据抽样-Sampling

JAVA开源中文分词工具-IKAnalyzer下载及使用

[一起学Hive]之十六-Hive的WEB页面接口-HWI

[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics)

一起学Hive系列文章

Java实现的简单双向Map，支持重复Value

MapReduce和Hive支持递归子目录作为输入

[一起学Hive]之十四-Hive的元数据表结构详解

[一起学Hive]之十三-Hive整合HBase，操作HBase表

[一起学Hive]之十二-Hive SQL的优化

[一起学Hive]之十一-Hive中Join的类型和用法

[一起学Hive]之十-Hive中Join的原理和机制

[一起学Hive]之九-Hive的查询语句SELECT

Spark1.4.0-SparkSQL与Hive整合-支持窗口分析函数

[一起学Hive]之八-使用Hive命令行

[一起学Hive]之六-Hive的动态分区

[一起学Hive]之七-向Hive表中加载数据

[一起学Hive]之五-Hive的视图和分区

[一起学Hive]之四-Hive的安装配置

[一起学Hive]之三—Hive中的数据库(Database)和表(Table)

最近访客更多访客>>