转个解决 MapredLocalTask的帖子
我的问题是目录没有其他用户读权限,所以报错
http://vase.iteye.com/blog/2090320
不知道是不是hive-0.12版增强了local mode的原因,在之前版本运行好好的Hive-QL在这个版本上错误频频,折磨一天多以后终于定位到原因,把在内部的总结在这再记录下,希望对遇到同样问题的筒子们有所帮助。
部分一 关于return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask
Hive升级到0.12版之后,若干原来在0.10上执行正常的SQL会在新版上报错误 “return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask”,查看hive执行日志,从中找到如下错误
- Total MapReduce jobs = 1
- java.io.IOException: Cannot run program "/data/opt/hadoop_cdh5/bin/hadoop" (in directory "/root"): error=13, 权限不够
- at java.lang.ProcessBuilder.start(ProcessBuilder.java:1041)
- at java.lang.Runtime.exec(Runtime.java:617)
- at java.lang.Runtime.exec(Runtime.java:450)
- at org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask.execute(MapredLocalTask.java:253)
- at org.apache.hadoop.hive.ql.exec.Task.executeTask(Task.java:151)
- at org.apache.hadoop.hive.ql.exec.TaskRunner.runSequential(TaskRunner.java:65)
- at org.apache.hadoop.hive.ql.Driver.launchTask(Driver.java:1485)
- at org.apache.hadoop.hive.ql.Driver.execute(Driver.java:1263)
- at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1091)
- at org.apache.hadoop.hive.ql.Driver.run(Driver.java:931)
- at org.apache.hadoop.hive.ql.Driver.run(Driver.java:921)
- at org.apache.hadoop.hive.service.HiveServer$HiveServerHandler.execute(HiveServer.java:198)
- at org.apache.hadoop.hive.service.ThriftHive$Processor$execute.getResult(ThriftHive.java:644)
- at org.apache.hadoop.hive.service.ThriftHive$Processor$execute.getResult(ThriftHive.java:628)
- at org.apache.thrift.ProcessFunction.process(ProcessFunction.java:39)
- at org.apache.thrift.TBaseProcessor.process(TBaseProcessor.java:39)
- at org.apache.thrift.server.TThreadPoolServer$WorkerProcess.run(TThreadPoolServer.java:244)
- at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
- at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
- at java.lang.Thread.run(Thread.java:744)
- Caused by: java.io.IOException: error=13, 权限不够
- at java.lang.UNIXProcess.forkAndExec(Native Method)
- at java.lang.UNIXProcess.<init>(UNIXProcess.java:135)
- at java.lang.ProcessImpl.start(ProcessImpl.java:130)
- at java.lang.ProcessBuilder.start(ProcessBuilder.java:1022)
- ... 19 more
- FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask
从上边错误及下边报错的类MapredLocalTask可以看出跟本地任务有关
hive从0.7版以后,为了提高小数据的计算速度,增加了本地模式,即将hdfs上的数据拉到hiveserver本地进行计算,可以通过以下几个参数对相关行为进行设置
hive.exec.mode.local.auto.input.files.max=4
hive.exec.mode.local.auto.inputbytes.max=134217728
类似上一篇中return code 1的问题,这个也是跟hive本地任务有关系。
从hive的日志中可以找到出错时本地日志文件,如下:
查看日志文件内容
- 2014-07-10 11:50:37,606 INFO mr.ExecDriver (SessionState.java:printInfo(417)) - Execution log at: /tmp/hdfs/hdfs_20140710114949_ab4d1d02-0637-4abd-9e45-2a27c5d740d9.log
- 2014-07-10 11:50:37,711 WARN conf.Configuration (Configuration.java:loadProperty(2358)) - file:/tmp/hdfs/hive_2014-07-10_11-49-37_877_2428431256361163465-1/-local-10009/jobconf
- 2014-07-10 11:50:37,720 WARN conf.Configuration (Configuration.java:loadProperty(2358)) - file:/tmp/hdfs/hive_2014-07-10_11-49-37_877_2428431256361163465-1/-local-10009/jobconf
- 2014-07-10 11:50:37,798 INFO log.PerfLogger (PerfLogger.java:PerfLogBegin(97)) - <PERFLOG method=deserializePlan from=org.apache.hadoop.hive.ql.exec.Utilities>
- 2014-07-10 11:50:37,798 INFO exec.Utilities (Utilities.java:deserializePlan(732)) - Deserializing MapredLocalWork via kryo
- 2014-07-10 11:50:38,043 INFO log.PerfLogger (PerfLogger.java:PerfLogEnd(124)) - </PERFLOG method=deserializePlan start=1404964237798 end=1404964238043 duration=245 from=org.apa
- 2014-07-10 11:50:38,050 INFO mr.MapredLocalTask (SessionState.java:printInfo(417)) - 2014-07-10 11:50:38 Starting to launch local task to process map join; maximum memory =
- 2014-07-10 11:50:38,059 INFO mr.MapredLocalTask (MapredLocalTask.java:initializeOperators(389)) - fetchoperator for t2:t_tmp_user_first_login created
- 2014-07-10 11:50:38,198 INFO exec.TableScanOperator (Operator.java:initialize(338)) - Initializing Self 0 TS
- 2014-07-10 11:50:38,198 INFO exec.TableScanOperator (Operator.java:initializeChildren(403)) - Operator 0 TS initialized
- 2014-07-10 11:50:38,199 INFO exec.TableScanOperator (Operator.java:initializeChildren(407)) - Initializing children of 0 TS
- 2014-07-10 11:50:38,199 INFO exec.SelectOperator (Operator.java:initialize(442)) - Initializing child 1 SEL
- 2014-07-10 11:50:38,199 INFO exec.SelectOperator (Operator.java:initialize(338)) - Initializing Self 1 SEL
- 2014-07-10 11:50:38,605 ERROR mr.MapredLocalTask (MapredLocalTask.java:executeFromChildJVM(324)) - Hive Runtime Error: Map local work failed
- java.lang.RuntimeException: java.lang.ClassNotFoundException: com.renren.hive.date.GetWeekISO
- at org.apache.hadoop.hive.ql.udf.generic.GenericUDFBridge.getUdfClass(GenericUDFBridge.java:132)
- at org.apache.hadoop.hive.ql.exec.FunctionRegistry.isStateful(FunctionRegistry.java:1474)
- at org.apache.hadoop.hive.ql.exec.FunctionRegistry.isDeterministic(FunctionRegistry.java:1437)
- at org.apache.hadoop.hive.ql.exec.ExprNodeGenericFuncEvaluator.isDeterministic(ExprNodeGenericFuncEvaluator.java:132)
- at org.apache.hadoop.hive.ql.exec.ExprNodeEvaluatorFactory.iterate(ExprNodeEvaluatorFactory.java:83)
- at org.apache.hadoop.hive.ql.exec.ExprNodeEvaluatorFactory.toCachedEval(ExprNodeEvaluatorFactory.java:73)
- at org.apache.hadoop.hive.ql.exec.SelectOperator.initializeOp(SelectOperator.java:59)
- at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:377)
- at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:453)
- at org.apache.hadoop.hive.ql.exec.Operator.initializeChildren(Operator.java:409)
- at org.apache.hadoop.hive.ql.exec.TableScanOperator.initializeOp(TableScanOperator.java:188)
- at org.apache.hadoop.hive.ql.exec.Operator.initialize(Operator.java:377)
- at org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask.initializeOperators(MapredLocalTask.java:408)
- at org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask.executeFromChildJVM(MapredLocalTask.java:302)
- at org.apache.hadoop.hive.ql.exec.mr.ExecDriver.main(ExecDriver.java:728)
- at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
- at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
- at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
- at java.lang.reflect.Method.invoke(Method.java:606)
- at org.apache.hadoop.util.RunJar.main(RunJar.java:212)
- Caused by: java.lang.ClassNotFoundException: com.renren.hive.date.GetWeekISO
- at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
- at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
- at java.security.AccessController.doPrivileged(Native Method)
- at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
- at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
- at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
- at java.lang.Class.forName0(Native Method)
- at java.lang.Class.forName(Class.java:270)
- at org.apache.hadoop.hive.ql.udf.generic.GenericUDFBridge.getUdfClass(GenericUDFBridge.java:130)
由上可知,这次是找不到UDF的类(如遇到其他情况,需要具体问题具体分析),虽然在进入hive的时候通过add jar语句将自定义函数的jar包添加到hadoop集群,但在本地模式时确找不到了。定位到问题就好解决了:既然是local模式找不到udf jar包,说明在add jar步骤只是向当前job在hdfs上的工作目录下添加了,无视本地工作目录;那么我们就直接把udf的jar包copy到hive的lib目录下,测 试正常。
该问题在之前用过的hive 0.10、0.8.1中都未遇到过,初步猜测跟0.12版的bug有关,具体原因就需要花时间翻代码对照前后版本的变动了
从org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask代码中看,还有return code 3的情况,现在幸运的尚未遇到,遇到后再补记录
相关推荐
如果看到`FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask`,这可能是因为MapJoin操作导致的问题。为避免这类错误,可以尝试设置`hive.auto.convert.join = false...
DCM与PFC融合的CRM混合模式创新实践,DCM CRM混合模式PFC ,DCM; CRM混合模式; PFC,DCM与PFC的混合模式在CRM系统中的应用
基于Dijkstra算法的路径规划Matlab代码:读取黑白色地图并实现图像上的路径规划示例,读取黑白色地图,在图片上进行路径规划matlab代码 路径规划算法基于读图识别的Dijkstra算法 随意设置坐标,规划路径 示例如下 ,读取地图; 路径规划算法; Dijkstra算法; 坐标设置; 规划路径,基于Dijkstra算法的Matlab黑白色地图路径规划代码
matlab实现LSTM时序预测完整程序+数据
968a658a40c897eb4452d8718cf0f8e6.part6
Matlab Simulink下的LLC开关电源仿真技术探究与实践,Matlab Simulink仿真,LLC开关电源仿真 ,核心关键词:Matlab Simulink仿真; LLC开关电源仿真; 电源仿真,Matlab Simulink下的LLC开关电源仿真研究
matlab实现RF时序预测完整程序+数据
FLAC3D水力切顶角度研究:水力压裂代码的实践与参考指南,FLAC3d不同水力切顶角度,水力压裂代码,可以做参考 ,FLAC3d; 水力切顶角度; 水力压裂代码; 参考;,FLAC3d水力压裂角度控制与代码解析
基于分层滤波技术的冲击噪声检测与去除算法.pdf
"COMSOL模拟技术:等离子体与热流耦合的深度探索",comsol等离子体,热流耦合 ,comsol等离子体; 热流耦合; 仿真模拟; 物理建模,"COMSOL等离子体热流耦合模拟"
基于SSA与DBN的多输入单输出预测模型:麻雀优化算法在Matlab环境下的实现与效果评估,麻雀优化算法SSA结合DBN做多输入单输出预测模型,要求数据是excel替数据就可以用。 程序语言是matlab,需求最低版本为2020及以上。 程序可以出真实值和预测值对比图,线性拟合图,可打印多种评价指标。 PS:以下效果图为测试数据的效果图,主要目的是为了显示程序运行可以出的结果图,具体预测效果以个人的具体数据为准。 2.由于每个人的数据都是独一无二的,因此无法做到可以任何人的数据直接替就可以得到自己满意的效果。 3.程序后无原理讲解。 ,核心关键词:麻雀优化算法SSA; DBN多输入单输出预测模型; Matlab; 2020版及以上; 真实值和预测值对比图; 线性拟合图; 评价指标; 数据替换; 独一无二的数据; 无原理讲解。,基于SSA-DBN的Excel数据多输入单输出预测模型(Matlab 2020+版)
LDPC编译码技术:信道编译码实现、规格与算法可定制的探索,LDPC编译码实现 信道编译码 LDPC码编译码极其识别 编码规格DVBS2 IEEE802.11n IEEE802.16e 译码算法 置信传播 和积算法 最小和 可定制 ,LDPC编译码实现; 信道编译码; LDPC码识别; 编码规格(DVBS2; IEEE802.11n; IEEE802.16e); 译码算法(置信传播; 和积算法; 最小和); 可定制。,LDPC编译码技术:实现、规格与算法详解
基于三菱PLC的3×4立体仓库组态监控系统设计与实现,6#基于三菱PLC组态王3×4立体仓库组态监控系统 ,基于三菱PLC; 组态王; 立体仓库; 3×4组态监控系统; 立体仓库组态监控,基于三菱PLC的立体仓库组态监控系统
冻融循环数值仿真:基于Comsol的真水热力三场耦合分析降雨边坡稳定性周期性变化及热膨胀效应的达西定律应用,冻融循 环数值仿真 comsol 真水热力三场耦合 采用达西定律与热膨胀接口,可分析降雨边坡在冻融到解冻过程的稳定性周期性变化 ,冻融循环;数值仿真;Comsol;真水热力三场耦合;达西定律;热膨胀接口;降雨边坡稳定性;周期性变化,"冻融循环仿真研究:真水热力三场耦合与周期性稳定性分析"
声发射定位图:MATLAB制作的长方体三维立体展示技术,2D与3D个性化呈现解析,声发射定位图(长方体),MATLAB制作,2D 3D个性化展示。 ,声发射定位图; 长方体模型; MATLAB制作; 2D 3D展示; 个性化展示,MATLAB制作声发射定位图:2D/3D个性化展示长方体图
高斯光束生成与传输模拟的Matlab计算方法研究,高斯光束生成传输matlab计算 ,高斯光束; 生成; 传输; MATLAB计算;,高斯光束生成与传输的Matlab计算
,500kW储能变流器(PCS) 采用T型三电平模块,结构三维、控制电路、驱动电路,全部的BOM,型式试验报告等全部资料。 没有程序源码,本交付的资料与本描述一致,未提及的可能没有。
基于多范数约束的分布式鲁棒优化模型:Matlab编程实现与优化策略探究,基于综合范数的两阶段分布鲁棒优化模型 采用matlab编程的基于场景概率驱动的两阶段分布鲁棒优化模型采用列和约束生成算法(C&CG)进行求解,采用 1-范数和∞-范数对分布鲁棒优化的模糊集进行构建,采用拉丁超立方抽样+kmeans进行场景生成及削减,程序运行可靠,思路清晰,有详细参考资料,可在此基础上进行拓展优化。 ,关键词:综合范数;两阶段分布鲁棒优化模型;Matlab编程;场景概率驱动;列和约束生成算法(C&CG);1-范数;∞-范数;拉丁超立方抽样;kmeans;程序运行可靠;思路清晰。,综合范数下的两阶段分布鲁棒优化模型与优化求解研究
基于Xilinx XC7A35T开发平台的高精度时间数字转换(TDC)系统:基于Carry4进位链的71.4ps分辨率TOF测距代码实现,xilinx xc7a35t 开发平台,基于Carry4进位链高精度时间数字转(TDC)代码,分辨率71.4ps#tof测距 ,核心关键词:xilinx xc7a35t;开发平台;Carry4进位链;高精度时间数字转换(TDC);分辨率71.4ps;#tof测距。,基于Xilinx XC7A35T平台的TDC高精度测距代码
基于ATP仿真建模的雷击过电压研究:直流500kV至1100kV输电线路的过电压特性分析,直流500kV,660kV,800kV,1100kV输电线路雷击过电压ATP仿真建模。 ,直流500kV; 660kV; 雷击过电压; ATP仿真建模; 输电线路; 800kV; 1100kV。,雷击过电压ATP仿真建模:超高压输电线路研究