`
猫耳呀
  • 浏览: 167301 次
社区版块
存档分类
最新评论

MaxCompute使用常见问题总结

阅读更多
摘要: Maxcompute常见问题的总结,方便广大用户可以快速排查问题

计费相关

存储计费:按照存储在 MaxCompute 的数据的容量大小进行阶梯计费。

计算计费:MaxCompute 分按量后付费和按 CU 预付费两种计算计费方式。

按量后付费:按量后付费方式针对 SQL 任务和 MapReduce 任务进行计费。

SQL 任务按量后付费:即 SQL 任务按 I/O 后付费。

MapReduce 按量后付费:即 MapReduce 任务按量进行计费。

按 CU 预付费:此方式仅在阿里云大数据平台提供。

下载计费: MaxCompute 将按照下载的数据大小进行计费
注意是对公网下载收费,内网下载不收费
参考https://help.aliyun.com/document_detail/27989.html?spm=5176.doc45389.6.560.LYjhcl

SQL语法和标准sql区别

1,无事务控制
2,暂时不支持update/delete
3,不支持修改字段类型,不支持删除字段
4,不支持 select from 多表
5,其他hive对标函数,官方文档没有的暂时不支持
更多参考
https://help.aliyun.com/document_detail/50985.html?spm=5176.doc27862.6.757.lSC74f

SQL限制

select 最大显示10000行

想导出大于10000行参考
https://help.aliyun.com/document_detail/53093.html?spm=5176.7751065.6.751.iLm6hF
2,string字段最大8M
更多其他限制参考
https://help.aliyun.com/document_detail/51823.html?spm=5176.doc53093.6.618.R37r8p

java沙箱限制类问题

用户经常问:
本地测试正常,在提交到odps后失败,代码一毛一样
https://help.aliyun.com/document_detail/27967.html?spm=5176.doc51823.6.647.Rt0efa
原因:
我们处于安全考虑,对一些第三方jar包做了限制
一般是fastjson这个包比较常见,回复口径:

由于java沙箱限制,对一些第三方jar包由限制,fastjson的jar包被限制因为安全沙箱的原因无法使用。
https://help.aliyun.com/document_detail/27967.html

建议用gson
import com.google.gson.Gson;这个包试下
其他的jar的限制用户遇到类似报错可以提交工单咨询

下图是常见报错例子
图片描述

没有启用新类型flag

若想使用新数据类型,需在 SQL 语句前加语句:set odps.sql.type.system.odps2=true;

目前情况是需要加这个set,后续会省掉
https://help.aliyun.com/document_detail/27821.html?spm=5176.doc27967.6.546.XhnAGU

新数据类型,以及新函数、函数返回值是新数据类型都需要set
如果没有set,报错现象
com.aliyun.odps.OdpsException: ODPS-0130071:[1,8] Semantic analysis exception - function or view udtf_recom cannot be resolved
找不到函数或者方法

oss和ots外部表创建,查询失败

1,检查是否按照文档授权
https://help.aliyun.com/document_detail/45389.html?spm=5176.doc27821.6.691.5g0yGt
2,报错类似
DDL syntax error:ODPS-0130071:Semantic analysis exception - unrecognized option ‘EXTERNAL’.
检查:是否引用了新类型,也需要set
3,如果建表后查询失败
检查用户oss或者ots数据量是否巨大,
oss的object数量是否很多
单个object是否很大
参考文档 https://www.atatech.org/articles/67977 理解
报错例子 没有授权

图片描述

客户端odpscmd 报错

连接客户端/访问域名先看下域名
https://help.aliyun.com/document_detail/34951.html?spm=5176.doc48950.6.572.58H50H
项目名称
Ak信息
如果报错找不到java类什么的
一般是客户端java环境(暂时不支持java9),建议java 7和8

任务运行比较慢

1,如果是按量付费,请提交工单,如果是预付费,可以先看下cu对应的项目是否有大量作业或者比较大的作业,长期没有执行完。
可以使用主账户执行命令: TOP INSTANCE;这种方式查看当前正在运行的任务(在客户端(版本为0.29.0或以上)运行。)
下载最新版本的客户端: https://help.aliyun.com/document_detail/27804.html?
您也可以通过这个工具查看项目下运行任务的状态
https://yq.aliyun.com/articles/247739?spm=5176.8091938.0.0.7Sf007
如果是预付费cu用户可以使用这个工具查看cu使用情况
https://help.aliyun.com/document_detail/66565.html?spm=a2c4g.11186623.6.713.QARDJv
2,数据倾斜
https://help.aliyun.com/document_detail/51020.html?spm=5176.doc34951.6.754.iMKNUT

原文链接:https://yq.aliyun.com/articles/536451?spm=a2c41.11181499.0.0

分享到:
评论

相关推荐

    阿里云MaxCompute百问百答.pdf

    通过学习 MaxCompute,用户能够快速了解 MaxCompute 的核心功能、产品架构、典型场景和生态体系,同时解决使用过程中可能遇到的常见问题,从而快速上手 MaxCompute,用好 MaxCompute,最大限度发挥数据的价值,支撑...

    MaxCompute索引优化实践分享.zip

    总结,MaxCompute的索引优化实践主要集中在合理选择和设计分区,以及正确使用和调整索引策略上。通过对这些方面进行深入理解和实践,可以显著提升大数据查询的效率,降低处理成本。在实际应用中,应结合业务需求和...

    阿里云大数据工厂DataWorks学习之-数据同步任务常见报错总结

    在使用DataWorks进行数据同步任务时,可能会遇到各种错误,尤其是在从MaxCompute向其他数据源如RDS或HybridDB迁移数据的过程中。下面我们将详细探讨这些常见错误及其解决策略。 1. **数据回滚**: 当数据批量写入...

    大数据平台 MaxCompute 公有云多租户设计-3-2 淘系数据模型治理最佳实践.zip

    总结起来,淘系在MaxCompute上的数据模型治理最佳实践,不仅涵盖了基础的数据模型设计和分区策略,还涉及到了数据生命周期管理、权限控制、数据质量监控和性能优化等多个层面,充分体现了大数据治理的全面性和深度。...

    大规模游戏社交网络节点相似性算法及其应用-3-2 大数据平台 MaxCompute 公有云多租户设计.zip

    总结,本资料深入介绍了在大规模游戏社交网络中利用节点相似性算法来挖掘有价值的信息,并探讨了如何在MaxCompute的大数据平台上实现这些算法,特别是在多租户环境下的数据处理和分析。这些技术对于提升游戏体验、...

    Max用户指南.pdf

    MaxCompute支持多种数据类型,常见的包括String、Integer、Double等。这些数据类型可以用于定义表的列属性。 - **1.6 生命周期** 生命周期指的是数据在MaxCompute中的保留时间,一旦数据的生命周期结束,这些...

    万亿级别全链路数据治理最佳实践.pdf

    2. **计算层**:采用了MaxCompute进行离线大数据计算,并利用Flink进行实时计算。 3. **采集层**:使用Logtail、Flume等工具收集原始数据。 4. **数据开发与治理层**:基于DataWorks平台进行数据开发、调度及治理。 ...

    dataxV202210的所有writer插件

    DataX的writer插件涵盖了多种常见的数据存储系统,包括但不限于: 1. **关系型数据库**:如MySQL、Oracle、SQLServer、PostgreSQL等,writer插件可以将数据高效地导入到这些数据库中,支持批量插入和事务处理,确保...

    阿里云javaAPI

    本篇将深入探讨阿里云Java API的使用方法、核心概念以及常见应用场景。 一、阿里云Java API简介 阿里云API是基于HTTP/HTTPS协议的RESTful接口,通过JSON格式的数据交换,实现了与阿里云服务的远程调用。Java API是...

    大数据分系统设计方案qy.docx

    1. **离线计算引擎**:阿里云大数据离线计算(MaxCompute)是一种大规模数据处理服务,兼容多种编程接口,支持多种计算类型,如SQL、MapReduce、Spark RDD等。 2. **实时计算引擎**:基于Flink框架实现,提供实时流...

Global site tag (gtag.js) - Google Analytics