摘要: 创建数据集是报表分析的基础,合理建模可以达到事半功倍的效果哦!
产品核心流程第二步为创建数据集,进行数据建模,如果说数据是海,那么创建数据集并合理建模就是划船的浆,有了浆才能在数据的海洋里畅游。目前创建数据集有两种方式:(1)数据表直接创建数据集 (2)通过自定义sql创建数据集,以实现初步建模。
创建数据集:
(1)直接新建数据集:
如下图,在数据源列表页,找到目标表,点击创建数据集按钮并选择存放文件夹 即可新建,新建后自动进入数据集界面。
(2)自定义sql创建数据集:
目前产品支持MaxCompute和MySQL数据源自定义sql创建数据集,可以实现多表关联、新增目标字段等。如下图,点击‘自定义SQL’进入编辑界面:
目前自定义sql有部分规则需要注意:
MySQL
不支持函数列表:
MaxCompute
MaxCompute数据源原生支持函数即可。
常见问题
Q:MaxCompute数据源,为什么搜索不到目标表?
A:(1) MaxCompute数据源新建表需要约30分钟来进行Meta同步,稍等一下哟,要保证同步表的用户AccessID和AccessKey有效。
Q:MaxCompute数据源,创建表提示没有权限?
A:申请权限,保证具有list、select、create instance权限。
Q:MaxCompute数据源数据集编辑界面刷新预览数据报错:
A:错误原因:2018年1月10日 20点 新创建的项目(project)默认禁止分区表全表扫描,即对该项目的分区表执行全表扫描语句时会返回失败。
1.指定分区条件,自定义sql在对分区表全表扫描的sql语句后加 ‘where pt = xxx’ 限制分区。
2.创建报表时对分区字段添加过滤。
Q:SqlServer、PostgreSQL、Oracle数据源,找不到对应表?
A: 请确认添加数据源schema是否正确
Q:自定义sql创建数据集,字段呈现下图形式,刷新预览数据报错?
A:如上图标识,字符类型用?打标,说明后期对该字段别名进行了修改。字段名称前后有下划线_ 说明字段别名中加了单引号。解决办法:修改自定义sql并保存,在数据集编辑界面同步表结构,将错误字段删除,保存数据集最后刷新预览数据即可。
阅读更多干货好文,请关注扫描以下二维码:
相关推荐
数据可视化则利用Tableau、神策数据平台、Quick BI等工具将分析结果直观展现。最后,数据分析报告将整个流程的研究成果汇总,为企业决策提供参考。 数据分析方法论主要指导我们在不同业务场景中运用适当的方法和...
数据分析师的主要工作可以总结为三个方面:描述现状、发现规律、推动改进。 数据分析的主要流程可以总结为以下六个步骤: 1. 需求分析问题定位需求拆解 2. 数据收集(Mysql数据查询、Hive的数据查询、爬虫(Python...
数据分析师的工作主要包括三个方面:描述现状、发现规律和推动改进。 【数据分析流程】 数据分析的主要流程包括: 1. 需求分析:明确问题,定位需求并拆解。 2. 数据收集:使用SQL查询数据库、Hive查询大数据集或...
通常分为六步:需求分析和问题定位、数据收集(如MySQL和Hive查询,爬虫技术)、数据处理(ETL过程)、数据分析(构建业务指标体系和应用分析模型)、数据可视化(如Tableau、神策数据平台和Quick BI)以及编写分析...
数据分析师的主要工作包括描述现状、发现规律、推动改进等三个方面。 数据分析主要流程 数据分析的主要流程可以总结为以下六个步骤: 1. 需求分析问题定位需求拆解 2. 数据收集(Mysql数据查询、Hive数据查询、...
数据开发则为数据分析师提供了丰富的开发工具,实现数据的深度加工和转换。数据资产管理则使企业能够更加便捷地管理其数据资产,进行分类、标签化、元数据管理等。 Quick BI则作为一个数据分析工具,具备强大的数据...
在数据团队面临的问题上,包括分析师如何高效使用数据、数据工程师如何优化数据建设以及团队主管如何找到合适的数据专家。Dataphin的出现,以数据工作台的形式,解决了这些问题。它提供了一个协同工作环境,使得数据...
业务分析师、项目经理、公民开发者,以及希望提高开发效率的专业开发团队。 十一、低代码/无代码平台会成为潮流吗 随着数字化转型的深入,低代码/无代码平台的趋势明显,越来越多的企业和个人将采用这种开发方式。 ...