`
猫耳呀
  • 浏览: 167637 次
社区版块
存档分类
最新评论

Severless SQL on OSS 实验(DataLakeAnalytics on OSS)

sql 
阅读更多

摘要: 数据存储在OSS后,可以有多种方式查询分析OSS数据,如自建Spark/Presto/Impala(阿里云EMR以及Hadoop社区官方已支持OSS), 使用MaxCompute、DataLakeAnalytics等。

基于OSS的数据查询分析

数据存储在OSS后,有多种查询分析的方法,包括阿里云MaxCompute、DataLakeAnalytics产品等Severless查询分析服务,也可以自建Spark、Presto、Imapla应用来分析OSS上的数据。

实验步骤(DataLakeAnalytics on OSS)

本次实验,主要介绍实验DataLakeAnalytics如何Severless地查询分析OSS上的数据。

服务开通

OSS服务:

1.开通OSS服务https://www.aliyun.com/product/oss

DataLakeAnalytics服务:

1.申请DataLakeAnalytics的试用资格
备注:目前DataLakeAnalytics公测中,需提交公测申请,开通试用。

操作步骤

准备数据

登录控制台, 并创建目录

请创建华东1区域的OSS测试Bucket(目前DataLakeAnalytics产品公测区域为华东1)。

备注:Bucket名称是全局唯一,如果提示名称已存在,请更换一个Bucket名称。

创建目录(建议目录如下):

创建目录workshop_sh/trade, workshop_sh/user 

下载模拟数据(该数据本次实验的模拟数据)

http://testdatasample.oss-cn-hangzhou.aliyuncs.com/workshop_sh/workshop_sh.zip

将下载的将交易记录和开户信息数据,分别上传到trade、user目录

登录Data Lake Analytics控制台

点击“登录数据库”,输入开通服务时分配的用户名和密码,登录Data Lake Analytics控制台。

公测期间的分配的用户名、密码,开通服务的消息中可以查看

创建Schema和Table

创建Schema

输入创建SCHEMA的语句,点击“同步执行”。

CREATE SCHEMA sh_trade

CREATE SCHEMA sh_trade
(注意:同一个阿里云region,schema名全局唯一,建议根据业务定义,已有重名schema,在创建时会提示报错,则请换一个schema名字。)

创建表

在“数据库”的下拉框中,选择刚刚创建的schema。
然后在SQL文本框中输入建表语句如下,并点击同步执行。其中,Location替换为您的Bucket和测试数据的路径

1.创建交易记录表:
说明:LOCATION 'oss://Bucket名称/交易记录表目录/'
实验中,替换LOCATION 'oss://您的OSS存储空间名称/workshop_sh/user/'。如:oss://workshopsh20180608100/workshop_sh/user

2.创建开户信息表:
说明:LOCATION 'oss://Bucket名称/开户信息表目录/'
实验中,替换LOCATION 'oss://您的OSS存储空间名称/workshop_sh/user/'。 如:oss://workshopsh20180608100/workshop_sh/user

3.建表完毕后,刷新页面,在左边导航条中能看到schema下的2张表

SQL查询(同步执行)

1.查询交易机构SXS_0010,在0603至0604的100条交易记录

显示执行结果

2.查询各城市、男性女性人群,购买的基金总额(多表Join查询)

SQL查询(异步执行)

异步执行查询,将查询结果,以CSV格式,输出到OSS上

点击“执行状态”,可看到该异步查询任务的执行状态

主要分为:“RUNNING”,“SUCCESS”,“FAILURE”。

点击“刷新”,当STATUS变为“SUCCESS”时,可以查看到查询结果输出到OSS的文件路径。

查看导出OSS的结果文件

实验耗费

OSS存储的费用

原文链接

分享到:
评论

相关推荐

    小程序直传oss示例小程序直传oss示例

    小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss示例小程序直传oss...

    springboot整合easypoi实现文件导入导出OSS文件上传和下载。OSS图片导出

    在本项目中,我们主要探讨如何使用SpringBoot框架与阿里云OSS(Object Storage Service)服务相结合,通过Easypoi库实现文件的导入、导出功能,以及OSS上的文件上传和下载。Easypoi是一个强大的Java操作Excel的工具...

    oss存储浏览器查看器,可以在linux系统里查看oss存储使用情况,也可以上传、下载、删除

    **OSS存储浏览器查看器详解** OSS(Object Storage Service)是阿里云提供的一种大规模、低成本、高可靠的云存储服务,适用于存放各种类型的数据,如图片、视频、文档等。在Linux环境中,为了方便管理和操作OSS存储...

    java利用oss实现下载功能

    "java利用oss实现下载功能" Java是当前最流行的编程语言之一,而 OSS(Object Storage Service)是阿里云提供的一种对象存储服务,通过使用Java和OSS可以实现下载功能。本文将详细介绍如何使用Java和OSS实现下载...

    oss客户端macos版本

    在IT行业中,OSS通常指的是Object Storage Service,它是一种云端的存储服务,允许用户存储、检索和管理大量的数据。阿里云提供了名为OSS的云存储解决方案,为开发者和企业提供高效、安全、弹性的数据存储服务。针对...

    阿里云实验录屏:使用OSS对图片进行基本处理

    阿里云实验录屏:使用OSS对图片进行基本处理

    文件上传(普通上传,oss上传,oss大文件分段上传)

    本文将深入探讨如何使用Java语言实现文件的本地上传、OSS(Object Storage Service)普通上传以及OSS大文件的分段上传。我们将重点讲解每个过程,并提供相关的知识点。 首先,我们来看本地文件上传。在Java中,我们...

    上传oss存储插件

    阿里云OSS(Object Storage Service)是一款面向互联网的分布式存储服务,它提供了高可用、高可靠、低成本的数据存储解决方案。"上传OSS存储插件"指的是一个能够帮助用户方便地将本地文件或多个文件批量上传至阿里云...

    android 集成 OSS 上传图片

    在Android开发中,集成阿里云对象存储服务(OSS)以实现图片上传是一个常见的需求。OSS 是一种云存储服务,允许开发者将大量的文件存储在云端,并能够方便地进行访问和管理。以下是对这个主题的详细讲解。 1. **...

    Android 阿里oss 存储

    在Android开发中,阿里云对象存储服务(OSS)是一个常用的服务,用于存储和管理大量数据。本项目涉及的是阿里OSS SDK的集成与使用,特别是针对官方文档中可能存在错误的参数修正。以下是对这个主题的详细解释: 一...

    vue页面使用阿里oss上传功能的实例(一)

    Vue 页面使用阿里 OSS 上传功能的实例(一) 本篇文章主要介绍了 Vue 页面使用阿里 OSS 上传功能的实例(一),涵盖了前端部分的实现细节,包括 oss-sdk 的引入、upload 组件的封装、 multipart 上传的实现等。 ...

    java上传本地文件到oss指定目录

    在Java开发中,将本地文件上传到阿里云OSS(Object Storage Service)是常见的操作,尤其在处理大数据存储和分发时。阿里云OSS提供了一种高效、安全且经济的云端存储解决方案。本篇文章将详细讲解如何使用Java SDK...

    阿里云oss桌面客户端工具

    阿里云OSS(Object Storage Service)桌面客户端工具是一款专为用户设计的便捷数据管理软件,主要用于与阿里云的OSS服务进行交互。OSS是阿里云提供的海量、安全、低成本、高可靠的云存储服务,它允许用户存储和检索...

    oss实现js上传

    在IT行业中,OSS(Object Storage Service)是一种广泛使用的云存储服务,它允许开发者和企业存储、管理和访问大量数据。在这种场景下,"oss实现js上传"指的是利用JavaScript实现向OSS服务批量上传文件的功能。这种...

    aliyun-oss-java-sdk-demo-mvn-3.10.2_阿里云OSS_

    阿里云对象存储服务(Object Storage Service,简称OSS),是阿里云提供的高可用、高可靠、低成本、大规模的云存储服务。它可以帮助企业和个人开发者轻松地存储和管理海量数据,适用于图片、视频、文档等各类文件的...

    java实现上传文件到oss(阿里云)功能示例

    Java 实现上传文件到 OSS(阿里云)的功能示例 Java 实现上传文件到 OSS(阿里云)的功能示例是指通过 Java 语言实现将文件上传到阿里云对象存储服务(OSS)的功能。本示例主要介绍了 Java 实现上传文件到 OSS 的...

    OSS批量上传图片

    **OSS批量上传图片** 阿里云对象存储服务(Object Storage Service,简称OSS),是一种海量、安全、低成本、高可靠的云存储服务,适合存放任何类型的文件。在开发过程中,经常需要进行图片等文件的批量上传操作,这...

    springboot整合oss实现文件的上传,查看,删除,下载

    在本文中,我们将深入探讨如何使用SpringBoot与OSS(Object Storage Service)集成,实现文件的上传、查看、删除和下载功能。OSS通常是指云存储服务,如阿里云的OSS,它提供了大规模、安全且高可用的在线存储解决...

    unity直接上传资源到oss

    using Aliyun.OSS; using UnityEditor; using Aliyun.OSS.Common; public class AliyunOss { // 创建OssClient实例。 OssClient client; string endpoint = "https://oss-cn-shenzhen.aliyuncs.com"; string ...

    帝国CMS全站同步阿里云OSS和百度编辑器上传图片同步阿里云OSS支持粘贴上传图片

    本话题聚焦于将帝国CMS与阿里云OSS(Object Storage Service)的深度整合,以及如何实现百度编辑器与阿里云OSS的图片同步,尤其是支持直接粘贴上传图片的功能。 阿里云OSS是一项面向互联网的分布式存储服务,提供大...

Global site tag (gtag.js) - Google Analytics