`

开放数据处理服务ODPS

    博客分类:
  • ODPS
阅读更多
操作手册下载
http://help.aliyun.com/view/11108327_13494938.html

快速操作手册

1,请登录 aliyun.com 官网 后在 “产 品服 务” 中选 择 “数据 处理 服务 ODPS”输入邀请码即可开通,更多的操作请在odpscmd中进行(类似mysql和oracle的客户端)
2,通过客户端管理使用 ODPS(请下载最新的客 户端),类似mysql的客户端程序, ODPS 客户端是一个 ODPS 程序,需要 JRE 环境才能运行,请下载并安装 JRE 1.6 以上版本。

下载ODPS的客户端

wget http://imgs-storage.cdn.aliyuncs.com/help/odps/odps-console.tar.gz



上传到某台本地服务器(支持linux和windows,建议最好使用linux服务器),并解压
2.1,tar zxvf odps-console.tar.gz
2.2,把Project名 称、相关云账号的accessId 和 accessKey的 值配置到clt的conf/odps_config.ini中, 如下:

project_name=xxxx
access_id=******
access_key=******
end_point=http://service.odps.aliyun.com/api  (注意:去掉"-inc”)


如何获得ID和key:
登陆www.aliyun.com  进入“我的阿里云”-->用户中心-->我的服务-->安全认证
或者登陆后直接访问:http://i.aliyun.com /access_key?spm=5176.7034181.0.0.vhx8wP

3,配置数据上传通道
plugins/tunnel/plugin.ini

command=com.aliyun.openservices.odps.console.tunnel.TunnelCommand

endpoint=http://dt.odps.aliyun.com(如果是阿里云的服务器,可以使用内网的endpoint=http://dt- ext.odps.aliyun-inc.com)
col.delimiter=44(分隔符的asc码,你可以使用其他的分隔符) 
row.delimiter=10 null.indicator=NULL
date.format=yyyyMMddHHmmss


说明:
endpoint=http://dt.odps.aliyun.com  :指定tunnel的endpoint 
col.delimiter=44             : 指定列分隔符,默认为44 "," 
row.delimiter=10             : 指定列分隔符,默认为10 "\n" 
null.indicator=NULL          : 指定空字符串,默认为空串。如果指定空值,可以把 此行删除掉 
date.format=yyyyMMddHHmmss   : 指定日期的format格式,默认为yyyyMMddHHmmss  
bad.discard=false            :指定脏数据是还丢弃,默认为false[目前只支持多列、少列是否忽略]


4,登陆ODPS
bin/odpscmd

执行help查看命令

5,上传和下载数据
上传: upload <tablename> [partition(spec)] from <filepath>;  如:upload pt_test partition(ds=nnnn,pt=2345) from data/pt1.txt;
下载:download <tablename> [partition(spec)] to <filepath>;


按照分区上传和下载数据
建表和partition 
create table tunnel_test (s string, i int, d datetime) partitioned by(ds string, pt string); 
alter table  tunnel_test add  partition(ds='d1',pt='p1'); 


编辑上传文件,如:
s1,11,20130910010101 
s2,22,20130911010101 
s3,33,20120911010101 

上传文件
upload tunnel_test partition (ds='d1',pt='p1') from data/upfile; 

下载文件
download tunnel_test partition (ds='d1',pt='p1') to data/downfile; 


也可使用SDK来上传数据。SDK的下载地址:
http://imgs-storage.cdn.aliyuncs.com/help/odps/odps_tunnel_ODPS_sdk.tar.gz



祝你好运!!
1
2
分享到:
评论

相关推荐

    阿里开放数据处理服务ODPS介绍.pptx

    "阿里开放数据处理服务ODPS介绍" 阿里开放数据处理服务ODPS是一款基于云计算的数据处理和分析平台,旨在帮助企业解决大数据处理和分析的问题。ODPS提供了一站式的数据处理和分析服务,使用户可以快速构建大数据应用...

    阿里巴巴开放数据处理服务odps

    开放数据处理服务(Open Data Processing Service,ODPS)是基于飞天分布式系统构建的海 量数据处理和分析的服务平台,具有 PB 级别的数据处理能力, 主要适用于实时性要求不高 的海量数据处理,如数据分析、海量数据...

    阿里巴巴大数据与云计算技术分享 阿里云ODPS云计算产品介绍简介 阿里云开放数据处理服务ODPS介绍 共33页.pptx

    阿里云开放数据处理服务(Open Data Processing Service,简称ODPS) 是构建在飞 天系统上的大规模分布式数据处理服务。 ODPS以REST API的形式,支持用户提交 类SQL的查询语言,对海量数据进行处理。 在API之上,还...

    阿里云-开放搜索服务产品简介-D.docx

    此外,OpenSearch支持与阿里云的开放存储服务OSS、开放数据处理服务ODPS和关系型数据库服务RDS等主流存储产品无缝对接,实现数据的自动同步,确保数据实时性。对于不在阿里云存储上的数据,用户可以通过RESTful API...

    云计算第三版精品课程配套PPT课件含习题(34页)第11章 中国云计算第三版技术(四).pptx

    11.5.5 开放数据处理服务ODPS: ODPS提供了大数据处理能力,适合进行大规模数据处理和分析任务。 11.5.6 关系型数据库RDS: 阿里云的RDS服务提供了稳定、高效的关系型数据库服务,支持多种数据库引擎,满足企业对...

    阿里云大数据应用实践 .pptx

    - 提供弹性计算服务ECS、关系型数据库服务RDS、开放存储服务OSS、开放结构化数据服务OTS和开放数据处理服务ODPS等服务。 - ODPS支持大规模数据处理,如万亿级数据JOIN和单次处理上百TB数据的能力,具有丰富的编程...

    阿里云计算与大数据.pptx

    大数据管理平台关系型数据库D/RDS分析型数据库ADS开放数据处理服务ODPS流数据计算GALAXY开放存储OSS开放结构化数据库OTS彩云间(数据开发)DPC计算网络存储安全物理环境数据组织数据分析 / 挖掘数据展现地理信息系统...

    阿里云计算与大数据V1.pptx

    评估重大安全漏洞或隐患云监控指标监控与报警服务开放数据处理服务 ODPS针对 TB/PB 级数据的分布式处理服务 , 彻底解决大数据存储与运算瓶颈开源大数据软件服务 ( 规划 )Spark/Hadoop/…分析数据库服务 ADS海量数据...

    大数据技术 ODPS MapReduce对外开放实践 共20页.pptx

    总的来说,ODPS MapReduce是大数据处理领域的一个强大工具,它的开放实践不仅展示了其在大规模数据处理中的能力,也为开发者提供了丰富的工具和接口,促进了大数据应用的创新与发展。随着技术的不断进步,我们期待...

    阿里云E-MapReduce-产品简介.pdf

    3. **深度整合**:E-MapReduce与阿里云的其他服务如对象存储OSS、消息服务ONS、关系型数据库RDS、开放数据处理服务ODPS等紧密集成,使得数据能够在不同服务之间便捷地导入导出,扩展了数据分析的范围和灵活性。...

    odps操作手册

    开放数据处理服务(ODPS)是由阿里巴巴集团研发的一种大数据处理与分析平台,基于飞天内核构建,旨在提供PB级别的数据处理能力。ODPS通过RESTful API接口对外提供服务,使得开发者能够方便地进行大规模数据的存储、...

    odps-jdbc-3.2.9-jar-with-dependencies.jar

    odps-jdbc-3.2.9-jar-with-dependencies.jar 是阿里云 MaxCompute(开放数据处理服务,ODPS)平台的 JDBC 驱动程序,专为大数据处理和分析而设计。此版本的驱动程序包含所有必要的依赖库,简化了开发人员在 Java ...

    datahub_test_001_odps_datahub_IDEAL_datahub和odps_

    首先,ODPS(开放数据处理服务)是阿里云推出的一种大数据处理平台,它提供了海量数据的存储和计算能力,支持SQL查询以及MapReduce等计算框架。ODPS主要适用于离线数据分析,如日志分析、报表生成等场景,具备高扩展...

    少杰 (徐东):ODPS MapReduce对外开放实践

    整体而言,ODPS MapReduce的对外开放实践不仅体现了阿里巴巴在大数据处理领域技术积累和创新,也代表了大数据时代对底层数据处理平台的需求和发展趋势。通过提供稳定、安全、高效的MapReduce服务,ODPS MapReduce已...

    ODPS资料大全

    8. **高可用性**:ODPS服务具有高可用性,即使在大规模数据处理时也能保证服务的稳定性和数据的完整性。 9. **弹性扩展**:根据业务需求,ODPS可以灵活地扩展计算和存储资源,适应业务的快速增长。 10. **开放生态...

    阿里云odps机器学习平台手册1

    - **ODPS**:开放数据处理服务,阿里云的分布式数据处理工具,用于大规模数据的批处理分析。 - **项目(Project)**:ODPS的基本组织单元,包含表(Table)、实例(Instance)等对象。 - **实验(Experiment)**:PAI...

    aliyun-odps-jdbc-3.2.29

    aliyun-odps-jdbc-3.2.29jar包 是阿里云为其大数据平台 MaxCompute(也称为 ODPS:开放数据处理服务)提供的 JDBC 驱动程序。通过该驱动,开发者可以在 Java 应用程序中使用标准的 JDBC API 与 MaxCompute 平台进行...

    ODPS MapReduce 实现和开放实践.zip

    ODPS(Open Data Processing Service)是阿里云推出的一种大规模数据处理服务,它提供了一种基于Hadoop MapReduce的计算框架,使得用户可以在云端进行大规模的数据分析。本实践主要围绕ODPS MapReduce的实现原理和...

    解析阿里云大数据服务——ODPS

    基于飞天的ODPS,对内是阿里集团30多个事业部唯一的大数据处理平台;对外,以RESTfulAPI对外提供数据仓库、数据挖掘和其他数据应用服务。阿里云总裁王文彬为之站场,称其为“中国进入大数据时代的里程碑”。阿里云有...

Global site tag (gtag.js) - Google Analytics