`
qindongliang1922
  • 浏览: 2183197 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7265517b-f87e-3137-b62c-5c6e30e26109
证道Lucene4
浏览量:117506
097be4a0-491e-39c0-89ff-3456fadf8262
证道Hadoop
浏览量:125888
41c37529-f6d8-32e4-8563-3b42b2712a50
证道shell编程
浏览量:59878
43832365-bc15-3f5d-b3cd-c9161722a70c
ELK修真
浏览量:71283
社区版块
存档分类
最新评论

数据迁移工具sqoop入门

阅读更多
首先,先简单说明下sqoop是什么,sqoop 即 SQL to Hadoop ,是一款方便的在传统型数据库与Hadoop之间进行数据迁移的工具,充分利用MapReduce并行特点以批处理的方式加快数据传输,发展至今主要演化了二大版本,sqoop1和sqoop2。

那么为什么选择sqoop呢?

1,高效可控的利用资源,任务并行度,超时时间。

2,数据类型映射与转化,可自动进行,用户也可自定义

3,支持多种主流数据库,MySQL,Oracle,SQL Server,DB2等等


sqoop1和sqoop2对比的异同之处:

1,两个不同的版本,完全不兼容

2,版本号划分区别,Apache:1.4.x,1.99.x~

CDH:sqoop-1.4.3-cdh4,sqoop2-1.99.2-cdh4.5.0

3,sqoop2比sqoop1的改进
(1)引入sqoop server,集中化管理connector等

(2)多种访问方式:CLI,Web UI,REST API

(3) 引入基于角色 的安全机制



sqoop1与sqoop2的架构图如下:







sqoop1与sqoop2的优缺点如下:

sqoop1的架构,仅仅使用一个sqoop客户端,sqoop2的架构,引入了sqoop server集中化管理connector,以及rest api,web,UI,并引入权限安全机制。

sqoop1与sqoop2优缺点比较

sqoop1优点架构部署简单
sqoop1的缺点命令行方式容易出错,格式紧耦合,无法支持所有数据类型,安全机制不够完善,例如密码暴漏,
安装需要root权限,connector必须符合JDBC模型

sqoop2的优点多种交互方式,命令行,web UI,rest API,conncetor集中化管理,所有的链接安装在sqoop server上,完善权限管理机制,connector规范化,仅仅负责数据的读写。

sqoop2的缺点,架构稍复杂,配置部署更繁琐。



  • 大小: 60.6 KB
  • 大小: 58.8 KB
分享到:
评论
2 楼 shankses 2014-05-22  
langke93 写道
有没有sqoop2的安装文档,我按照官方文档操作下来,启动job后提示:Application application_1395624087676_0010 failed 2 times due to AM Container for appattempt_1395624087676_0010_000002 exited with exitCode: 1 due to: Exception from container-launch:
org.apache.hadoop.util.Shell$ExitCodeException:
at org.apache.hadoop.util.Shell.runCommand(Shell.java:464)

我也遇到了这个问题,请问这个问题解决了吗,谢谢
1 楼 langke93 2014-03-31  
有没有sqoop2的安装文档,我按照官方文档操作下来,启动job后提示:Application application_1395624087676_0010 failed 2 times due to AM Container for appattempt_1395624087676_0010_000002 exited with exitCode: 1 due to: Exception from container-launch:
org.apache.hadoop.util.Shell$ExitCodeException:
at org.apache.hadoop.util.Shell.runCommand(Shell.java:464)

相关推荐

    分布式数据库课程设计+基于Hbase的滴滴出行数据分析+Hive+Hadoop+Mysql+Sqoop+可视化

    2.2.3 Sqoop 数据迁移工具 Sqoop 是一个用来在 Hadoop 和传统数据库之间进行数据迁移的工具,它可以将数据导入到 Hadoop 的 HDFS 中,也可以将 Hadoop 中的数据导出到关系型数据库中。在滴滴出行项目中,Sqoop 负责...

    sqoop2-1.99.7 documentation 英文文档

    ### Sqoop2-1.99.7 文档概述 #### 一、Sqoop简介 Apache Sqoop 是一个工具,用于高效地在结构化、半结构化和非结构化数据源之间传输数据。...通过这些文档,用户可以更好地理解和使用 Sqoop 这一强大的数据迁移工具。

    Sqoop安装包、安装文档

    Sqoop是一款开源的数据导入工具,主要用于在Hadoop与传统关系型数据库之间进行数据迁移。它提供了从结构化数据存储(如MySQL、Oracle等)到Hadoop HDFS的高效传输,同时也支持从HDFS导出数据到数据库。Sqoop的设计...

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 40.Neo4j(共50页).pptx

    数据迁移工具Sqoop则用于将结构化数据在Hadoop与传统数据库间进行导入导出,Flume则用于高效地收集、聚合和移动大量日志数据。Kafka作为一个高吞吐量的分布式消息系统,常用于实时数据管道和流处理,课程简要介绍了...

    大数据云计算技术系列 Hadoop之Hbase从入门到精通(共243页).pdf

    Sqoop则提供了与关系型数据库(RDBMS)的桥梁,方便传统数据库数据迁移到HBase。 总的来说,HBase是大数据和云计算环境中解决大规模结构化数据存储和处理问题的重要工具。通过深入理解其技术原理和使用方法,开发者...

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 27.深入Sqoop导出(共19页).pptx

    5. **Sqoop**:Sqoop是用于在Hadoop和关系型数据库之间进行数据迁移的工具。课程详细讨论了Sqoop的导入和导出操作,包括数据交换的过程、JDBC的使用、导出架构以及如何处理事务和并发问题。 6. **Zookeeper**:...

    大数据研发工程十三期 培训视频.zip

    13-Sqoop数据迁移和Azkaban任务调度企业实战 14-离线数据仓库项目案例实践(一) 15-离线数据仓库项目案例实践(二) 16-离线数据仓库项目案例实践(三) 17-Spark的核心介绍和安装部署及基础入门 ......... 录播...

    HBase技术介绍简介 NOSQL数据库 入门

    - **Sqoop**:提供便捷的数据导入功能,使得从传统关系型数据库到HBase的数据迁移变得简单易行。 #### 访问接口 为了便于开发者和用户与HBase进行交互,HBase提供了多种访问接口: 1. **Native Java API**:这是...

    大数据精品文档-高质量-苦心收集

    而Sqoop则是一款用于在Hadoop和结构化数据存储(如关系数据库)之间进行数据迁移的工具,它支持大规模数据批量导入导出,提升了数据导入的效率。 "合理运用虚拟化技术构建Hadoop大数据平台.pdf"这部分内容可能涉及...

    hadoop入门学习文档

    - **Sqoop**:用于在 Hadoop 和关系型数据库之间传输数据的工具,简化了数据迁移过程。 - **Flume**:高效、可靠的服务,用于收集、聚合和移动大量日志数据。 #### 分布式系统概述 - **定义**:分布式系统是由一组...

    Hadoop学习文档.pdf

    Sqoop数据迁移工具 1. Sqoop的安装与综合案例:解释如何安装Sqoop,以及如何使用Sqoop进行数据库与HDFS之间的数据迁移。 HBase 1. HBase的安装与常用Shell命令:讲述HBase的安装过程和如何通过Shell命令行管理HBase...

    hadoop快速入门

    - Sqoop:数据导入导出工具,实现数据在不同存储系统之间的迁移。 - Flume:日志数据采集框架,收集和聚合来自不同源的日志数据。 #### 二、分布式系统基础 **2.1 分布式软件系统概念** - **定义**:分布式软件...

    Hbase从入门到精通

    - **Sqoop**:提供RDBMS数据导入功能,便于将传统数据库的数据迁移到HBase中。 #### 三、HBase访问接口 HBase提供了多种访问接口,包括但不限于: 1. **Native Java API**:最常用且高效的访问方式,适用于Hadoop...

    Big Data Made Easy (英文高清原版)

    数据迁移是一个关键环节,本书提供了使用Hadoop命令、Sqoop、Flume和Storm等工具在不同存储系统间移动数据的方法。其中,Sqoop用于将数据导入Hadoop系统,Flume用于收集和聚合数据流,而Storm是一个实时处理数据流的...

    Hadoop之Hbase从入门到精通.doc

    - **Sqoop**:为HBase提供了便捷的数据导入功能,方便将关系型数据库中的数据迁移到HBase中。 #### HBase 的访问接口 为了便于用户访问和操作HBase中的数据,HBase提供了多种访问接口: 1. **Native Java API**:...

    Hive编程指南+HIVE从入门到精通+Hive高级编程+Apache Oozie

    2. **数据加载与导出**: 使用LOAD DATA命令加载数据,使用EXPORT/IMPORT操作迁移数据。 3. **性能优化**: 通过分区、桶、压缩和选择合适的存储格式来优化查询性能。 4. **错误处理与调试**: 识别并解决查询中的常见...

Global site tag (gtag.js) - Google Analytics