`
guoyunsky
  • 浏览: 863368 次
  • 性别: Icon_minigender_1
  • 来自: 上海
博客专栏
3d3a22a0-f00f-3227-8d03-d2bbe672af75
Heritrix源码分析
浏览量:208023
Group-logo
SQL的MapReduce...
浏览量:0
社区版块
存档分类
最新评论

Sqoop源码分析(三) Sqoop各种命令和参数

阅读更多

         欢迎加入Hadoop超级群: 180941958

         Sqoop有较多的命令和参数,我这里从实践和源码的角度将他们一一整理出来,这里Sqoop版本是1.3

        Sqoop大约有13种命令,和几种通用的参数(都支持这13种命令).这里先列出这13种命令.

 

序号 命令/command 说明
1 impor ImportTool 从关系型数据库中导入数据(来自表或者查询语句)到HDFS中
2 export ExportTool 将HDFS中的数据导入到关系型数据库中
3 codegen CodeGenTool 获取数据库中某张表数据生成Java并打成jar包
4 create-hive-table CreateHiveTableTool

创建Hive表

5 eval EvalSqlTool 查看SQL执行结果
6 import-all-tables ImportAllTablesTool 导入某个数据库下所有表到HDFS中
7 job JobTool  
8 list-databases ListDatabasesTool 列出所有数据库名
9 list-tables ListTablesTool 列出某个数据库下所有表
10 merge MergeTool  
11 metastore MetastoreTool  
12 help HelpTool 查看帮助
13 version VersionTool 查看版本

 

        接着列出Sqoop的各种通用参数,然后针对以上13个命令列出他们自己的参数.Sqoop通用参数又分Common arguments,Incremental import arguments,Output line formatting arguments,Input parsing arguments,Hive arguments,HBase arguments,Generic Hadoop command-line arguments,下面一一说明:

       1.Common arguments

           通用参数,主要是针对关系型数据库链接的一些参数

 

序号 参数 说明 样例
1 connect 连接关系型数据库的URL jdbc:mysql://localhost/sqoop_datas
2 connection-manager 连接管理类,一般不用  
3 driver 连接驱动  
4 hadoop-home  hadoop目录 /home/guoyun/hadoop
5 help 查看帮助信息  
6 password 连接关系型数据库的密码  
7 username 链接关系型数据库的用户名  
8 verbose 查看更多的信息,其实是将日志级别调低 该参数后面不接值

 

 更多技术文章、感悟、分享、勾搭,请用微信扫描:

2
2
分享到:
评论
2 楼 zzw0309452 2012-07-12  
你知道  --parameters 这个参数什么用处吗?
1 楼 hibernate159 2012-03-06  
请问,sqoop能否导入到hive二级分区中

相关推荐

    sqoop-1.4.7.tar.gz.zip

    通过正确地配置和使用 Sqoop,可以高效地在 Hadoop 和 RDBMS 之间移动大量数据,满足数据分析和业务需求。在这个“sqoop-1.4.7.tar.gz.zip”文件中,你将获得 Sqoop 的全部组件,可以进一步学习、安装和使用这个工具...

    sqoop-1.4.5

    总的来说,Sqoop-1.4.5为Hadoop 2.x环境提供了强大而灵活的数据迁移能力,使得数据科学家和数据工程师能够无缝地在传统数据库和Hadoop之间迁移数据,实现大数据分析和处理。正确配置和使用Sqoop,能够有效地提升数据...

    sqoop-javabean-sqoop脚本分隔符失效问题

    1. **命令行参数设置**:确保你在运行Sqoop命令时正确指定了`--fields-terminated-by`选项。例如,如果希望使用逗号(,)作为分隔符,你应该执行`sqoop export --fields-terminated-by ',' ...`。如果这个参数没有被...

    sqoop导入数据到hive中,数据不一致

    在导入前,应确保源数据的格式与Hive可以接受的格式一致,或者在Sqoop命令中指定转换规则。 4. 分区问题:如果Hive表是分区表,而Sqoop导入时未正确处理分区,可能会导致数据分布不均或者丢失部分数据。确保在导入...

    电商数仓项目(九) Sqoop安装与配置

    在大数据处理领域,Sqoop是一款用于在...在电商数仓项目中,掌握 Sqoop 的安装和配置是数据分析流程的关键环节,它使得数据仓库可以灵活地与外部数据源交互,实现数据的实时更新和集成,为业务分析提供强大的支持。

    hive分区导入

    【标题】:“Hive分区导入”是大数据处理中常见的操作,它涉及到Hadoop生态...7. 数据导入的最佳实践,包括分区策略和 Sqoop 的参数调整。 了解这些内容,可以有效提高Hive数据导入的效率,同时便于管理和分析大数据。

    数据分析.rar_Linux/Unix编程_LINUX_

    通过分析这些源码,可以深入学习如何在实际项目中应用Linux/Unix编程技巧和大数据工具。 总之,这个压缩包提供的学习资料涵盖了Linux/Unix环境下的编程基础,大数据处理工具Hive的使用,以及如何利用Sqoop在Hadoop...

    Hadoop配置文档

    如Hadoop命令行工具(如`hadoop fs`命令用于操作HDFS),HBase(一个分布式的、面向列的数据库),Hive(基于Hadoop的数据仓库工具),Pig(高级数据分析语言),以及Sqoop(用于在Hadoop和传统数据库间导入导出数据...

Global site tag (gtag.js) - Google Analytics