sqoop使用语句

liyonghui160com

浏览: 782546 次
性别:
来自: 北京

最近访客更多访客>>

lingxiajiudu

jerry830518

zhutiehan

liang3yibo

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

sqoop

sqoop使用语句

1、列出mysql数据库中的所有数据库

sqoop list-databases --connect jdbc:mysql://localhost:3306/ -username dyh -password 000000

2、连接mysql并列出数据库中的表

sqoop list-tables --connect jdbc:mysql://localhost:3306/test --username dyh --password 000000

3、将关系型数据的表结构复制到hive中

sqoop create-hive-table --connect jdbc:mysql://localhost:3306/test --table users --username dyh --password 000000 --hive-table users --fields-terminated-by "\0001" --lines-terminated-by "\n";

参数说明：

--fields-terminated-by "\0001" 是设置每列之间的分隔符，"\0001"是ASCII码中的1，它也是hive的默认行内分隔符，而sqoop的默认行内分隔符为"，"

--lines-terminated-by "\n" 设置的是每行之间的分隔符，此处为换行符，也是默认的分隔符；

注意：只是复制表的结构，表中的内容没有复制在默认创建hive表时，sqoop根据oracle的RAW类型无法找到对应的HIVE类型，所以报错。

    013-09-17 19:33:12,184 ERROR org.apache.sqoop.tool.ImportTool: Encountered IOException running import job: java.io.IOException: [color=darkred]Hive does not support the SQL type for column RAW_TYPE_ID[/color]  
      at rg.apache.sqoop.hive.TableDefWriter.getCreateTableStmt(TableDefWriter.java:195)  
            at org.apache.sqoop.hive.HiveImport.importTable(HiveImport.java:187)  
            at org.apache.sqoop.tool.ImportTool.importTable(ImportTool.java:425)  
            at org.apache.sqoop.tool.ImportTool.run(ImportTool.java:502)  
            at org.apache.sqoop.Sqoop.run(Sqoop.java:145)  
            at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)  
            at org.apache.sqoop.Sqoop.runSqoop(Sqoop.java:181)  
            at org.apache.sqoop.Sqoop.runTool(Sqoop.java:220)  
            at org.apache.sqoop.Sqoop.runTool(Sqoop.java:229)  
            at org.apache.sqoop.Sqoop.main(Sqoop.java:238)

解决方法为：
通过 --map-column-hive 自己提供列对应的类型
--map-column-hive RAW_TYPE_ID=STRING
这样就指定RAW_TYPE_ID对应的HIVE类型为STRING类型

4、将数据从关系数据库导入文件到hive表中

sqoop import --connect jdbc:mysql://localhost:3306/test --username dyh --password 000000 --table users --hive-import --hive-table users -m 2 --fields-terminated-by "\0001";

参数说明：

-m 2 表示由两个map作业执行；

--fields-terminated-by "\0001" 需同创建hive表时保持一致；

5、将hive中的表数据导入到mysql数据库表中

sqoop export --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --table users --export-dir /user/hive/warehouse/users/part-m-00000 --input-fields-terminated-by '\0001'

注意：

1、在进行导入之前，mysql中的表userst必须已经提起创建好了。

2、jdbc:mysql://192.168.20.118:3306/test中的IP地址改成localhost会报异常

6、将数据从关系数据库导入文件到hive表中，--query 语句使用

sqoop import --append --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --query "select id,age,name from userinfos where \$CONDITIONS" -m 1 --target-dir /user/hive/warehouse/userinfos2 --fields-terminated-by ",";

7、将数据从关系数据库导入文件到hive表中，--columns --where 语句使用

sqoop import --append --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --table userinfos --columns "id,age,name" --where "id > 3 and (age = 88 or age = 80)" -m 1 --target-dir /user/hive/warehouse/userinfos2 --fields-terminated-by ",";

注意：--target-dir /user/hive/warehouse/userinfos2 可以用 --hive-import --hive-table userinfos2 进行替换

分享到：

Hive的insert操作，导出数据到本地、hdfs | HBase Java Api详解

2014-10-13 15:47
浏览 1822
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论