`

sqoop导入数据脚本

阅读更多
sqoop export \
        -D mapred.job.queue.name=hive_user \
        --connect jdbc:mysql://${host}:${port}/${db} \
        --username ${username} \
        --password ${password} \
        --table ${table_name} \
        --export-dir ${hdfsdir}/dt=${dt}  \
        --update-key STUDENT_ID \
        --columns STUDENT_ID,STUDENT_NAME,ADDRESS,CREATE_DATETIME,UPDATE_DATETIME    \
        --update-mode allowinsert \
        -m 1 \
        --verbose \
        --fields-terminated-by '\t'

 

以上脚本实现了从Hive中往MySQL对于一张学生信息表的更新。

  1. 由于MySQL表里有自增列ID,而Hive中没有,所以需要在输入参数columns指定所有的列。
  2. 由于MySQL表里有唯一键,所以在输入参数update-key指定更新键名称STUDENT_ID
  3. Hive和MySQL列名类型和名称应当一致或者符合对应关系,比如Hive的timestamp对应datetime。
  4. 更新模式使用--update-mode allowinsert。默认为onlyupdate

 

0
0
分享到:
评论

相关推荐

    MySqoop_Sqoop脚本生成_sqoop脚本_

    Sqoop是一款用于在Apache Hadoop和关系型数据库之间进行数据导入导出的工具。它提供了命令行接口,允许用户方便地将数据导入到Hadoop的HDFS,或者从HDFS导出到关系型数据库。本篇文章将详细讲解 Sqoop 脚本生成的...

    sqoop的数据导入

    文件 "DataLoad" 可能包含导入数据的示例脚本或具体配置,通过分析这个文件,你可以更深入地了解 Sqoop 的使用方法和实际操作中的注意事项。在使用 Sqoop 进行数据导入时,应确保数据库和 Hadoop 集群的稳定运行,并...

    实战Sqoop数据导入及大数据用户行为案例分析

    实战Sqoop数据导入及大数据用户行为案例分析(全套视频+代码+工具+课件讲义) 内容包括: 01_CDH版本框架的介绍 02_CDH版本框架的环境部署 03_Sqoop的介绍及其实现原理 04_Sqoop的安装部署及连接测试 05_Sqoop将...

    星环大数据平台_Sqoop数据导入.pdf

    通常情况下,Sqoop命令包括导入数据到HDFS(sqoop import),从HDFS导出数据到关系数据库(sqoop export),以及在数据库之间转移数据(sqoop job)等。 总结来说,Sqoop在星环大数据平台中扮演着数据导入导出的...

    sqoop1.x 导入数据

    在给定的部分内容中,`import_data` 函数用于配置 Sqoop 导入数据的基本命令,主要包括以下几个方面: - **连接配置**:通过 `--connect jdbc:mysql://hadoop102:3306/gmall` 配置连接到 MySQL 数据库 `gmall`。 - ...

    bdp2hive:生成hive分区表、sqoop导入数据至hive

    生成sqoop脚本组件主要通过传递的数据库信息查询数据库获取表字段与数据集之间的对照关系SQL语句,通过模板拼接成sqoop脚本,上传服务器执行;hive分区表生成组件主要是通过获取数据集及数据集item的code,数据集...

    sqoop-javabean-sqoop脚本分隔符失效问题

    当从数据库导入数据时,用户可以指定字段分隔符(field-delimiter)以控制数据如何在HDFS文件中存储。默认情况下, Sqoop使用制表符(\t)作为字段分隔符,但你可以根据需要自定义。问题可能出在以下几个方面: 1. ...

    Sqoop将SQLServer数据表导入HDFS

    使用Sqoop命令导入数据 完成上述准备工作后,可以使用以下命令将SQL Server中的数据导入到HDFS指定目录: ```shell sqoop import --connect 'jdbc:sqlserver://192.168.4.155;username=sa;password=sa;database=pi...

    Sqoop数据搬运手册.docx

    ##### 1、MySQL 数据脚本 - **创建表**: ```sql CREATE TABLE `tb_user` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键 id', `user_name` varchar(100) DEFAULT NULL COMMENT '用户名', PRIMARY KEY...

    sqoop-1.4.7.zip

    Sqoop是Apache Hadoop生态中的一个工具,用于在关系型数据库和Hadoop之间高效地导入导出数据。在这个场景中,我们遇到了一个关于Sqoop运行时的问题,即"找不到或无法加载主类 org.apache.sqoop.sqoop"。这个问题通常...

    sqoop工具_202006041735481.docx

    例如,创建一个简单的sqoop导入脚本: ```bash #!/bin/bash sqoop import --connect jdbc:mysql://localhost:3306/dbname --username root --password passwd --table tab_name --target-dir /path/to/hdfs/...

    sqoop 1.4.4

    4. **数据转换**:在导入数据时,用户可以指定预定义的或自定义的MapReduce任务来进行数据转换,例如过滤、聚合、清洗等。 5. **数据导出**:除了导入,Sqoop也支持将Hadoop集群处理后的数据导回数据库,保持数据...

    sqoop-jar.zip

    - **元数据同步**: 当从数据库导入数据到Hadoop时,Sqoop并不自动处理数据库的元数据,这可能需要用户手动处理。 - **性能优化**: 可以通过设置并行度(--num-mappers)、分隔符、列名和列类型等参数来优化导入...

    sqoop-1.4.6.tar.gz

    1. **数据导入**:它允许用户从传统的 RDBMS 导入数据到 HDFS(Hadoop 分布式文件系统),这是大数据分析的第一步,因为许多企业已经拥有大量的结构化数据存储在 RDBMS 中。 2. **数据导出**:同样,Sqoop 也支持将...

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 26.深入Sqoop的导入(共29页).pptx

    其中,"深入Sqoop的导入"部分详细介绍了如何使用Sqoop这一工具从关系型数据库(RDBMS)高效地将数据导入到Hadoop分布式文件系统(HDFS)。 Sqoop的工作原理是通过一个MapReduce作业来执行数据迁移。首先,Sqoop客户端...

    sqoop1.4.7

    Sqoop是Apache Hadoop生态体系中的一个重要工具,主要用于在关系型数据库管理系统(RDBMS)与Hadoop Distributed File System(HDFS)之间高效地导入和导出数据。标题中的"sqoop1.4.7"指的是该版本的Sqoop,它是针对...

    sqoop-1.4.7.tar.gz.zip

    Sqoop 是一个开源工具,主要用于在关系型数据库(如 MySQL、Oracle 等)与 Hadoop 之间进行数据导入导出。在这个特定的文件“sqoop-1.4.7.tar.gz.zip”中,我们看到的是 Sqoop 1.4.7 版本的源码或二进制包。这个版本...

    sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.zip

    Sqoop 的主要功能是让大数据分析师和开发人员能够方便地导入和导出数据,它弥补了传统数据库与 Hadoop 生态系统之间的鸿沟。 Sqoop 的工作原理是通过 JDBC(Java Database Connectivity)连接到关系型数据库,将...

Global site tag (gtag.js) - Google Analytics