`
tobyqiu
  • 浏览: 40209 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

sqoop 1.4.4 使用1

 
阅读更多

1.修改配置   /home/sqoop-1.4.4/conf/sqoop-env.sh

export HADOOP_COMMON_HOME=/home/hadoop-2.3.0
export HADOOP_MAPRED_HOME=/home/hadoop-2.3.0
#export HBASE_HOME=/usr/local/hbase
export HIVE_HOME=/home/hive-0.10.0
#export ZOOCFGDIR=/usr/local/zookeeper

 2.加入配置 /etc/profile

export JAVA_HOME=/lib/jdk1.6.0_30
export HADOOP_HOME=/home/hadoop-2.3.0
export HIVE_HOME=/home/hive-0.10.0
export ANT_HOME=/lib/apache-ant-1.9.0
export SQOOP_HOME=/home/sqoop-1.4.4
export HADOOP_MAPRED_HOME=${HADOOP_HOME}
export HADOOP_COMMON_HOME=${HADOOP_HOME}
export PATH=$JAVA_HOME/bin:$ANT_HOME/bin:$HADOOP_HOME/bin:$SQOOP_HOME/bin:$HIVE_HOME/bin:$PATH 

 3.测试下 sqoop version

[root@localhost ~]# sqoop version
Sqoop 1.4.4
git commit id 050a2015514533bc25f3134a33401470ee9353ad
Compiled by vasanthkumar on Mon Jul 22 20:06:06 IST 2013

 4.测试导入HDFS 

 先写一个文件 /home/mysql.txt

import 
--connect 
jdbc:mysql://prchaz02823:3306/adventureworksdw2008r2 
--username 
root   
--password  
root 
--table  
DimDate2  
--null-string 
'\\N' 
--null-non-string 
'\\N'
#--map-column-java 
#FullDateAlternateKey=DATE
--split-by  
DateKey 
--target-dir 
/home/dimdate_txt
--hive-import 
--hive-table 
adventureworksdw.dimdate2   
--map-column-hive
FullDateAlternateKey=timestamp
--hive-overwrite 
#--direct 

  一个命令必须2行 一行是参数 一行是值 ,#是注释掉的  这个东西本质就是个属性文件.

  我写的是直接导入hive ,hive虽然支持timestamp,但是如果不写map column hive 会默认把列变成了String,所以 overwrite了 column type mapping

--map-column-hive
FullDateAlternateKey=timestamp

 这个地方有点BUG. 最好是全部小写,因为 FullDateAlternateKey 是有大小写的,指向的是Source column(mysql的列) 不是hive的column name. 如果写成了hive的column 会报 找不到列的错误.

 

 别的参数具体什么意思,去查看doc 就知道了http://sqoop.apache.org/docs/1.4.4/SqoopUserGuide.html

 

 5.运行就开始跑了 

sqoop --options-file /home/mysql.txt 

 

 备注下, 我这里是全表导入的,而去表是有主键的,默认是用主键做为split-by  ,如果没有主键的表这么写是报错的,需要指定   --split-by  

 

分享到:
评论

相关推荐

    sqoop 1.4.4

    1. **命令行接口**:Sqoop提供了丰富的命令行选项,允许用户执行数据导入、导出以及数据转换任务。用户可以通过简单的命令行参数来指定源数据库、表名、导入类型(全量或增量)、字段映射等。 2. **连接器**:Sqoop...

    sqoop-1.4.4-cdh5.0.6.tar

    1. **Sqoop 的核心功能**: - 数据导入:Sqoop 可以自动创建 MapReduce 任务,将数据库表的数据分片并并行导入到 HDFS 中,提高了数据导入的效率。 - 数据导出:同样地,Sqoop 也能将 HDFS 或 Hive 中的数据导回...

    Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册(All)_ZCX

    叶梓老师整理的Hadoop2.2.0+Hbase0.98.4+sqoop-1.4.4+hive-0.98.1安装手册,非常实用

    sqoop资源 sqoop-1.4.4.bin-hadoop-2.0.4- gz文件

    sqoop资源 sqoop-1.4.4.bin__hadoop-2.0.4- gz文件

    sqoop-1.4.4-cdh5.1.0.tar

    sqoop-1.4.4-cdh5.1.0.tar

    zookeeper3.4.12+hbase1.4.4+sqoop1.4.7+kafka2.10

    在构建大数据处理环境时,Hadoop集群是核心基础,而`zookeeper3.4.12+hbase1.4.4+sqoop1.4.7+kafka2.10`这一组合则提供了集群中不可或缺的组件。让我们逐一探讨这些组件的功能、作用以及它们之间的协同工作。 **...

    sqoop-1.4.6-cdh5.5.0.tar.gz

    1. 数据导入:Sqoop 可以从 RDBMS 导入数据到 HDFS,支持全量导入和增量导入。增量导入允许用户仅导入自上次导入以来发生更改的数据,减少了不必要的数据传输。 2. 数据导出:与导入相反,Sqoop 还能将 HDFS 中的...

    第9章 Sqoop组件安装配置.docx

    在 Master 节点上使用 root 用户将 Sqoop 安装包解压到 /usr/local/src 目录下。 `[root@master ~]# cd /usr/local/src/` `[root@master src]# mv ./sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz .` ### 1.4.2. 实验任务...

    sqoop安装手册

    在这个例子中,使用的版本是 sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz。你可以通过 SCP 命令将安装包上传到服务器,并使用 SSH 登录到服务器进行解压。解压后,为了方便管理,通常会重命名目录,例如这里将其...

    sqoop 从 hive 导到mysql遇到的问题.docx

    1. Sqoop 的基本概念 Sqoop 的核心概念是将数据从一个数据源(如 MySQL)传输到另一个数据源(如 Hive),或者从 Hive 导出数据到 MySQL 等关系数据库管理系统。Sqoop 使用 JDBC 连接器来连接不同类型的数据库,...

    Hadoop2.2.0Hbase0.98.1Hive0.13完全安装手册

    ### Hadoop2.2.0 + HBase0.98.1 + Sqoop1.4.4 + Hive0.13 完全安装手册 #### 前言 随着大数据技术的发展,Hadoop已经成为处理海量数据的核心框架之一。本文旨在为读者提供一套最新的Hadoop2.2.0、HBase0.98.1、...

    hadoop生态系统搭建

    软件版本列表包括了搭建Hadoop生态系统所需的关键组件版本,例如JDK 1.7.0_67、MySQL 5.1、Hadoop 2.3.0、HBase 0.96、Hive 0.12、SolrCloud 4.4、Storm 0.92、Kafka 2.8.0、Flume-ng 1.4.0、Sqoop 1.4.4等。...

    sqoop-server:정대학생정정가이드

    Sqoop服务器 :male_sign: 个人资料이름오승재임찬기 역할 리드 개발자 Github :gear: 依赖模块 " dependencies " : { " aws-sdk " : " ^2.817.0 " , " clean-css " : " ~4.1.11 " , " constantinople " : " ~3.1.1 ...

    Hadoop权威指南 第二版(中文版)

    第1章 初识Hadoop  数据!数据!  数据存储与分析  与其他系统相比  关系型数据库管理系统  网格计算  志愿计算  1.3.4 Hadoop 发展简史  Apache Hadoop和Hadoop生态圈 第2章 关于MapReduce  一个气象数据...

    Hadoop权威指南(中文版)2015上传.rar

    第1章 初识Hadoop 数据!数据! 数据存储与分析 与其他系统相比 关系型数据库管理系统 网格计算 志愿计算 1.3.4 Hadoop 发展简史 Apache Hadoop和Hadoop生态圈 第2章 关于MapReduce 一个气象数据集 数据的格式 使用...

Global site tag (gtag.js) - Google Analytics