Hive分享教程2-Hive语法

yugouai

浏览: 499592 次
性别:
来自: 深圳

最近访客更多访客>>

淡定情绪

spaceandroid

fengbin2005

hundun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Hive分享

    Hive的语法与SQL相似，细看例子

    creating tables

    CREATE TABLE tmp_table #表名
    {
     title string , #字段名 字段类型
     minimun_bid double,
     quantity bigint,
     have_invoice bigint
    }COMMENT 'XXX' #表注解
    PARTITIONED BY(pt STRINT) #分区表字段（文件大则采用分区）
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY '\001' #字段分割
    STORED AS SEQUENCEFILE; #采用那种存储方式存储数据  SEQUENCEFILE是hadoop自带的文件压缩格式

一些常用的命令
SHOW TABLES; #查看所有的表
SHOW TALBES '*TMP*' #支持模糊查询
SHOW PARTITIONS TABLE; #查看表有哪些分区
DESCRIBE TABLE; #查看表结构

例子：

  CREATE TABLE page_view(viewTime INT, userid BIGINT,
                    page_url STRING, referrer_url STRING,
                    ip STRING COMMENT 'IP Address of the User')
    COMMENT 'This is the page view table'
    ROW FORMT DELIMITED FIELDS TERMINATED BY '44' LINES TERMINATED BY '12'
    STORED AS TEXTFILE
    LOCATION '/user/data/staging/page_view';
    
    hadoop dfs -put /tmp/pv_2008-06-08.txt /user/data/staging/page_view

    FROM page_view_stg pvs
    INSERT OVERWRITE TABLE page_view PARTITION(dt='2008-06-08', country='US')
    SELECT pvs.viewTime, pvs.userid, pvs.page_url, pvs.referrer_url, null, null, pvs.ip
    WHERE pvs.country = 'US';

另外，HDFS不支持UPDATE！

用户可以用ALTER TABLE ADD PARTITION 来向一个表中增加分区
当分区名是字符串串时加引号

  ALTER TABLE page_view ADD PARTITION(dt='2008-08-08',country='us') location 'path/to/us/part080808'
  PARTITION(dt='2008-08-09',country='us') location 'path/to/us/part080809'

loading files into table
当数据被加载至表中时，不会对数据进行任何转换。Load操作知识将数据复制/移动至Hive表对应的位置。
Syntax:
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION(partcol1=val1,partcol2=val2 ...)]
即，普通的insert只不过数据来源是通过inpath路径找到，insert之前保证表已经建立完，并且格式一致（换行、分隔符等）

分享到：

hive中简单介绍分区表(partition table)， ... | Hive分享教程1-Hive简介

2012-07-03 13:09
浏览 2695
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论