`
yugouai
  • 浏览: 505760 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Hive分享教程1-Hive简介

 
阅读更多
    HIVE是一个SQL解释引擎,它将SQL语句转译成M/R JOB,然后在Hadoop执行,来达到快速开发的目的。Hive的表其实就是一个Hadoop的目录/文件(HIVE默认表存放路径一般是工作目录的Hive目录里面),按表名做文件夹分开,如果有分区表,分区值都是子文件夹,可以直接在其他的M/R JOB里面直接应用这部分数据。
   
    Hive的特点有一下几点:
      1.为超大数据集设计的计算/拓展能力-based on Hadoop
      2.支持SQL like查询语言
      3.统一的元数据管理
    Hive与SQL类似,使用的语句区别不大,如:
   
    select word,count(*) from(select expolde(split(sentence,' '))) word from article) t group by word;
    


    Hive的数据类型有以下分类:
    原始类型:int/bigint/smallint/tinyint/boolean/double/float/string
    数组类型:Array
    映射:Map
    结构:Struct
    备注:原始类型长度跟平常的大小无异,其中HiveQL没有date/datetime类型
  
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics