hive中使用标准sql实现分组内排序

superlxw1234

浏览: 555274 次
性别:
来自: 西安

最近访客更多访客>>

huageng520

rattersnake

yuanyuan7891

ticojj

博主相关

博客

微博

相册

留言

关于我

博客专栏

: Hive入门
浏览量：44960

文章分类

社区版块

存档分类

博客分类：

hive

hive 序列 row_number

在hive中，想要实现分组内排序，一般都是自己写udf实现oracle中分析函数row_number() over(partition)的功能，如果不使用自定义udf,仅使用标准sql实现的话，毫无性能可言，仅做实验而已。

方便起见，以下语句为oracle中语句，但都属于标准sql,在hive中亦可：

CREATE TABLE lxw_t (user_id VARCHAR2(20),
class VARCHAR2(20),
score NUMBER 
);

INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','语文','90');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','数学','86');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','英语','96');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','体育','77');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','语文','88');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','数学','65');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','英语','67');
INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','体育','98');


commit;

SELECT x.user_id,x.class,x.score,COUNT(1) AS seq 
FROM (
  SELECT a.*,b.score score2 FROM 
  liuxiaowen.lxw_t a ,
  liuxiaowen.lxw_t b 
  WHERE a.user_id = b.user_id (+) 
) x 
WHERE x.score2 >= x.score --按照成绩由高到低排列
--WHERE x.score >= x.score2  --按照成绩由低到高排列
GROUP BY x.user_id,x.class,x.score 
order BY 1,4

按照成绩由高到低排列的结果如下：

USER_ID	CLASS	SCORE	SEQ
user_1	英语	96	1
user_1	语文	90	2
user_1	数学	86	3
user_1	体育	77	4
user_2	体育	98	1
user_2	语文	88	2
user_2	英语	67	3
user_2	数学	65	4

按照成绩由低到高排列的结果如下：

USER_ID	CLASS	SCORE	SEQ
user_1	体育	77	1
user_1	数学	86	2
user_1	语文	90	3
user_1	英语	96	4
user_2	数学	65	1
user_2	英语	67	2
user_2	语文	88	3
user_2	体育	98	4

0
顶

4
踩

分享到：

MapReduce读取HDFS,将结果写入MongoDB | 利用Redis的有序集合做购物车商品相关性 ...

2013-05-15 10:22
浏览 4460
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

hive中使用标准sql实现分组内排序

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

hive中使用标准sql实现分组内排序

评论

发表评论

相关推荐

[一起学Hive]之十七-从Hive表中进行数据抽样-Sampling

[一起学Hive]之十六-Hive的WEB页面接口-HWI

[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics)

一起学Hive系列文章

MapReduce和Hive支持递归子目录作为输入

[一起学Hive]之十四-Hive的元数据表结构详解

[一起学Hive]之十三-Hive整合HBase，操作HBase表

[一起学Hive]之十二-Hive SQL的优化

[一起学Hive]之十一-Hive中Join的类型和用法

[一起学Hive]之十-Hive中Join的原理和机制

[一起学Hive]之九-Hive的查询语句SELECT

Spark1.4.0-SparkSQL与Hive整合-支持窗口分析函数

[一起学Hive]之八-使用Hive命令行

[一起学Hive]之六-Hive的动态分区

[一起学Hive]之七-向Hive表中加载数据

[一起学Hive]之五-Hive的视图和分区

[一起学Hive]之四-Hive的安装配置

[一起学Hive]之三—Hive中的数据库(Database)和表(Table)

[一起学Hive]之二—Hive函数大全-完整版

[一起学Hive]—Hive函数大全-part2

最近访客更多访客>>