Oracle中rank() over, dense_rank(), row_number() 的区别 -

tooby

浏览: 121084 次
性别:
来自: 广州

最近访客更多访客>>

Java_love_88

bigstar119

Deo

sahala79

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Oracle中rank() over, dense_rank(), row_number() 的区别

博客分类：

Oracle

假设现在有一张学生表student，学生表中有姓名、分数、课程编号，现在我需要按照课程对学生的成绩进行排序。

select * from student

1. rank over ()可以实现对学生排名，特点是成绩相同的两名是并列，如下1 2 2 4 5

select name,
course,
rank() over(partition by course order by score desc) as rank
from student;

2. dense_rank()和rank over()很像，但学生成绩并列后并不会空出并列所占的名次，如下1 2 2 3 4

select name,
course,
dense_rank() over(partition by course order by score desc) as rank
from student;

3. row_number这个函数不需要考虑是否并列，那怕根据条件查询出来的数值相同也会进行连续排名

select name,
course,
row_number() over(partition by course order by score desc) as rank
from student;

答疑：

1. partition by用于给结果集进行分区。

2. partition by和group by有何区别？

partition by只是将原始数据进行名次排列(记录数不变)

group by是对原始数据进行聚合统计(记录数可能变少, 每组返回一条)

3. 使用rank over()的时候，空值是最大的，如果排序字段为null, 可能造成null字段排在最前面，影响排序结果。

可以这样： rank over(partition by course order by score desc nulls last)

为了方便大家学习和测试，所有的例子都是在Oracle自带用户Scott下建立的。

注：标题中的红色order by是说明在使用该方法的时候必须要带上order by。

一、rank()/dense_rank() over(partition by ...order by ...)

现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句：

 
select e.ename, e.job, e.sal, e.deptno  
  from scott.emp e,  
       (select e.deptno, max(e.sal) sal from scott.emp e group by e.deptno) me  
 where e.deptno = me.deptno  
   and e.sal = me.sal;  

在满足客户需求的同时，大家应该习惯性的思考一下是否还有别的方法。这个是肯定的，就是使用本小节标题中rank() over(partition by...)或dense_rank() over(partition by...)语法，SQL分别如下：

 
select e.ename, e.job, e.sal, e.deptno  
  from (select e.ename,  
               e.job,  
               e.sal,  
               e.deptno,  
               rank() over(partition by e.deptno order by e.sal desc) rank  
          from scott.emp e) e  
 where e.rank = 1;  

[sql]view plaincopy 
select e.ename, e.job, e.sal, e.deptno  
  from (select e.ename,  
               e.job,  
               e.sal,  
               e.deptno,  
               dense_rank() over(partition by e.deptno order by e.sal desc) rank  
          from scott.emp e) e  
 where e.rank = 1;  

为什么会得出跟上面的语句一样的结果呢？这里补充讲解一下rank()/dense_rank() over(partition by e.deptno order by e.sal desc)语法。
over:  在什么条件之上。
partition by e.deptno:  按部门编号划分（分区）。
order by e.sal desc:  按工资从高到低排序（使用rank()/dense_rank() 时，必须要带order by否则非法）
rank()/dense_rank():  分级
整个语句的意思就是：在按部门划分的基础上，按工资从高到低对雇员进行分级，“级别”由从小到大的数字表示（最小值一定为1）。

那么rank()和dense_rank()有什么区别呢？
rank(): 跳跃排序，如果有两个第一级时，接下来就是第三级。
dense_rank(): 连续排序，如果有两个第一级时，接下来仍然是第二级。

小作业：查询部门最低工资的雇员信息。

二、min()/max() over(partition by ...)

现在我们已经查询得到了部门最高/最低工资，客户需求又来了，查询雇员信息的同时算出雇员工资与部门最高/最低工资的差额。这个还是比较简单，在第一节的groupby语句的基础上进行修改如下：

 
select e.ename,  
         e.job,  
         e.sal,  
         e.deptno,  
         e.sal - me.min_sal diff_min_sal,  
         me.max_sal - e.sal diff_max_sal  
    from scott.emp e,  
         (select e.deptno, min(e.sal) min_sal, max(e.sal) max_sal  
            from scott.emp e  
           group by e.deptno) me  
   where e.deptno = me.deptno  
   order by e.deptno, e.sal;  

上面我们用到了min()和max()，前者求最小值，后者求最大值。如果这两个方法配合over(partition by ...)使用会是什么效果呢？大家看看下面的SQL语句：

 
select e.ename,  
       e.job,  
       e.sal,  
       e.deptno,  
       nvl(e.sal - min(e.sal) over(partition by e.deptno), 0) diff_min_sal,  
       nvl(max(e.sal) over(partition by e.deptno) - e.sal, 0) diff_max_sal  
  from scott.emp e;  

这两个语句的查询结果是一样的，大家可以看到min()和max()实际上求的还是最小值和最大值，只不过是在partition by分区基础上的。

小作业：如果在本例中加上order by，会得到什么结果呢？

三、lead()/lag() over(partition by ... order by ...)

中国人爱攀比，好面子，闻名世界。客户更是好这一口，在和最高/最低工资比较完之后还觉得不过瘾，这次就提出了一个比较变态的需求，计算个人工资与比自己高一位/低一位工资的差额。这个需求确实让我很是为难，在groupby语句中不知道应该怎么去实现。不过。。。。现在我们有了over(partition by ...)，一切看起来是那么的简单。如下：

 
select e.ename,  
       e.job,  
       e.sal,  
       e.deptno,  
       lead(e.sal, 1, 0) over(partition by e.deptno order by e.sal) lead_sal,  
       lag(e.sal, 1, 0) over(partition by e.deptno order by e.sal) lag_sal,  
       nvl(lead(e.sal) over(partition by e.deptno order by e.sal) - e.sal,  
           0) diff_lead_sal,  
       nvl(e.sal - lag(e.sal) over(partition by e.deptno order by e.sal), 0) diff_lag_sal  
  from scott.emp e;   

看了上面的语句后，大家是否也会觉得虚惊一场呢（惊出一身冷汗后突然鸡冻起来，这样容易感冒）？我们还是来讲解一下上面用到的两个新方法吧。
lead(列名,n,m): 当前记录后面第n行记录的<列名>的值，没有则默认值为m；如果不带参数n,m，则查找当前记录后面第一行的记录<列名>的值，没有则默认值为null。
lag(列名,n,m): 当前记录前面第n行记录的<列名>的值，没有则默认值为m；如果不带参数n,m，则查找当前记录前面第一行的记录<列名>的值，没有则默认值为null。

下面再列举一些常用的方法在该语法中的应用（注：带order by子句的方法说明在使用该方法的时候必须要带order by）：

 
select e.ename,  
       e.job,  
       e.sal,  
       e.deptno,  
       first_value(e.sal) over(partition by e.deptno) first_sal,  
       last_value(e.sal) over(partition by e.deptno) last_sal,  
       sum(e.sal) over(partition by e.deptno) sum_sal,  
       avg(e.sal) over(partition by e.deptno) avg_sal,  
       count(e.sal) over(partition by e.deptno) count_num,  
       row_number() over(partition by e.deptno order by e.sal) row_num  
  from scott.emp e;  

重要提示：大家在读完本片文章之后可能会有点误解，就是OVER (PARTITION BY ..)比GROUP BY更好，实际并非如此，前者不可能替代后者，而且在执行效率上前者也没有后者高，只是前者提供了更多的功能而已，所以希望大家在使用中要根据需求情况进行选择。

分享到：

Oracle 语句优化 | eclipse从数据库逆向生成Hibernate实体类

2015-11-17 18:54
浏览 1157
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Oracle中rank() over, dense_rank(), row_number() 的区别

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Oracle中rank() over, dense_rank(), row_number() 的区别

评论

发表评论

相关推荐

Oracle TopSQL

Oracle 树操作(select…start with…connect by…prior)

Oracle 语句优化

Oracle Service Bus 11g 的三种方案

最近访客更多访客>>