`

oracle 3个实用统计sql场景

阅读更多

我们使用oracle做一些统计的时候,时常碰到如下场景:

1.竖列转横列

2.分组并合并某列作为结果集

3.分组排序取首条记录

 

我们使用一个简化的业务场景,来展示这三个场景如何使用sql来解决。

业务场景:一张表记录着员工的出勤记录

业务需求:(对应上面的三个场景)

1.统计员工某年的每月出勤记录数

2.查询每个人的出勤记录

3.获得每个员工第一天上班的出勤记录

 

首先我们先创建测试数据表和测试数据

 

--创建考勤记录表
CREATE TABLE T_ATTENDANCE_LOG
(  
    ID_ VARCHAR(36),  
    USERNAME_ VARCHAR(255),  
    LOGDATE_ VARCHAR(100)
)  


--初始化一些测试数据
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('1','张三','2014-02-01');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('2','张三','2014-02-02');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('3','张三','2014-02-03');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('4','张三','2014-02-04');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('5','张三','2014-02-05');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('6','张三','2014-02-06');

insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('11','李四','2014-03-01');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('12','李四','2014-04-01');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('13','李四','2014-05-01');

insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('21','王五','2014-02-15');
insert into T_ATTENDANCE_LOG (ID_,USERNAME_,LOGDATE_) VALUES ('22','王五','2014-03-15');

--查询
SELECT T.*,T.ROWID FROM  T_ATTENDANCE_LOG T;

 

结果:



 

 

1.统计员工2014年的每月出勤情况

with sql1 as
(
select USERNAME_,substr(LOGDATE_,0,7) as a,count(LOGDATE_) as b from T_ATTENDANCE_LOG
group by USERNAME_,substr(LOGDATE_,0,7)
)
select USERNAME_, 
sum(case A when '2014-01' then B end) 一月,
sum(case A when '2014-02' then B end) 二月,
sum(case A when '2014-03' then B end) 三月,
sum(case A when '2014-04' then B end) 四月,
sum(case A when '2014-05' then B end) 五月,  
sum(case A  when '2014-06' then B  end) 六月, 
sum(case A  when '2014-07' then B  end) 七月, 
sum(case A  when '2014-08' then B  end) 八月, 
sum(case A  when '2014-09' then B  end) 九月, 
sum(case A  when '2014-10' then B  end) 十月, 
sum(case A  when '2014-11' then B  end) 十一月, 
sum(case A  when '2014-12' then B  end) 十二月
from sql1  group by USERNAME_

 这里用到“sql统计利器”--with。

 

结果:


 

 

2.查询每个人的出勤记录

select USERNAME_ as 员工,wmsys.wm_concat(LOGDATE_) as 出勤记录 from T_ATTENDANCE_LOG t group by  USERNAME_

 

结果:


 

但是我们发现这个统计出来的结果是乱序,改造一下

select USERNAME_ as 员工, max(r) as 出勤记录 from (
select USERNAME_,wmsys.wm_concat(LOGDATE_) OVER(PARTITION BY USERNAME_ ORDER BY LOGDATE_) r
from T_ATTENDANCE_LOG t 
)group by USERNAME_

 

改造结果:


 

 

3.获得每个员工第一天上班的出勤记录

SELECT * FROM 
(
--分组排序加序号
select USERNAME_,LOGDATE_,ROW_NUMBER() OVER(PARTITION BY USERNAME_ ORDER BY LOGDATE_) r
from T_ATTENDANCE_LOG t 
group by USERNAME_,LOGDATE_
) where R=1

 

结果:



 

 

  • 大小: 3.1 KB
  • 大小: 3.7 KB
  • 大小: 3.6 KB
  • 大小: 3.1 KB
  • 大小: 7.1 KB
4
0
分享到:
评论
9 楼 周茂恩 2014-05-19  
min()这个挺不符合分析函数的语法的[function() over (<partition by ...><order by ...><...>)],另外,ROW_NUMBER和RANK以及DENSE_RANK是同一组的,ROW_NUMBER就是普通意义上的ROWNUM(123),而RANK是113,DENSE_RANK则是112.
注: 112,113,123就是排名中两个并列第一名,接下来是第二名。两个并列第一名,接下来是第三名和第一,二,三名,没有并列的。

snkcxy 写道
周茂恩 写道

确实first_value() 那样写 没有问题,但是 我试last_value() 不加 那句话就有问题。
我用这两个函数确实比较少,欢迎讨论~
min()在这个业务逻辑下 确实是一个不错的选择,但是如果需要展示的字段比较多(比如:我需要展示id_),那min()这种方式,是不是还要再关联一次自己(因为不可能按照每个字段进行group by),是不是这种情况下ROW_NUMBER()写法 就有些优势了~

8 楼 snkcxy 2014-05-19  
周茂恩 写道

确实first_value() 那样写 没有问题,但是 我试last_value() 不加 那句话就有问题。
我用这两个函数确实比较少,欢迎讨论~
min()在这个业务逻辑下 确实是一个不错的选择,但是如果需要展示的字段比较多(比如:我需要展示id_),那min()这种方式,是不是还要再关联一次自己(因为不可能按照每个字段进行group by),是不是这种情况下ROW_NUMBER()写法 就有些优势了~
7 楼 hdwmp123 2014-05-19  
不错的分享
6 楼 周茂恩 2014-05-19  
哈哈
select USERNAME_, min(LOGDATE_) keep (dense_rank first order by LOGDATE_ asc) first
from T_ATTENDANCE_LOG
group by USERNAME_;


select USERNAME_, min(LOGDATE_)
from T_ATTENDANCE_LOG
group by USERNAME_;
5 楼 周茂恩 2014-05-19  
SORRY,还是错了
SELECT DISTINCT USERNAME_, FIRST_VALUE(LOGDATE_)OVER(PARTITION BY USERNAME_ ORDER BY LOGDATE_ ASC)
FROM T_ATTENDANCE_LOG
GROUP BY USERNAME_, LOGDATE_;


周茂恩 写道
1. 后面的Windowing Clause不是很常用,也不是必须的。
2. 我忘记加distinct了,正确的结果应该是
    SELECT DISTINCT USERNAME_, FIRST_VALUE(LOGDATE_)OVER( ORDER BY USERNAME_)
FROM T_ATTENDANCE_LOG;
3. 另外一种
     SELECT DISTINCT USERNAME_, MIN(LOGDATE_)OVER(PARTITION BY  USERNAME_ ORDER BY TO_DATE(LOGDATE_, 'YYYY-MM-DD') ASC)
FROM T_ATTENDANCE_LOG;


snkcxy 写道
周茂恩 写道
SELECT USERNAME_, LOGDATE_, FIRST_VALUE(LOGDATE_)OVER( ORDER BY USERNAME_)
FROM T_ATTENDANCE_LOG;


感谢讨论~
first_value()版本:
select distinct tt.username_,tt.f
from(
select t.*,
       first_value(LOGDATE_) over(partition by USERNAME_ order by LOGDATE_ ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) F,
       last_value(LOGDATE_) over(partition by USERNAME_ order by LOGDATE_ ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) L
  from T_ATTENDANCE_LOG T
 order by USERNAME_
 ) tt;

个人觉得oracle的first_value 使用还是有些麻烦的,需要加一句ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING,否则出来的数据和预想的不太一样。


4 楼 周茂恩 2014-05-19  
1. 后面的Windowing Clause不是很常用,也不是必须的。
2. 我忘记加distinct了,正确的结果应该是
    SELECT DISTINCT USERNAME_, FIRST_VALUE(LOGDATE_)OVER( ORDER BY USERNAME_)
FROM T_ATTENDANCE_LOG;
3. 另外一种
     SELECT DISTINCT USERNAME_, MIN(LOGDATE_)OVER(PARTITION BY  USERNAME_ ORDER BY TO_DATE(LOGDATE_, 'YYYY-MM-DD') ASC)
FROM T_ATTENDANCE_LOG;


snkcxy 写道
周茂恩 写道
SELECT USERNAME_, LOGDATE_, FIRST_VALUE(LOGDATE_)OVER( ORDER BY USERNAME_)
FROM T_ATTENDANCE_LOG;


感谢讨论~
first_value()版本:
select distinct tt.username_,tt.f
from(
select t.*,
       first_value(LOGDATE_) over(partition by USERNAME_ order by LOGDATE_ ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) F,
       last_value(LOGDATE_) over(partition by USERNAME_ order by LOGDATE_ ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) L
  from T_ATTENDANCE_LOG T
 order by USERNAME_
 ) tt;

个人觉得oracle的first_value 使用还是有些麻烦的,需要加一句ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING,否则出来的数据和预想的不太一样。

3 楼 snkcxy 2014-05-19  
周茂恩 写道
SELECT USERNAME_, LOGDATE_, FIRST_VALUE(LOGDATE_)OVER( ORDER BY USERNAME_)
FROM T_ATTENDANCE_LOG;


感谢讨论~
first_value()版本:
select distinct tt.username_,tt.f
from(
select t.*,
       first_value(LOGDATE_) over(partition by USERNAME_ order by LOGDATE_ ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) F,
       last_value(LOGDATE_) over(partition by USERNAME_ order by LOGDATE_ ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) L
  from T_ATTENDANCE_LOG T
 order by USERNAME_
 ) tt;

个人觉得oracle的first_value 使用还是有些麻烦的,需要加一句ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING,否则出来的数据和预想的不太一样。
2 楼 周茂恩 2014-05-19  
SELECT USERNAME_, LOGDATE_, FIRST_VALUE(LOGDATE_)OVER( ORDER BY USERNAME_)
FROM T_ATTENDANCE_LOG;
1 楼 snkcxy 2014-05-18  
如果大家有什么更简单或性能更好的方法 欢迎讨论~ 相互学习~

相关推荐

    Linux下定时自动执行Oracle_SQL

    在IT领域,尤其是在数据库管理和系统自动化操作中,利用Linux下的Crontab实现Oracle SQL的定时自动执行是一项极为实用且高效的技术。本文将深入探讨如何在Linux环境下设置Crontab来定期执行Oracle SQL脚本,这一过程...

    Oracle sql查询当前月的所有日期

    通过上述SQL语句,我们可以轻松地获取当前月份的所有日期,这对于需要按月份进行数据分析的场景非常实用。同时,本文还介绍了几个Oracle SQL中处理日期的重要函数和技巧,希望对你有所帮助。在实际应用中,根据具体...

    Oracle维护常用SQL语句汇总

    根据提供的文件信息,我们可以归纳出一系列与Oracle数据库...以上SQL查询语句覆盖了Oracle数据库日常管理和维护中的多个方面,如版本信息、表空间管理、对象状态检查等,对于Oracle数据库管理员来说是非常实用的工具。

    Oracle Database 10g SQL Tuning Workshop

    - **专业性和实用性**:本课程由 Oracle 官方认证讲师授课,内容涵盖了 SQL 调优的所有关键领域。 - **实践经验**:通过实际案例学习和动手练习,使学员能够在真实环境中应用所学知识。 - **官方支持**:作为 Oracle...

    sql and oracle备份以及还原

    虽然随着技术的发展,RMAN(Recovery Manager)和其他第三方工具已经成为大型数据库备份的首选,但exp/imp在处理小型数据库或特定场景下仍然具有实用性。 1. Oracle EXP(导出)详解: - `USERID`:指定登录数据库...

    Oracle SQL:经典查询练手四篇

    通过这个系列,读者不仅可以掌握基础的SQL查询,还能深入理解如何在实际场景中应用这些知识,解决实际问题。练习越多,对SQL的理解就越深刻,处理数据的能力也就越强。在后续的篇章中,预计会涵盖更复杂的查询技巧,...

    Oracle SQL Tuning with Oracle SQLTXPLAIN.pdf

    ### Oracle SQL Tuning with Oracle SQLTXPLAIN ...通过以上章节的详细介绍,读者不仅可以了解到SQLTXPLAIN的强大功能,还能掌握一系列实用的SQL调优技巧,从而提升自身在Oracle数据库管理领域的专业技能。

    Oracle SQL Tuning Pocket Reference

    《Oracle SQL Tuning Pocket Reference》是一本由 Mark Gurry 编写的快速参考指南书籍,旨在为 Oracle SQL 的调优提供实用建议与策略。该书不是一本全面的 Oracle 调优书籍,而是基于作者及其公司 Mark Gurry & ...

    sql21天自学通和oracle常用函数集锦

    在IT领域,SQL(Structured Query Language)是一种用于管理和操作关系型数据库的标准语言,而Oracle则是一种广泛...学习过程中,理论结合实践,多做练习,理解每个函数的实际应用场景,将有助于你快速提升SQL技能。

    Oracle 11g SQL learning

    综上所述,《Oracle 11g: SQL》是一本内容详实、实用性强的学习指南,不仅适合初学者快速入门,也为有一定基础的读者提供了进阶知识。通过本书的学习,读者可以系统地掌握Oracle 11g SQL的相关技能,并能在实际工作...

    Oracle中如何用一条SQL快速生成10万条测试数据.txt

    在Oracle数据库中,通过一条SQL语句快速生成大量测试数据是一项非常实用的技能。本文将详细介绍如何利用Oracle中的特性来实现这一目标。 ### 核心知识点:使用一条SQL语句快速生成10万条测试数据 #### 1. 使用`...

    sqlserver和oracle数据字典生成器很好用

    总的来说,"sqlserver和oracle数据字典生成器"是一个实用的工具,可以帮助数据库管理员和开发人员更高效地管理和理解复杂的数据库系统,减少手动查询和文档编制的工作量。通过源代码的可用性,用户还可以根据自身...

    sql跟踪工具

    1. **TKPROF**:Oracle提供的一个实用工具,可以将跟踪文件格式化为更易读的报告,包含执行计划、执行时间、I/O统计等。 2. **SQL Tuning Advisor**:Oracle 10g及更高版本提供了这个功能,可以根据跟踪信息自动...

    SQLTOOLS2.0汉化版

    3. **数据库连接**:支持多种数据库系统,如MySQL、Oracle、SQL Server、PostgreSQL等,只需输入相应的连接参数,即可轻松连接到不同的数据库服务器。 4. **数据导入导出**:提供向导式的数据导入导出功能,支持从...

    Oracle 实战SQL层次查询

    ### Oracle 实战SQL层次查询详解 #### 一、层次查询概念 层次查询,也被称为树型结构查询,是在SQL中最常见的功能之一。这种查询方式主要用于处理具有层级结构的数据,例如组织架构、产品分类等场景。在Oracle...

    Oracle_SQL小宝典

    ### Oracle_SQL小宝典知识点详解 #### 一、SQL语言简介 - **定义**:SQL(Structured Query Language),即结构化查询语言,是用于管理关系型数据库的标准编程语言。 - **特性**: - SQL语句对大小写不敏感。 - ...

    ORACLE SQL语句执行效率研究.pdf

    总的来说,这篇文章为Oracle数据库管理员和开发者提供了实用的参考,对于如何识别和解决SQL语句中的性能瓶颈、优化查询语句提供了详细的指导。通过遵循这些指导原则,开发者可以显著提高数据库查询的效率,进而提升...

    SQL21自学通 实用的sql教程

    关系型数据库如MySQL、Oracle、SQL Server等都是基于SQL标准的,因此学习SQL的基础语法具有很高的通用性。读者将了解如何创建数据库、数据表,并掌握数据类型,如整型、浮点型、字符串和日期时间类型。 接下来,...

    关于Oracle的SQL性能调整.pdf

    Oracle的SQL性能调整是数据库管理中的重要环节,它涉及到多个层面,包括优化器的选择、内存参数设置、SQL语句编写技巧、索引的利用、多表连接方式以及数据库物理结构设计(如分区和簇)。本文将重点讨论SQL语句的...

Global site tag (gtag.js) - Google Analytics