`

order_by、group by、having

 
阅读更多

Having 

这个是用在聚合函数的用法。当我们在用聚合函数的时候,一般都要用到GROUP BY 先进行分组,然后再进行聚合函数的运算。运算完后就要用到HAVING 的用法了,就是进行判断了,例如说判断聚合函数的值是否大于某一个值等等。

select customer_name,sum(balance)

from balance

group by customer_name

having balance>200; yc_rpt_getnew

 

order by group by having的用法区别 

order by 从英文里理解就是行的排序方式,默认的为升序。 order by 后面必须列出排序的字段名,可以是多个字段名。

group by 从英文里理解就是分组。必须有聚合函数来配合才能使用,使用时至少需要一个分组标志字段。

什么是聚合函数
sum()count()avg()等都是聚合函数
使用group by 的目的就是要将数据分类汇总。

一般如:
select 单位名称,count(职工id),sum(职工工资) form [某表]
group by 单位名称
这样的运行结果就是以单位名称为分类标志统计各单位的职工人数和工资总额。

sql命令格式使用的先后顺序上,group by 先于 order by

select 命令的标准格式如下:

SELECT select_list 
[ INTO new_table ] 
FROM table_source 
[ WHERE search_condition ] 
[ GROUP BY group_by_expression ] 
[ HAVING search_condition ]

1. GROUP BY 是分组查询一般 GROUP BY 和聚合函数配合使用

group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面(重要)

例如,有如下数据库表:

A    B 
1    abc 
1    bcd

1    asdfg

如果有如下查询语句(该语句是错误的,原因见前面的原则

select A,B from table group by A

该查询语句的意图是想得到如下结果(当然只是一相情愿)

A     B 
       abc 
1     bcd

       asdfg

右边3条如何变成一条,所以需要用到聚合函数,如下(下面是正确的写法):

select A,count(B) as 数量 from table group by A 
这样的结果就是 
数量 
1    3

2. Having

where 子句的作用是在对查询结果进行分组前,将不符合where条件的行去掉,即在分组之前过滤数据,条件中不能包含聚组函数,使用where条件显示特定的行

having 子句的作用是筛选满足条件的组,即在分组之后过滤数据条件中经常包含聚组函数,使用having 条件显示特定的组,也可以使用多个分组标准进行分组。

having 子句被限制子已经在SELECT语句中定义的列和聚合表达式上。通常,你需要通过在HAVING子句中重复聚合函数表达式来引用聚合值,就如你在SELECT语句中做的那样。例如:

SELECT A COUNT(B) FROM TABLE GROUP BY A HAVING COUNT(B)>2

 

Grouping 的用法:

指示是否聚合 group by 列表中的指定表达式。在结果集中,如果 Grouping 返回 ,表示聚合;如果 Grouping 返回 ,表示非聚合。如果指定了 Group by ,那么只能用在 Select , Having , Order by 中。 

注释: 

GROUPING 用于区分标准空值和由 ROLLUP 、 CUBE 或 GROUPING SETS 返回的空值。作为 ROLLUP 、 CUBE 或 GROUPING SETS 操作结果返回的 NULL 是 NULL 的特殊应用。它在结果集内作为列的占位符,表示全体。 

举例: 

CREATE TABLE tt ( 产地 CHAR ( 8), 水果 CHAR ( 8), 重量 INT   ) 

INSERT tt VALUES ( ' 北方 ' , ' 香蕉 ' , 3) 

INSERT tt VALUES ( ' 北方 ' , ' 水蜜桃 ' , 2) 

INSERT tt VALUES ( ' 南方 ' , ' 桔子 ' , 3) 

INSERT tt VALUES ( ' 北方 ' , ' 水蜜桃 ' , 5) 

INSERT tt VALUES ( ' 南方 ' , ' 香蕉 ' , 3) 

INSERT tt VALUES ( ' 南方 ' , ' 水蜜桃 ' , 6) 

INSERT tt VALUES ( ' 北方 ' , ' 桔子 ' , 8) 

select 

CASE WHEN ( GROUPING ( 产地 ) = 1) THEN ' 总计 

    ELSE ISNULL ( 产地 , 'UNKNOWN' ) 

END AS 产地 

CASE WHEN ( GROUPING 水果 ) = 1) THEN ' 小计 

    ELSE ISNULL ( 水果 , 'UNKNOWN' ) 

END AS 产地 

SUM ( 重量 总重量 

FROM TT 

GROUP BY 产地 水果 

WITH ROLLUP 

结果: 

/************************ 

北方      桔子      

北方      水蜜桃    

北方      香蕉      

北方      小计      18 

南方      桔子      

南方      水蜜桃    

南方      香蕉      

南方      小计      12 

总计     小计       30 

*************************/ 

 

GROUPING(字段)=1的是对应字段汇总的 
GROUPING(字段)=0的是对应字段原来的明细的信息  

 

 

 

 

 

 

 

 

oracle Rollup 和 Cube用法

OracleGROUP BY语句除了最基本的语法外,还支持ROLLUPCUBE语句。如果是ROLLUP(A, B, C)的话,首先会对(ABC)进行GROUP BY,然后对(AB)进行GROUP BY,然后是(A)进行GROUP BY,最后对全表进行GROUP BY操作。如果是GROUP BY CUBE(A, B, C),则首先会对(ABC)进行GROUP BY,然后依次是(AB)(AC)(A)(BC)(B)(C),最后对全表进行GROUP BY操作。 grouping_id()可以美化效果: 

OracleGROUP BY语句除了最基本的语法外,还支持ROLLUPCUBE语句。 
除本文内容外,你还可参考: 
    分析函数参考手册: http://xsb.itpub.net/post/419/33028 
    分析函数使用例子介绍:http://xsb.itpub.net/post/419/44634 

SQL> create table t as select * from dba_indexes; 表已创建。 
SQL> select index_type, status, count(*) from t group by index_type, status; 


INDEX_TYPE STATUS COUNT(*) 
--------------------------- -------- ---------- 
LOB VALID 51 
NORMAL N/A 25 
NORMAL VALID 479 
CLUSTER VALID 11 

下面来看看ROLLUPCUBE语句的执行结果。 
SQL> select index_type, status, count(*) from t group by rollup(index_type, status); 


INDEX_TYPE STATUS COUNT(*) 
--------------------------- -------- ---------- 
LOB VALID 51 
LOB 51 
NORMAL N/A 25 
NORMAL VALID 479 
NORMAL 504 
CLUSTER VALID 11 
CLUSTER 11 
566 
已选择8行。 
SQL> select index_type, status, count(*) from t group by cube(index_type, status); 
INDEX_TYPE STATUS COUNT(*) 
--------------------------- -------- ---------- 
566 
N/A 25 
VALID 541 
LOB 51 
LOB VALID 51 
NORMAL 504 
NORMAL N/A 25 
NORMAL VALID 479 
CLUSTER 11 
CLUSTER VALID 11 

已选择10行。 
查询结果不是很一目了然,下面通过Oracle提供的函数GROUPING来整理一下查询结果。 
SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*) 
2 from t group by rollup(index_type, status) order by 1, 2; 
G_IND G_ST INDEX_TYPE STATUS COUNT(*) 
---------- ---------- --------------------------- -------- ---------- 
0 0 LOB VALID 51 
0 0 NORMAL N/A 25 
0 0 NORMAL VALID 479 
0 0 CLUSTER VALID 11 
0 1 LOB 51 
0 1 NORMAL 504 
0 1 CLUSTER 11 
1 1 566 

已选择8行。 
这个查询结果就直观多了,和不带ROLLUP语句的GROUP BY相比,ROLLUP增加了对INDEX_TYPEGROUP BY统计和对所有记录的GROUP BY统计。 
就是说,如果是ROLLUP(A, B, C)的话,首先会对(ABC)进行GROUP BY,然后对(AB)进行GROUP BY,然后是(A)进行GROUP BY,最后对全表进行GROUP BY操作。 

下面看看CUBE语句。 

SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*) 
2 from t group by cube(index_type, status) order by 1, 2; 

G_IND G_ST INDEX_TYPE STATUS COUNT(*) 
---------- ---------- --------------------------- -------- ---------- 
0 0 LOB VALID 51 
0 0 NORMAL N/A 25 
0 0 NORMAL VALID 479 
0 0 CLUSTER VALID 11 
0 1 LOB 51 
0 1 NORMAL 504 
0 1 CLUSTER 11 
1 0 N/A 25 
1 0 VALID 541 
1 1 566 
已选择10行。 
ROLLUP相比,CUBE又增加了对STATUS列的GROUP BY统计。 
如果是GROUP BY CUBE(A, B, C),则首先会对(ABC)进行GROUP BY,然后依次是(AB)(AC)(A)(BC)(B)(C),最后对全表进行GROUP BY操作。 
除了使用GROUPING函数,还可以使用GROUPING_ID来标识GROUP BY结果。 

SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*) 
2 from t group by rollup(index_type, status) order by 1; 

G_IND INDEX_TYPE STATUS COUNT(*) 
---------- --------------------------- -------- ---------- 
0 LOB VALID 51 
0 NORMAL N/A 25 
0 NORMAL VALID 479 
0 CLUSTER VALID 11 
1 LOB 51 
1 NORMAL 504 
1 CLUSTER 11 
3 566 

已选择8行。 

SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*) 
2 from t group by cube(index_type, status) order by 1; 

G_IND INDEX_TYPE STATUS COUNT(*) 
---------- --------------------------- -------- ---------- 
0 LOB VALID 51 
0 NORMAL N/A 25 
0 NORMAL VALID 479 
0 CLUSTER VALID 11 
1 LOB 51 
1 NORMAL 504 
1 CLUSTER 11 
2 N/A 25 
2 VALID 541 
3 566 
已选择10行。 
grouping_id()可以美化效果: 
select DECODE(GROUPING_ID(C1), 1, '合计', C1) D1, 
DECODE(GROUPING_ID(C1, C2), 1, '小计', C2) D2, 
DECODE(GROUPING_ID(C1, C2, C1 + C2), 1, '小计', C1 + C2) D3, 
count(*), 
GROUPING_ID(C1, C2, C1 + C2, C1 + 1, C2 + 1), 
GROUPING_ID(C1) 
from T2 
group by rollup(C1, C2, C1 + C2, C1 + 1, C2 + 1); 
=========================================================== 
1.报表合计专用的Rollup函数 
销售报表 
广州 1月 2000元 
广州 2月 2500元 
广州 4500元 
深圳 1月 1000元 
深圳 2月 2000元 
深圳 3000元 
所有地区 7500元 
以往的查询SQL: 
Select area,month,sum(money) from SaleOrder group by area,month 
然后广州,深圳的合计和所有地区合计都需要在程序里自行累计 
1.其实可以使用如下SQL: 
Select area,month,sum(total_sale) from SaleOrder group by rollup(area,month) 
就能产生和报表一模一样的纪录 
2.如果year不想累加,可以写成 
Select year,month,area,sum(total_sale) from SaleOrder group by year, rollup(month,area) 
另外Oracle 9i还支持如下语法
Select year,month,area,sum(total_sale) from SaleOrder group by rollup((year,month),area) 
3.如果使用Cube(area,month)而不是RollUp(area,month),除了获得每个地区的合计之外,还将获得每个月份的合计,在报表最后显示。 
4.Grouping让合计列更好读 
RollUp在显示广州合计时,月份列为NULL,但更好的做法应该是显示为"所有月份" Grouping就是用来判断当前Column是否是一个合计列,1yes,然后用Decode把它转为"所有月份
Select Decode(Grouping(area),1,'所有地区',area) area, Decode(Grouping(month),1,'所有月份',month), sum(money) From SaleOrder Group by RollUp(area,month); 
2.对多级层次查询的start with.....connect by 
比如人员组织,产品类别,Oracle提供了很经典的方法 
SELECT LEVEL, name, emp_id,manager_emp_id FROM employee START WITH manager_emp_id is null CONNECT BY PRIOR emp_id = manager_emp_id; 
上面的语句demo了全部的应用,start with指明从哪里开始遍历树,如果从根开始,那么它的manager应该是Null,如果从某个职员开始,可以写成emp_id='11' 
CONNECT BY 就是指明父子关系,注意PRIOR位置 
另外还有一个LEVEL,显示节点的层次 
3.更多报表/分析决策功能 
3.1 分析功能的基本结构 
分析功能() over( partion子句,order by子句,窗口子句
概念上很难讲清楚,还是用例子说话比较好
3.2 Row_Number 和 Rank, DENSE_Rank 
用于选出Top 3 sales这样的报表 
当两个业务员可能有相同业绩时,就要使用RankDense_Rank 
比如 
金额 RowNum Rank Dense_Rank 
张三 4000元 1 1 1 
李四 3000元 2 2 2 
钱五 2000元 3 3 3 
孙六 2000元 4 3 3 
丁七 1000元 5 5 4 
这时,应该把并列第三的钱五和孙六都选进去,所以用Ranking功能比RowNumber保险.至于Desnse还是Ranking就看具体情况了。 
SELECT salesperson_id, SUM(tot_sales) sp_sales, RANK( ) OVER (ORDER BY SUM(tot_sales) DESC) sales_rank FROM orders GROUP BY salesperson_id 
3.3 NTILE 把纪录平分成甲乙丙丁四等 
比如我想取得前25%的纪录,或者把25%的纪录当作同一个level平等对待,把另25%当作另一个Level平等对待 
SELECT cust_nbr, SUM(tot_sales) cust_sales, NTILE(4) OVER (ORDER BY SUM(tot_sales) DESC) sales_quartile FROM orders GROUP BY cust_nbr ORDER BY 3,2 DESC; 
NTITLE(4)把纪录以 SUM(tot_sales)排序分成4
3.4 辅助分析列和Windows Function 
报表除了基本事实数据外,总希望旁边多些全年总销量,到目前为止的累计销量,前后三个月的平均销量这样的列来参考
这种前后三个月的平均和到目前为止的累计销量就叫windows function, 见下例 
SELECT month, SUM(tot_sales) monthly_sales, SUM(SUM(tot_sales)) OVER (ORDER BY month ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_preceeding FROM orders GROUP BY month ORDER BY month; 
SELECT month, SUM(tot_sales) monthly_sales, AVG(SUM(tot_sales)) OVER (ORDER BY month ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) rolling_avg FROM orders GROUP BY month ORDER BY month; 
Windows Function的关键就是Windows子句的几个取值 
1 PRECEDING 之前的一条记录 
1 FOLLOWING 之后的一条记录 
UNBOUNDED PRECEDING 之前的所有记录 
CURRENT ROW 当前纪录 
4.SubQuery总结 
SubQuery天天用了,理论上总结一下.SubQuery 分三种 
1.Noncorrelated 子查询 最普通的样式
2.Correlated Subqueries 把父查询的列拉到子查询里面去,头一回cyt教我的时候理解了半天
3.Inline View 也被当成最普通的样式用了
然后Noncorrelated 子查询又有三种情况 
1.返回一行一列 where price < (select max(price) from goods ) 
2.返回多行一列 where price>= ALL (select price from goods where type=2) 
or where NOT price< ANY(select price from goods where type=2) 
最常用的IN其实就是=ANY() 
3.返回多行多列 一次返回多列当然就节省了查询时间 
UPDATE monthly_orders SET (tot_orders, max_order_amt) = (SELECT COUNT(*), MAX(sale_price) FROM cust_order) DELETE FROM line_item WHERE (order_nbr, part_nbr) IN (SELECT order_nbr, part_nbr FROM cust_order c) 
======================================== 
/*--------理解grouping sets 
select a, b, c, sum( d ) from t 
group by grouping sets ( a, b, c ) 
等效于 
select * from ( 
select a, null, null, sum( d ) from t group by a 
union all 
select null, b, null, sum( d ) from t group by b 
union all 
select null, null, c, sum( d ) from t group by c 

*/ 

<!--EndFragment-->
分享到:
评论

相关推荐

    order_by_、group_by_、having的用法区别

    order_by_、group_by_、having的用法区别

    当数据库复杂查询执行顺序与编写顺序原理及sql案例:同时出现了where_group_by_having_order_by的时候_执行顺序和编写顺序

    当同时出现了where_group_by_having_order_by的时候_执行顺序和编写顺序时的用法

    order_by_、group_by_、having的用法

    在SQL查询中,`order_by_`、`group_by_`和`having`是三个非常重要的关键字,它们分别用于不同的数据处理操作。 1. `ORDER BY`:此关键字用于对查询结果进行排序,默认是升序(ASC),也可以指定降序(DESC)。在`...

    order_by_、group_by_、having的用法区别.doc

    ### SQL中的ORDER BY, GROUP BY, HAVING 的用法区别详解 #### 一、概述 在SQL查询语言中,`ORDER BY`, `GROUP BY`, 和 `HAVING` 是三个非常重要的概念,它们分别用于对查询结果进行排序、分组以及在分组后进一步...

    order by 、group by 、having的用法

    在SQL查询中,`ORDER BY`、`GROUP BY` 和 `HAVING` 是三个非常重要的子句,它们分别用于不同的数据处理操作。 1. **ORDER BY** 子句: - `ORDER BY` 用于对查询结果进行排序,按照指定的字段进行升序或降序排列。...

    Mysql中order by、group by、having的区别深入分析

    在MySQL数据库中,ORDER BY、GROUP BY 和 HAVING 子句是SQL查询中用于数据处理的关键组成部分,它们各自承担不同的任务,以帮助我们从数据库中提取有用的信息。 ORDER BY 子句主要用于对查询结果集进行排序。当你...

    数据库笔试题之查询语句where,group by,having,order by执行与编写顺序详解

    特别是在WHERE、GROUP BY、HAVING、ORDER BY同时出现时,执行顺序和编写顺序变得尤为重要。本文将详细介绍WHERE、GROUP BY、HAVING、ORDER BY的执行顺序和编写顺序,以及它们之间的关系。 一、WHERE子句的执行顺序 ...

    深度分析mysql GROUP BY 与 ORDER BY

    本文就和大家一起深入研究下mysql中group by与order by.... group by… having… order by.. 执行顺序:from… where…group by… having…. select … order by… 所以在order by拿到的结果里已经是

    1 小时 SQL 极速入门(一).pdf

    SELECT order_status, COUNT(*) FROM order_header GROUP BY order_status HAVING COUNT(*) &gt; 2; ``` #### 数据去重 - **DISTINCT**:用于去除查询结果中的重复行。例如,获取所有不同的订单类型: ```sql ...

    SQL精华.

    40. `GROUP BY`和`HAVING`用于找出每个客户订购金额超过24000的情况,`SELECT customer_id, customer_address FROM orders GROUP BY customer_id HAVING SUM(order_amount) &gt; 24000`。 41. 使用`GROUP BY`和`SUM()`...

    mysql group by having 实例代码

    在MySQL数据库中,`GROUP BY` 和 `HAVING` 是两个非常重要的SQL子句,它们在数据分析和报表生成中扮演着关键角色。`GROUP BY` 用于将数据按照指定的一个或多个列进行分组,而 `HAVING` 则用于在分组后对这些分组进行...

    【mysql知识点整理】— order by 、group by 出现Using filesort原因详解

    在一个SQL查询中,执行顺序通常是这样的:`FROM` - `WHERE` - `GROUP BY` - `HAVING` - `SELECT` - `ORDER BY`。当`ORDER BY`和`GROUP BY`同时存在时,`GROUP BY`先于`ORDER BY`执行,这意味着数据首先按`GROUP BY`...

    mysql中order by与group by的区别

    值得注意的是,在 `GROUP BY` 查询中,`SELECT` 子句通常只能包含分组列和聚合函数,除非使用了 `HAVING` 子句进行过滤。 `GROUP BY` 和 `ORDER BY` 的一个关键区别在于作用范围。`ORDER BY` 是对整个查询结果集...

    group by 语法大全,内附列子

    - 当`GROUP BY`与`ORDER BY`一起使用时,`ORDER BY`子句应该放在`GROUP BY`之后。 通过以上示例可以看出,`GROUP BY`语句结合聚合函数在SQL查询中有着广泛的应用,可以帮助我们高效地处理复杂的数据分析任务。希望...

    sql+如何去重复数据,数据库去重复数据

    对于更复杂的情况,可以使用子查询结合`GROUP BY`和`HAVING`来实现去重。这种方法通常用于处理需要按某些条件分组的数据。 **示例:** 假设我们要找出每个员工处理订单数量最多的日期: ```sql SELECT employee_id,...

    mysql遇到Expression.docx

    在该模式下,MySQL不允许在`SELECT`列表、`HAVING`条件或`ORDER BY`列表中引用未在`GROUP BY`子句中出现的非聚合列,除非这些列与`GROUP BY`中的列有函数上的依赖关系。例如,如果你正在根据员工的部门进行分组,...

Global site tag (gtag.js) - Google Analytics