`
wangchaovsjava
  • 浏览: 68496 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论

PostgreSQL表表达式

阅读更多
表表达式
表表达式 计算一个表,它包含一个 FROM 子句,该子句可以根据需要选用 WHERE, GROUP BY, HAVING 子句。大部分表表达式只是指向磁盘上的一个所谓的基本表,但是我们可以用更复杂的表表达式以各种方法修改或组合基本表。

表表达式里的 WHERE, GROUP BY, HAVING 子句声明一系列对源自 FROM 子句的表的转换操作。所有这些转换最后生成一个虚拟表,传递给选择列表计算输出行。

7.2.1. FROM 子句
FROM 子句 从一个逗号分隔的表引用列表中生成一个虚拟表。

FROM table_reference [, table_reference [, ...]]表引用可以是一个表名字(可能有模式修饰)或者是一个生成的表,比如子查询、表连接、或这些东西的复杂组合。如果在 FROM 子句中列出了多于一个表,那么它们被交叉连接(见下文)形成一个派生表,该表可以进行 WHERE, GROUP BY, HAVING 子句的转换处理,并最后生成表表达式的结果。

如果一个表引用是一个简单的父表的名字,那么将包括其所有后代子表的行,除非你在该表名字前面加 ONLY 关键字(这样任何子表都会被忽略)。

7.2.1.1. 连接表
一个连接表是根据特定的连接规则从两个其它表(真实表或生成表)中派生的表。我们支持内连接、外连接、交叉连接。

连接类型

交叉连接
T1 CROSS JOIN T2对每个来自 T1 和 T2 的行进行组合,生成的表将包含这样的行:所有 T1 里面的字段后面跟着所有 T2 里面的字段。如果两表分别有 N 和 M 行,连接成的表将有 N*M 行。

FROM T1 CROSS JOIN T2 等效于 FROM T1, T2 。它还等效于 FROM T1 INNER JOIN T2 ON TRUE (见下文)。

条件连接
T1 { [INNER] | { LEFT | RIGHT | FULL } [OUTER] } JOIN T2 ON boolean_expression
T1 { [INNER] | { LEFT | RIGHT | FULL } [OUTER] } JOIN T2 USING ( join column list )
T1 NATURAL { [INNER] | { LEFT | RIGHT | FULL } [OUTER] } JOIN T2INNER 和 OUTER 对所有连接类型都是可选的。INNER 为缺省。LEFT, RIGHT, FULL 隐含外连接。

连接条件在 ON 或 USING 子句里声明,或者用关键字 NATURAL 隐含地声明。连接条件判断来自两个源表中的那些行是"匹配"的,这些我们将在下面详细解释。

ON 子句是最常见的连接条件的类型:它接收一个和 WHERE 子句相同的布尔表达式。如果两个分别来自 T1 和 T2 的行在 ON 表达式上运算的结果为真,那么它们就算是匹配的行。

USING 是个一个连接条件的缩写语法:它接收一个用逗号分隔的字段名列表,这些字段必须是连接表共有的并且其值必须相同。最后,JOIN USING 会将每一对相等的输入字段输出为一个字段,其后跟着所有其它字段。因此,USING (a, b, c) 等效于 ON (t1.a = t2.a AND t1.b = t2.b AND t1.c = t2.c) 只不过是如果使用了 ON ,那么在结果里 a, b, c 字段都会有两个,而用 USING 的时候就只会有一个。

最后,NATURAL 是 USING 的缩写形式:它自动形成一个由两个表中同名的字段组成的 USING 列表(同名字段只出现一次)。

条件连接可能的类型是:

INNER JOIN
内连接。对于 T1 中的每一行 R1 ,如果能在 T2 中找到一个或多个满足连接条件的行,那么这些满足条件的每一行都在连接表中生成一行。

LEFT OUTER JOIN
左外连接。首先执行一次内连接。然后为每一个 T1 中无法在 T2 中找到匹配的行生成一行,该行中对应 T2 的列用 NULL 补齐。因此,生成的连接表里无条件地包含来自 T1 里的每一行至少一个副本。

RIGHT OUTER JOIN
右外连接。首先执行一次内连接。然后为每一个 T2 中无法在 T1 中找到匹配的行生成一行,该行中对应 T1 的列用 NULL 补齐。因此,生成的连接表里无条件地包含来自 T2 里的每一行至少一个副本。

FULL OUTER JOIN
全连接。首先执行一次内连接。然后为每一个 T1 与 T2 中找不到匹配的行生成一行,该行中无法匹配的列用 NULL 补齐。因此,生成的连接表里无条件地包含 T1 和 T2 里的每一行至少一个副本。

如果 T1 和 T2 之一或全部是可以连接的表,那么所有类型的连接都可以串连或嵌套在一起。你可以在 JOIN 子句周围使用圆括弧来控制连接顺序,如果没有圆括弧,那么 JOIN 子句从左向右嵌套。

为了解释这些问题,假设我们有一个表 t1

num | name
-----+------
   1 | a
   2 | b
   3 | c和 t2

num | value
-----+-------
   1 | xxx
   3 | yyy
   5 | zzz然后我们用不同的连接方式可以获得各种结果:

=> SELECT * FROM t1 CROSS JOIN t2;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   1 | a    |   3 | yyy
   1 | a    |   5 | zzz
   2 | b    |   1 | xxx
   2 | b    |   3 | yyy
   2 | b    |   5 | zzz
   3 | c    |   1 | xxx
   3 | c    |   3 | yyy
   3 | c    |   5 | zzz
(9 rows)

=> SELECT * FROM t1 INNER JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   3 | c    |   3 | yyy
(2 rows)

=> SELECT * FROM t1 INNER JOIN t2 USING (num);
num | name | value
-----+------+-------
   1 | a    | xxx
   3 | c    | yyy
(2 rows)

=> SELECT * FROM t1 NATURAL INNER JOIN t2;
num | name | value
-----+------+-------
   1 | a    | xxx
   3 | c    | yyy
(2 rows)

=> SELECT * FROM t1 LEFT JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   2 | b    |     |
   3 | c    |   3 | yyy
(3 rows)

=> SELECT * FROM t1 LEFT JOIN t2 USING (num);
num | name | value
-----+------+-------
   1 | a    | xxx
   2 | b    |
   3 | c    | yyy
(3 rows)

=> SELECT * FROM t1 RIGHT JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   3 | c    |   3 | yyy
     |      |   5 | zzz
(3 rows)

=> SELECT * FROM t1 FULL JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   2 | b    |     |
   3 | c    |   3 | yyy
     |      |   5 | zzz
(4 rows)用 ON 声明的连接条件也可以包含与连接不直接相关的条件。这种功能可能对某些查询很有用,但是需要我们仔细想清楚。比如:

=> SELECT * FROM t1 LEFT JOIN t2 ON t1.num = t2.num AND t2.value = 'xxx';
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   2 | b    |     |
   3 | c    |     |
(3 rows)7.2.1.2. 表和列别名
你可以给表或复杂的表引用起一个临时的表别名,以便被其余的查询引用。

要创建一个表别名,可以这样:

FROM table_reference AS alias或

FROM table_reference aliasAS 关键字没啥特别的含义。alias 可以是任意标识符。

表别名的典型应用是给长表名赋予比较短的标识,好让连接子句更易读一些。比如:

SELECT * FROM some_very_long_table_name s JOIN another_fairly_long_name a ON s.id = a.num;取了别名之后就不允许再用最初的名字了。因此

SELECT * FROM my_table AS m WHERE my_table.a > 5;是不符合 SQL 语法的。在 PostgreSQL 中,当 add_missing_from 配置参数为 off (默认)时将会抛出一个错误,但如果为 on 将隐含地在 FROM 子句里增加一个表引用,因此这个查询将会像下面这样处理:

SELECT * FROM my_table AS m, my_table AS my_table WHERE my_table.a > 5;这样会生成一个交叉连接,这通常不是你想要的。

表别名主要是为了方便标记,但对于自连接却是必须的。比如:

SELECT * FROM people AS mother JOIN people AS child ON mother.id = child.mother_id;另外,要引用子查询的结果也必须使用别名(参见节7.2.1.3)。

圆括弧用于解决歧义。下面的第一个语句把别名 b 赋予第二个 my_table 表;而第二个语句则把别名 b 赋予了连接的结果。

SELECT * FROM my_table AS a CROSS JOIN my_table AS b ...
SELECT * FROM (my_table AS a CROSS JOIN my_table) AS b ...另外一种形式的表别名除了给表赋予别名外,还给该表的字段也赋予了别名:

FROM table_reference [AS] alias ( column1 [, column2 [, ...]] )如果声明的字段别名比表里实际的字段少,那么后面的字段就没有别名。这个语法对于自连接或子查询特别有用。

如果用这些形式中的任何一种给一个 JOIN 子句的输出结果附加了一个别名,那么该别名就在 JOIN 里隐藏了其原始的名字。比如

SELECT a.* FROM my_table AS a JOIN your_table AS b ON ...是合法 SQL ,但是

SELECT a.* FROM (my_table AS a JOIN your_table AS b ON ...) AS c是不合法的:别名 a 在别名 c 的外面是看不到的。

7.2.1.3. 子查询
子查询的结果(派生表)必须包围在圆括弧里并且必须赋予一个别名(参阅节7.2.1.2)。比如:

FROM (SELECT * FROM table1) AS alias_name这个例子等效于 FROM table1 AS alias_name 。更有趣的例子是在子查询里面有分组或聚集的时候,这个时候子查询不能归纳成一个简单的连接。

子查询也可以是一个 VALUES 列表:

FROM (VALUES ('anne', 'smith'), ('bob', 'jones'), ('joe', 'blow'))
     AS names(first, last)这种情况同样也必须要取一个别名。还可以为 VALUES 列表中的字段取别名,并且被认为是一个好习惯。更多信息参见节7.7。

7.2.1.4. 表函数
表函数是那些生成一个行集合的函数,这个集合可以是由基本数据类型(标量类型)组成,也可以是由复合数据类型(表的行)组成。他们的用法类似一个表、视图、或 FROM 子句里的子查询。表函数返回的字段可以像一个表、视图、或者子查询字段那样包含在 SELECT, JOIN, WHERE 子句里。

如果表函数返回基本数据类型,那么单一结果字段的名字与函数名相同。如果表函数返回复合数据类型,那么多个结果字段的名字和该类型的每个属性的名字相同。

可以在 FROM 子句中为表函数取一个别名,也可以不取别名。如果一个函数在 FROM 子句中没有别名,那么将使用函数名作为结果表的名字。

一些例子:

CREATE TABLE foo (fooid int, foosubid int, fooname text);

CREATE FUNCTION getfoo(int) RETURNS SETOF foo AS $$
    SELECT * FROM foo WHERE fooid = $1;
$$ LANGUAGE SQL;

SELECT * FROM getfoo(1) AS t1;

SELECT * FROM foo
    WHERE foosubid IN (select foosubid from getfoo(foo.fooid) z
                           where z.fooid = foo.fooid);

CREATE VIEW vw_getfoo AS SELECT * FROM getfoo(1);

SELECT * FROM vw_getfoo;有时侯,把一个函数定义成根据不同的调用方法可以返回不同的字段是很有用的。为了支持这个,表函数可以声明为返回伪类型 record 。如果在查询里使用这样的函数,那么我们必须在查询中声明预期的行结构,这样系统才知道如何分析和规划该查询。让我们看看下面的例子:

SELECT *
    FROM dblink('dbname=mydb', 'select proname, prosrc from pg_proc')
      AS t1(proname name, prosrc text)
    WHERE proname LIKE 'bytea%';dblink 函数执行一个远程的查询(参阅 contrib/dblink)。它声明为返回 record ,因为它可能会被用于任何类型的查询。实际的字段集必须在调用它的查询中声明,这样分析器才知道类似 * 这样的东西应该扩展成什么样子。

7.2.2. WHERE 子句
WHERE 子句 的语法是

WHERE search_condition这里的 search_condition 是一个返回类型为 boolean 的值表达式(参阅节4.2)。

在完成对 FROM 子句的处理之后,生成的每一行都会按照 search_condition进行检查。如果结果是真,那么该行保留在输出表中,否则(结果是假或 NULL)就把它抛弃。搜索条件通常至少要引用一些在 FROM 子句里生成的列,这不是必须的,但如果不这样的话,WHERE 子句就没什么意义了。

【注意】内连接的连接条件既可以写在 WHERE 子句里也可以写在 JOIN 子句里。比如,下面的表表达式是等效的:

FROM a, b WHERE a.id = b.id AND b.val > 5和

FROM a INNER JOIN b ON (a.id = b.id) WHERE b.val > 5或者可能还有

FROM a NATURAL JOIN b WHERE b.val > 5你想用哪个只是风格问题。FROM 子句里的 JOIN 语法可能不那么容易移植到其它产品中。对于外连接而言,我们在任何情况下都没有选择:连接条件必须在 FROM 子句中完成。外连接的 ON/USING 子句不等于 WHERE 条件,因为它判断最终结果中行的增(那些不匹配的输入行)和删。

这里是一些 WHERE 子句的例子:

SELECT ... FROM fdt WHERE c1 > 5

SELECT ... FROM fdt WHERE c1 IN (1, 2, 3)

SELECT ... FROM fdt WHERE c1 IN (SELECT c1 FROM t2)

SELECT ... FROM fdt WHERE c1 IN (SELECT c3 FROM t2 WHERE c2 = fdt.c1 + 10)

SELECT ... FROM fdt WHERE c1 BETWEEN (SELECT c3 FROM t2 WHERE c2 = fdt.c1 + 10) AND 100

SELECT ... FROM fdt WHERE EXISTS (SELECT c1 FROM t2 WHERE c2 > fdt.c1)在上面的例子里,fdt 是从 FROM 子句中派生的表。那些不符合 WHERE 子句的搜索条件的行将从 fdt 中删除。请注意我们把标量子查询当做一个值表达式来用。就像其它查询一样,子查询里也可以使用复杂的表表达式。同时还请注意 fdt 是如何引用子查询的。把 c1 修饰成 fdt.c1 只有在 c1 是该子查询生成的列名字时才是必须的,但修饰列名字可以增加语句的准确性(即使有时不是必须的)。这个例子就演示了字段名字范围如何从外层查询扩展到它的内层查询。

7.2.3. GROUP BY 和 HAVING 子句
在通过了 WHERE 过滤器之后,生成的输出表可以继续用 GROUP BY 子句进行分组,然后用 HAVING 子句选取一些分组行。

SELECT select_list
    FROM ...
    [WHERE ...]
    GROUP BY grouping_column_reference [, grouping_column_reference]...GROUP BY 子句 用于把那些所有列出的 grouping_column_reference 值都相同的行聚集在一起,缩减为一行,这样就可以删除输出里的重复和/或计算应用于这些组的聚集。这些字段的列出顺序无关紧要。比如:

=> SELECT * FROM test1;
x | y
---+---
a | 3
c | 2
b | 5
a | 1
(4 rows)

=> SELECT x FROM test1 GROUP BY x;
x
---
a
b
c
(3 rows)在第二个查询里,我们不能写成 SELECT * FROM test1 GROUP BY x ,因为字段 y 里没有哪个值可以和每个组关联起来。被分组的字段可以在选择列表中引用是因为它们每个组都有单一的数值。

如果一个表被分了组,那么就只能引用聚集表达式中的字段和分组中的字段。一个带聚集表达式的例子是:

=> SELECT x, sum(y) FROM test1 GROUP BY x;
x | sum
---+-----
a |   4
b |   5
c |   2
(3 rows)这里的 sum 是一个聚集函数,它在组上计算总和。有关可用的聚集函数的更多信息可以在节9.15中找到。

【提示】没有聚集表达式的分组实际上是计算了一个字段中独立数值的集合。我们也可以用 DISTINCT 子句实现(参阅节7.3.3)。

这里是另外一个例子:它计算每种产品的总销售额(而不是所有产品的总销售额)。

SELECT product_id, p.name, (sum(s.units) * p.price) AS sales
    FROM products p LEFT JOIN sales s USING (product_id)
    GROUP BY product_id, p.name, p.price;在这个例子里,字段 product_id, p.name, p.price 必须在 GROUP BY 子句里,因为它们都在查询选择列表里被引用了。根据产品表具体设置的不同,名字和价格可能和产品ID完全无关,因此理论上额外的分组可能是不必要的,但是这些尚未实现。s.units 字段不必在 GROUP BY 列表里,因为它只是在一个聚集表达式(sum(...))里使用,它代表一组产品的销售总额。对于每种产品,这个查询都返回一个该产品的总销售额。

在严格的 SQL 里,GROUP BY 只能对源表的列进行分组,但 PostgreSQL 把这个扩展为既允许对选择列表中的字段进行分组,也允许对值表达式进行分组,而不仅仅是简单的字段。

如果一个表已经用 GROUP BY 子句分了组,然后你又只对其中的某些组感兴趣,那么就可以用 HAVING 子句筛选分组。语法是:

SELECT select_list FROM ... [WHERE ...] GROUP BY ... HAVING boolean_expression在 HAVING 子句中的表达式可以引用分组的表达式和未分组的表达式(后者必须涉及一个聚集函数)。

例子:

=> SELECT x, sum(y) FROM test1 GROUP BY x HAVING sum(y) > 3;
x | sum
---+-----
a |   4
b |   5
(2 rows)

=> SELECT x, sum(y) FROM test1 GROUP BY x HAVING x < 'c';
x | sum
---+-----
a |   4
b |   5
(2 rows)然后是一个更现实的例子:

SELECT product_id, p.name, (sum(s.units) * (p.price - p.cost)) AS profit
    FROM products p LEFT JOIN sales s USING (product_id)
    WHERE s.date > CURRENT_DATE - INTERVAL '4 weeks'
    GROUP BY product_id, p.name, p.price, p.cost
    HAVING sum(p.price * s.units) > 5000;在上面的例子里,WHERE 子句在尚未分组之前根据 s.date 字段选择数据行(表达式只是对那些最近四周发生的销售为真)。而 HAVING 子句在分组之后选择那些销售总额超过 5000 的组。请注意聚集表达式不需要在查询中的所有地方都一样。

分享到:
评论

相关推荐

    PostgreSQL 正则表达式 常用函数的总结

    PostgreSQL 正则表达式 常用函数的总结 对那些需要进行复杂数据处理的程序来说,正则表达式无疑是一个非常有用的工具。本文重点在于阐述 PostgreSQL 的一些常用正则表达式函数以及源码中的一些函数。 正则相关部分的...

    postgresql9.6.zip

    在使用PostgreSQL 9.6时,你可以利用其丰富的功能,如窗口函数、递归公共表表达式、JSONB数据类型和多版本并发控制(MVCC),以构建高效、可靠和可扩展的数据库解决方案。同时,PostgreSQL还拥有活跃的社区支持,...

    DB2到GreenPlum/PostgreSQL的转换指南

    - SQL谓词、临时表、CASE表达式、列函数、OLAP函数、标量函数等SQL组件的差异。 - ORDER BY、GROUP BY、HAVING子句的使用方法。 - 动态游标、连接操作、子查询的处理方式。 - UNION和UNION ALL的用法。 - 动态SQL的...

    postgresql 开发指南

    使用 VALUES 表达式可以插入多个数据,例如: ```sql INSERT INTO test3 VALUES (31, '11', '2014-09-8'), (32, '23', NULL); ``` 多表 Join 查询 Postgresql 支持多种类型的 Join 查询,包括内连接、左外连接、...

    PostgreSQL修炼之道 从小工到专家.pptx

    * 数据库设计:PostgreSQL数据库设计包括数据模型、表结构、索引和约束等方面。 PostgreSQL安装与配置 * PostgreSQL安装:包括下载、安装和配置PostgreSQL服务器。 * PostgreSQL配置:包括设置数据库参数、内存...

    PostgreSQL修炼之道:从小工到专家

     实用与特色兼顾:书中不仅介绍了与PostgreSQL配套的实用性很强的主流开源软件(如PgBouncer、Slony-I、Bucardo、PL/Proxy、pgpool-II、Postgres-XC),还针对PostgreSQL的特色功能(如规则系统、正则表达式、序列...

    postgresql 正则代替in查询

    postgresql 正则代替in查询 当需要参数查询时非常有用

    postgresql8.2.3用户手册API

    PostgreSQL 8.2.3支持标准SQL,并扩展了多种高级特性,如窗口函数、递归公共表表达式(CTEs)、存储过程等。API手册会详细解释如何在程序中正确使用这些SQL语句。 三、C语言API PostgreSQL的核心API主要是用C语言...

    postgresql

    表表达式是用于计算得到一张表的表达式,通常包括 `FROM` 子句,有时还会有 `WHERE`, `GROUP BY`, `HAVING` 子句。这些子句共同作用于数据源,生成最终的查询结果。 **5.2.1 FROM 子句** `FROM` 子句指定了一个或...

    PostgreSQL开发指南

    通用表表达式(CTE)是高级查询技巧,它增强了查询的可读性和灵活性,尤其是递归CTE在处理层次结构数据时非常有用。 最后,书中还涵盖了窗口函数,这是PostgreSQL的一个强大特性,允许在结果集中进行行级别的计算,...

    PostgreSQL9.3.1 官方中文参考手册.pdf

    查询章节则介绍了如何使用PostgreSQL进行数据的查询操作,包括表表达式、选择列表、组合查询、行排序以及LIMIT和OFFSET的使用等。这部分内容非常关键,因为大多数数据库应用都需要从数据库中检索数据。 此外,手册...

    一个利用正则表达式分析出DB2、Greenplum、MySQL、Oracle、PostgreSQL和Te-HSP.zip

    标题中的“一个利用正则表达式分析出DB2、Greenplum、MySQL、Oracle、PostgreSQL和Te-HSP”指的是一个项目或工具,它使用正则表达式来解析和处理与这六种数据库系统相关的数据。这个项目可能涉及到数据提取、转换、...

    PostGreSQL资料.zip

    8. **索引表达式**:除了基于列的索引,PostgreSQL还支持基于表达式的索引,这使得能够为复杂的查询条件创建索引。 9. **连接优化**:优化JOIN操作是查询优化的关键。使用合适的JOIN类型(如INNER JOIN、LEFT JOIN...

    postgresql-12.0.tar.gz

    - **分区表增强**:支持范围分区和列表分区,使数据管理更灵活。 - **索引改进**:支持对表达式索引进行并行构建,加速索引创建。 - **JSONB增强**:允许对JSONB字段进行聚合操作,增强了对JSON数据的支持。 - **...

    完全自动的正则表达式编写工具

    例如,Perl.jgcscs可能包含了对Perl语言中正则表达式语法的特殊处理,而PostgreSQL.jgcscs可能包含了针对PostgreSQL数据库查询时正则操作的优化。 XML.jgcscs可能意味着工具也考虑到了XML文档的结构,能够帮助匹配...

    postgresql-13.2.tar.gz

    2. **SQL标准支持**:PostgreSQL支持SQL:2008标准,提供丰富的SQL功能,包括窗口函数、递归查询、常见的表表达式等。 3. **多版本并发控制(MVCC)**:通过MVCC实现读写并发,允许读取不会被写锁定的数据,提高了...

    postgresql-11官方文档

    除了以上重点,PostgreSQL 11还有许多其他特性,如分区表、表继承、表达式索引、物化视图、C语言插件接口等,都在官方文档中有详细介绍。 总的来说,"postgresql-11官方文档"是学习和参考PostgreSQL 11的权威资料,...

    postgresql-9.0.1-1-windows

    9. **安全性**:PostgreSQL提供了细粒度的权限控制,可以为用户、角色、表、列甚至单个SQL命令设置访问权限,确保数据安全。 10. **社区支持**:PostgreSQL拥有活跃的开发者社区,提供及时的更新、补丁和广泛的技术...

Global site tag (gtag.js) - Google Analytics