`
tomotoboy
  • 浏览: 166897 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

使用关系代数合并数据

    博客分类:
  • SQL
阅读更多
1 关系代数
合并数据集合的理论基础是关系代数,它是由E.F.Codd于1970年提出的。
在关系代数的形式化语言中:
  • 用表、或者数据集合表示关系或者实体。
  • 用行表示元组。
  • 用列表示属性。

关系代数包含以下8个关系运算符
  • 选取――返回满足指定条件的行。
  • 投影――从数据集合中返回指定的列。
  • 笛卡尔积――是关系的乘法,它将分别来自两个数据集合中的行以所有可能的方式进行组合。
  • 并――关系的加法和减法,它可以在行的方向上合并两个表中的数据,就像把一个表垒在另一个表之上一样。
  • 交――返回两个数据集合所共有的行。
  • 差――返回只属于一个数据集合的行。
  • 连接――在水平方向上合并两个表,其方法是:将两个表中在共同数据项上相互匹配的那些行合并起来。
  • 除――返回两个数据集之间的精确匹配。


此外,作为一种实现现代关系代数运算的方法,SQL还提供了:
子查询――类似于连接,但更灵活;在外部查询中,方式可以使用表达式、列表或者数据集合的地方都可以使用子查询的结果。

2 使用连接
2.1 连接类型
在关系代数中,连接运算是由一个笛卡尔积运算和一个选取运算构成的。首先用笛卡尔积完成对两个数据集合的乘运算,然后对生成的结果集合进行选取运算,确保只把分别来自两个数据集合并且具有重叠部分的行合并在一起。连接的全部意义在于在水平方向上合并两个数据集合(通常是表),并产生一个新的结果集合,其方法是将一个数据源中的行于另一个数据源中和它匹配的行组合成一个新元组。
SQL提供了多种类型的连接方式,它们之间的区别在于:从相互交叠的不同数据集合中选择用于连接的行时所采用的方法不同。
连接类型   定义
内连接     只连接匹配的行
左外连接   包含左边表的全部行(不管右边的表中是否存在与它们匹配的行),以及右边表中全部匹配的行
右外连接   包含右边表的全部行(不管左边的表中是否存在与它们匹配的行),以及左边表中全部匹配的行
全外连接   包含左、右两个表的全部行,不管另外一边的表中是否存在与它们匹配的行。
交叉连接   生成笛卡尔积-它不使用任何匹配或者选取条件,而是直接将一个数据源中的每个行与另一个数据源的每个行都一一匹配


2.2 内连接(Inner Join)
内连接是最常见的一种连接,它页被称为普通连接,而E.FCodd最早称之为自然连接。
下面是ANSI SQL-92标准
select *
from  t_institution i
inner join t_teller t
on i.inst_no = t.inst_no
where i.inst_no = "5801"
其中inner可以省略。
等价于早期的连接语法
select *
from t_institution i, t_teller t
where i.inst_no = t.inst_no
and i.inst_no = "5801"

2.3 外连接
2.3.1左外连接(Left Outer Jion)
select *
from  t_institution i
left outer join t_teller t
on i.inst_no = t.inst_no
其中outer可以省略。

2.3.2右外连接(Rigt Outer Jion)
select *
from  t_institution i
right outer join t_teller t
on i.inst_no = t.inst_no

2.3.3 全外连接(Full Outer)
全外连接返回参与连接的两个数据集合中的全部数据,无论它们是否具有与之相匹配的行。在功能上,它等价于对这两个数据集合分别进行左外连接和右外连接,然后再使用消去重复行的并操作将上述两个结果集合并为一个结果集。
在现实生活中,参照完整性约束可以减少对于全外连接的使用,一般情况下左外连接就足够了。在数据库中没有利用清晰、规范的约束来防范错误数据情况下,全外连接就变得非常有用了,你可以使用它来清理数据库中的数据。
select *
from  t_institution i
full outer join t_teller t
on i.inst_no = t.inst_no


2.3.4外连接与条件配合使用
当在内连接查询中加入条件是,无论是将它加入到join子句,还是加入到where子句,其效果是完全一样的,但对于外连接情况就不同了。当把条件加入到 join子句时,SQL Server、Informix会返回外连接表的全部行,然后使用指定的条件返回第二个表的行。如果将条件放到where子句中,SQL Server将会首先进行连接操作,然后使用where子句对连接后的行进行筛选。下面的两个查询展示了条件放置位子对执行结果的影响:
条件在join子句
select *
from  t_institution i
left outer join t_teller t
on i.inst_no = t.inst_no
and i.inst_no = “5801”
结果是:
inst_no    inst_name            inst_no    teller_no  teller_name
5801       天河区               5801       0001       tom
5801       天河区               5801       0002       david
5802       越秀区
5803       白云区

条件在where子句
select *
from  t_institution i
left outer join t_teller t
on i.inst_no = t.inst_no
where i.inst_no = “5801”
结果是:
inst_no    inst_name         inst_no    teller_no  teller_name
5801       天河区               5801       0001       tom
5801       天河区               5801       0002       david

2.4 自身连接
自身连接是指同一个表自己与自己进行连接。这种一元连接通常用于从自反关系(也称作递归关系)中抽取数据。例如人力资源数据库中雇员与老板的关系。
下面例子是在机构表中查找本机构和上级机构的信息。
select s.inst_no superior_inst, s.inst_name sup_inst_name, i.inst_no, i.inst_name
from t_institution i
join t_institution s
on i.superior_inst = s.inst_no

结果是:
superior_inst sup_inst_name        inst_no    inst_name
800           广州市               5801       天河区
800           广州市               5802       越秀区
800           广州市               5803       白云区

2.5 交叉(无限制) 连接
交叉连接用于对两个源表进行纯关系代数的乘运算。它不使用连接条件来限制结果集合,而是将分别来自两个数据源中的行以所有可能的方式进行组合。数据集合中一的每个行都要与数据集合二中的每一个行分别组成一个新的行。例如,如果第一个数据源中有5个行,而第二个数据源中有4个行,那么在它们之间进行交叉连接就会产生20个行。人们将这种类型的结果集称为笛卡尔乘积。
大多数交叉连接都是由于错误操作而造成的;但是它们却非常适合向数据库中填充例子数据,或者预先创建一些空行以便为程序执行期间所要填充的数据保留空间。
select *
from  t_institution i
cross join t_teller t
在交叉连接中没有on条件子句

3 APPENDIX
3.1 A 参考资料与资源
       《Microsoft SQL Server 2000 Bile》Paul Nielsen
       Paul Nielsen的Web站点
www.isnotnull.com
3.2 注文章所有SQL在IBM Informix Dynamic Server Version 9.40.TC2E1测试通过
-- 表A记录如下:
aID        aNum
1           a20050111
2           a20050112
3           a20050113
4           a20050114
5           a20050115

表B记录如下:
bID        bName
1            2006032401
2           2006032402
3           2006032403
4           2006032404
8           2006032408


实验如下:
1.left join

sql语句如下:
select * from A
left join B
on A.aID = B.bID

结果如下:
aID        aNum                   bID           bName
1            a20050111         1               2006032401
2            a20050112         2              2006032402
3            a20050113         3              2006032403
4            a20050114         4              2006032404
5            a20050115         NULL       NULL
(所影响的行数为 5 行)

结果说明:
        left join是以A表的记录为基础的,A可以看成左表,B可以看成右表,left join是以左表为准的.
换句话说,左表(A)的记录将会全部表示出来,而右表(B)只会显示符合搜索条件的记录(例子中为: A.aID = B.bID).
B表记录不足的地方均为NULL.

2.right join

sql语句如下:
select * from A
right join B
on A.aID = B.bID

结果如下:
aID        aNum                   bID           bName
1            a20050111         1               2006032401
2            a20050112         2              2006032402
3            a20050113         3              2006032403
4            a20050114         4              2006032404
NULL    NULL                   8              2006032408
(所影响的行数为 5 行)

结果说明:
        仔细观察一下,就会发现,和left join的结果刚好相反,这次是以右表(B)为基础的,A表不足的地方用NULL填充.

3.inner join

sql语句如下:
select * from A
innerjoin B
on A.aID = B.bID

结果如下:
aID        aNum                   bID           bName
1            a20050111         1               2006032401
2            a20050112         2              2006032402
3            a20050113         3              2006032403
4            a20050114         4              2006032404

结果说明:很明显,这里只显示出了 A.aID = B.bID的记录.这说明inner join并不以谁为基础,它只显示符合条件的记录.

LEFT JOIN操作用于在任何的 FROM 子句中,组合来源表的记录。使用 LEFT JOIN 运算来创建一个左边外部联接。左边外部联接将包含了从第一个(左边)开始的两个表中的全部记录,即使在第二个(右边)表中并没有相符值的记录。

语法:FROM table1 LEFT JOIN table2 ON table1.field1 compopr table2.field2

说明:table1, table2参数用于指定要将记录组合的表的名称。field1, field2参数指定被联接的字段的名称。且这些字段必须有相同的数据类型及包含相同类型的数据,但它们不需要有相同的名称。
compopr参数指定关系比较运算符:"=", "<", ">", "<=", ">=" 或 "<>"。
如果在INNER JOIN操作中要联接包含Memo 数据类型或 OLE Object 数据类型数据的字段,将会发生错误。
分享到:
评论

相关推荐

    数据库关系代数练习习题.docx

    在关系代数中,我们可以使用多种操作符来进行数据的处理,例如选择、投影、连接、合并、分组、排序等。在以下习题中,我们将通过实践来熟悉关系代数的基本概念和操作。 1. 设有如图所示的关系 R、W 和 D,计算下列...

    关系代数解释器

    最后,“company”可能是包含示例数据的数据库文件,用于演示和实践关系代数操作。用户可以在这个数据库上执行各种查询,观察结果,以此来学习和验证他们对关系代数的理解。 总的来说,这个压缩包提供了一个完整的...

    关系代数表达式总结-数据库

    关系代数表达式是关系数据库管理系统中的一种重要的查询语言,它提供了一种将关系运算符组合成表达式的方法,以检索和操作关系数据库中的数据。关系代数表达式的优点是可以灵活地组合各种关系运算符,以满足不同类型...

    实现关系代数运算

    在SQL中,我们经常使用关系代数的概念来执行查询和数据操作。本篇文章将深入探讨关系代数运算在SQL中的应用及其重要性。 一、关系代数的基本概念 1. **关系**: 在数据库中,关系可以理解为一张二维表格,包含行...

    数据库中的关系代数表达式

    在数据库领域中,关系代数是一种处理关系数据库的数学理论,它提供了一系列操作符来帮助我们理解和执行对数据的操作。这些操作符可以分为两大类:一类是集合运算符,包括并、交、差;另一类是对关系的操作符,例如...

    关系代数运算与SQL查询的对应关系

    并集运算在关系代数中用于合并两个具有相同属性集的关系,结果包含所有出现在任一关系中的记录,且去除重复项。在SQL中,这对应于`UNION`操作符,例如: ```sql SELECT * FROM R UNION SELECT * FROM S; ``` 这里...

    sql查询语句——关系代数.pdf

    关系代数是由E.F.Codd于1970年提出的,是一种使用表和行来表示关系和实体的形式语言。在关系代数中,关系运算符有八种:选取、投影、笛卡尔积、并、交、差、连接和除。 1. 选取运算符:返回满足指定条件的行。 2. ...

    数据库关系代数表达式学习.doc

    关系代数表达式广泛应用于数据库查询、数据挖掘、数据仓库等领域。例如,检索选修课程名为 MATHS 的学生学号与姓名,可以使用关系代数表达式表示为 π SNO,SANME (σCNAME='MATHS'(SSCC))。 关系代数表达式是关系...

    CH2 关系模型与关系代数.rar_SEHL_SX8_关系模型与关系代数

    在“CH2 关系模型与关系代数.ppt”这个文件中,你可能会找到关于这两个主题的详细讲解,包括基本概念、操作符的使用示例以及如何将它们应用于实际数据库系统。这份文档对于学习和理解数据库理论,特别是对于SEHL SX8...

    大连理工数据库关系代数练习

    不使用聚集计算的运算符,使用关系代数表达式,如何得到最低的工资? 要找到最低工资而不使用聚集函数,可以通过对所有员工的工资进行排序并选择最小值来实现: ```sql SELECT MIN(sal) FROM ( SELECT sal FROM...

    数据库课程设计-关系代数表达式的优化算法

    在这个课程设计中,我们使用了Visual Studio 2008作为开发环境,通过编程实现对关系代数表达式的优化算法,以提高查询效率。 关系代数是一种形式化的查询语言,用于描述对关系数据库的操作。它包括基本操作如选择...

    超经典SQL关系代数笔试题

    SQL(Structured Query Language)是用于管理和操作数据库的强大工具,它基于关系代数理论,使得数据检索、更新和管理变得简洁高效。本主题聚焦于“超经典SQL关系代数笔试题”,意味着我们将探讨一些在面试中可能...

    C语言关系运算及关系代数PPT学习教案.pptx

    关系代数的运算可以组合使用,构建复杂的查询表达式,这使得它成为一个强大的工具,用于表达各种复杂的数据检索和更新需求。在实际的C语言编程中,虽然直接使用关系代数的机会不多,但理解其背后的理论对于设计和...

    关系数据库 --关系代数,关系演算.ppt

    在实际应用中,SQL(Structured Query Language)是关系数据库管理系统的标准查询语言,它结合了关系代数和关系演算的概念,使得用户可以方便地进行数据检索、更新和管理。 总之,关系数据库中的关系代数和关系演算...

    关系代数详细介绍,关系运算

    作为一种数学化的语言,关系代数提供了对关系数据进行操作的方法,使得用户可以通过定义运算符来实现数据的检索和处理。这种语言的主要特点是其表达能力强大,能够精确地表达用户的需求。 #### 二、关系代数的...

    理解数据库掌握关系代数共33页.pdf.zip

    本资料"理解数据库掌握关系代数共33页.pdf.zip"显然是一个深度探讨这两个主题的教程,旨在帮助学习者深入理解数据库的原理以及如何使用关系代数进行数据操作。 首先,我们需要了解数据库的基本概念。数据库是一个...

    关系代数全解(精编版).pdf

    关系代数是计算机科学领域中的一个重要分支,它是数据库查询语言的理论基础,同时也是关系模型的核心内容。关系代数的历史发源于1970年,当时E.F. Codd提出了关系模型的概念,为数据库领域带来了革命性的变革。在此...

    C语言关系运算及关系代数PPT课件.pptx

    关系代数中的表示通常使用关系名(如R、S),元组(t)、属性列(A)以及特定的符号来描述运算过程和结果。 总的来说,理解和掌握关系运算和关系代数对于设计和操作数据库至关重要,无论是进行简单的查询还是复杂的...

Global site tag (gtag.js) - Google Analytics