数据库设计正规化的五大范式

chenqian

浏览: 79455 次
性别:
来自: 湘潭

最近访客更多访客>>

ncs123

xjk112

niu870781892

ykdsg

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

database

数据结构企业应用 SQL 活动 F#

第一范式：

对于表中的每一行，必须且仅仅有唯一的行值.在一行中的每一列仅有唯一的值并且具有原子性.

（第一范式是通过把重复的组放到每个独立的表中，把这些表通过一对多关联联系起来这种方式来消除重复组的。）

第二范式：

第二范式要求非主键列是主键的子集，非主键列活动必须完全依赖整个主键。主键必须有唯一性的元素,一个主键可以由一个或更多的组成唯一值的列组成。一旦创建，主键无法改变，外键关联一个表的主键。主外键关联意味着一对多的关系.

（第二范式处理冗余数据的删除问题。当某张表中的信息依赖于该表中其它的不是主键部分的列的时候，通常会违反第二范式。）

第三范式：

第三范式要求非主键列互不依赖.

（第三范式规则查找以消除没有直接依赖于第一范式和第二范式形成的表的主键的属性。我们为没有与表的主键关联的所有信息建立了一张新表。每张新表保存了来自源表的信息和它们所依赖的主键。）

第四范式：

第四范式禁止主键列和非主键列一对多关系不受约束

（）

第五范式：

第五范式将表分割成尽可能小的块，为了排除在表中所有的冗余.
（）

在数据库设计时，大家应该时刻的注意到这几个范式。其中第五范式是最难实现的。但是，还是需要尽量的去实现这些功能。

通俗实例

简单说来，正规化就是在表格设计时，消除冗余性和不协调的从属关系。在本文中，我将通过五个渐进的过程来告诉你在设计中应该了解的正规化技巧。从而建立一个可行而且效率高的数据库。本文也会详细分析一下可以利用的关系类型。

　　这里假定我们要建立一个用户信息的表格，其中要存储用户的名字、公司、公司地址和一些个人的收藏夹或url。在开始时，你可能定义一个如下的表格结构：

零状态形式

users

name company company_address url1 url2

Joe ABC 1 Work Lane abc.com xyz.com

Jill XYZ 1 Job Street abc.com xyz.com

　　由于没有进行任何的正规化处理，我们将这种形式的表称为零状态形式的表。留意其中的url1和url2字段---如果我们在应用中需要第三个url呢？这样你就要在表格中多加一列，很明显，这不是一个好办法。如果你要创建一个富有扩展性的系统，你就要考虑使用第一个正规化的形式，并且应用到该表格中。

第一级正规化形式

1．消除每个表格中重复的组

2．为每套相关的数据建立一个独立的表格

3．使用一个主键来标识每套相关的数据

　　以上的表格明显违反了上面第一条的规定，那么第三条的主键又是什么意思呢？很简单，它只是在每个记录中加入一个唯一的、自动增加的整型值。通过这个值，就可以将两个姓名一样的记录区分开来。通过应用第一级正规化形式，我们得到了以下的表格：

users

userId name company company_address url

1 Joe ABC 1 Work Lane abc.com

1 Joe ABC 1 Work Lane xyz.com

2 Jill XYZ 1 Job Street abc.com

2 Jill XYZ 1 Job Street xyz.com

　　现在我们的表格可以说已经处在第一级正规化的形式了，它已经解决了url字段的限制问题，不过这样的处理后又带来了一个新的问题。每次在user表中插入一条记录的时候，我们都必须重复所有的公司和用户数据。这样不仅令数据库比以前大了，而且很容易出错。因此还要经过第二级正规化处理。

第二级正规化形式

1．为应用在多条记录的字段建立独立的表格

2．通过一个foreign key来关联这些表格的值

　　我们将url的值放在一个独立的表格中，这样我们就可以在以后加入更多的数据，而无需担心产生重复的值。我们还通过主键值来关联这些字段：

users

userId name company company_address

1 Joe ABC 1 Work Lane

2 Jill XYZ 1 Job Street

urls

urlId relUserId url

1 1 abc.com

2 1 xyz.com

3 2 abc.com

4 2 xyz.com

　　如上所示，我们创建了独立的表格，users表中的主键userid现在与url表中的foreign key relUserId关联。现在的情况好象已经得到了明显的改善。不过，如果我们要为ABC公司加入一个员工记录呢？或者更多，200个？这样我们就必须重复使用公司名和地址，这明显不够冗余。因此我们将应用第三级正规化方法：

第三级正规化形式

1．消除不依赖于该键的字段

公司名及地址与User Id都是没有关系的，因此它们应用拥有自己的公司Id：

users

userId name relCompId

1 Joe 1

2 Jill 2

companies

compId company company_address

1 ABC 1 Work Lane

2 XYZ 1 Job Street

urls

urlId relUserId url

1 1 abc.com

2 1 xyz.com

3 2 abc.com

4 2 xyz.com

　　这样我们就将companies表中的主键comId和users表中名字为relCompId的foreign key关联起来，就算为ABC公司加入200个员工，在companies中也只有一条记录。我们的users和urls表可以不断地扩大，而无需担心插入不必要的数据。大部分的开发者都认为经过三步的正规化就足够了，这个数据库的设计已经可以很方便地处理整个企业的负担，此看法在大多数的情况下是正确的。

　　我们可以留意一下url的字段--你注意到数据的冗余了吗？如果给用户用户输入这些url数据的HTML页面是一个文本框，可任意输入的话，这并没有问题，两个用户输入同样收藏夹的概率较少，不过，如果是通过一个下拉式的菜单，只让用户选择两个url输入，或者更多一点。这种情况下，我们的数据库还可以进行下一级别的优化--第四步，对于大多数的开发者来说，这一步都是忽略的，因为它要依赖一个很特别的关系--一个多对多的关系，这在我们的应用中是还没有遇到过的。

数据关系

　　在定义第四个正规化的形式前，我想首先提一下三种基本的数据关系：一对一，一对多和多对多。我们回头看一下经过第一个正规化的users表。要是我们将url的字段放在一个独立的表中，每次在users表中插入一个记录，我们就会在urls表中插入一行。我们将得到一个一对一的关系：用户表中的每一行，都将在urls表中找到相应的一行。对于我们的应用来说，这既不实用也不标准。

　　然后看看第二个正规化的例子。对于每个用户记录，我们的表格允许有多个urls的记录与之关联。这是一个一对多的关系，这是一个很常见的关系。

　　对于多对多的关系来说，就有点复杂了。在我们的第三个正规化形式的例子中，我们的一个用户与很多的url有关，而我们想将该结构变为允许多个用户与多个的urls有关，这样我们就可以得到一个多对多的结构。在讨论前，我们先看看表格结构会有些什么变化

users

userId name relCompId

1 Joe 1

2 Jill 2

companies

compId company company_address

1 ABC 1 Work Lane

2 XYZ 1 Job Street

urls

urlId url

1 abc.com

2 xyz.com

url_relations

relationId relatedUrlId relatedUserId

1 1 1

2 1 2

3 2 1

4 2 2

　　为了进一步减低数据的冗余，我们运用第四级正规化形式。我们创建了一个颇奇怪的url_relations表，里面的字段均为主键或者foreign key。通过这个表，我们就可以消除urls表中的重复项目。以下是第四个正规化形式的具体要求：

第四个正规化形式

1．在一个多对多的关系中，独立的实体不能存放在同一个表格中

　　由于它仅应用于多对多的关系，因此大多数的开发者可以忽略这条规定。不过在某些情况下，它是非常实用的，这个例子就是这样，我们通过将相同的实体分离出来，并且将关系移到它们自己的表格中，从而改进了urls表格。

为了令你更容易明白，我们举个具体的例子，以下将用一个SQL语句选择出所有属于joe的urls：

SELECT name, url FROM users, urls, url_relations WHERE url_relations.relatedUserId = 1 AND users.userId = 1 AND urls.urlId = url_relations.relatedUrlId

如果我们想要遍历每个人的个人信息和url信息，我们可以这样做：

SELECT name, url FROM users, urls, url_relations WHERE users.userId = url_relations.relatedUserId AND urls.urlId = url_relations.relatedUrlId

第五级正规化形式

还有一级正规化的形式，它并不常见，有点深奥，并且在大部分的情况下都是不必要的。它的原则是：

1．原来的表格必须可以通过由它分离出去的表格重新构建

　　使用这个规定的好处是，你可以确保不会在分离的表格中引入多余的列，所有你创建的表格结构都与它们的实际需要一样大。应用这条规定是一个好习惯，不过除非你要处理一个非常大型的数据，否则你将不需要用到它。

　　希望这篇文章对你有用，并且可以帮助你在所有的项目中应用这些正规化的规定。你可能想知道这些方法是从哪来的，我可以告诉你，前面三个正规化的规定是1972年，Dr. E.F. Codd在他的论文“进一步正规化数据库的关系模型中”提出的，其余的规定是经过后来的集合理论和关系数学家理论化的。评论：正所谓物级必反，将表格分得过细有时并不好，因为这样需要将各表进行各种的关联，这会令查询时变得复杂，而且效率也可能降低，这些正规化的规定可以参考，在实际应用时，要根据项目的大小，必要时可以进行一些测试，以设计出更合理的表格结构。

分享到：

hibernate缓存介绍 | Spring 2.X 中AOP的使用浅析

2008-09-24 15:50
浏览 830
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论