今天在开发平台的时候又发现了数据库的问题!再次无语了一回!数据库的设计不仅仅是设计的方法方式的规范决定一切的,数据库的实用,和一再说过的数据冗余也是不可忽视的!
今天就特地在网上搜了下关于数据库范式的资料,整理如下,希望对大家有所帮助,也希望对我接下去的开发工作有所帮助!
简单说来,正规化就是在表格设计时,消除冗余性和不协调的从属关系。在本文中,我将通过五个渐进的过程来告诉你在设计中应该了解的正规化技巧。从而建立一个可行而且效率高的数据库。本文也会详细分析一下可以利用的关系类型。
这里假定我们要建立一个用户信息的表格,其中要存储用户的名字、公司、公司地址和一些个人的收藏夹或url。在开始时,你可能定义一个如下的表格结构:
零状态形式
users
name company company_address url1 url2
Joe ABC Work Lane abc.com xyz.com
Jill XYZ Job Street abc.com xyz.com
由于没有进行任何的正规化处理,我们将这种形式的表称为零状态形式的表。留意其中的url1和url2字段---如果我们在应用中需要第三个url呢?这样你就要在表格中多加一列,很明显,这不是一个好办法。如果你要创建一个富有扩展性的系统,你就要考虑使用第一个正规化的形式,并且应用到该表格中。
第一级正规化形式(第一范式)
1.消除每个表格中重复的组
2.为每套相关的数据建立一个独立的表格
3.使用一个主键来标识每套相关的数据
以上的表格明显违反了上面第一条的规定,那么第三条的主键又是什么意思呢?很简单,它只是在每个记录中加入一个唯一的、自动增加的整型值。通过这个值,就可以将两个姓名一样的记录区分开来。通过应用第一级正规化形式,我们得到了以下的表格:
users
userId name company company_address url
1 Joe ABC Work Lane abc.com
1 Joe ABC Work Lane xyz.com
2 Jill XYZ Job Street abc.com
2 Jill XYZ Job Street xyz.com
现在我们的表格可以说已经处在第一级正规化的形式了,它已经解决了url字段的限制问题,不过这样的处理后又带来了一个新的问题。每次在user表中插入一条记录的时候,我们都必须重复所有的公司和用户数据。这样不仅令数据库比以前大了,而且很容易出错。因此还要经过第二级正规化处理。
第二级正规化形式 (第二范式)
1.为应用在多条记录的字段建立独立的表格
2.通过一个foreign key来关联这些表格的值
我们将url的值放在一个独立的表格中,这样我们就可以在以后加入更多的数据,而无需担心产生重复的值。我们还通过主键值来关联这些字段:
users
userId name company company_address
1 Joe ABC Work Lane
2 Jill XYZ Job Street
urls
urlId relUserId url
1 1 abc.com
2 1 xyz.com
3 2 abc.com
4 2 xyz.com
如上所示,我们创建了独立的表格,users表中的主键userid现在与url表中的foreign key relUserId关联。现在的情况好象已经得到了明显的改善。不过,如果我们要为ABC公司加入一个员工记录呢?或者更多,200个?这样我们就必须重复使用公司名和地址,这明显不够冗余。因此我们将应用第三级正规化方法:
第三级正规化形式 (第三范式)
1.消除不依赖于该键的字段
公司名及地址与User Id都是没有关系的,因此它们应用拥有自己的公司Id:
users
userId name relCompId
1 Joe 1
2 Jill 2
companies
compId company company_address
1 ABC Work Lane
2 XYZ Job Street
urls
urlId relUserId url
1 1 abc.com
2 1 xyz.com
3 2 abc.com
4 2 xyz.com
这样我们就将companies表中的主键comId和users表中名字为relCompId的foreign key关联起来,就算为ABC公司加入200个员工,在companies中也只有一条记录。我们的users和urls表可以不断地扩大,而无需担心插入不必要的数据。大部分的开发者都认为经过三步的正规化就足够了,这个数据库的设计已经可以很方便地处理整个企业的负担,此看法在大多数的情况下是正确的。
我们可以留意一下url的字段--你注意到数据的冗余了吗?如果给用户用户输入这些url数据的HTML页面是一个文本框,可任意输入的话,这并没有问题,两个用户输入同样收藏夹的概率较少,不过,如果是通过一个下拉式的菜单,只让用户选择两个url输入,或者更多一点。这种情况下,我们的数据库还可以进行下一级别的优化--第四步,对于大多数的开发者来说,这一步都是忽略的,因为它要依赖一个很特别的关系--一个多对多的关系,这在我们的应用中是还没有遇到过的。
数据关系
在定义第四个正规化的形式前,我想首先提一下三种基本的数据关系:一对一,一对多和多对多。我们回头看一下经过第一个正规化的users表。要是我们将url的字段放在一个独立的表中,每次在users表中插入一个记录,我们就会在urls表中插入一行。我们将得到一个一对一的关系:用户表中的每一行,都将在urls表中找到相应的一行。对于我们的应用来说,这既不实用也不标准。
然后看看第二个正规化的例子。对于每个用户记录,我们的表格允许有多个urls的记录与之关联。这是一个一对多的关系,这是一个很常见的关系。
对于多对多的关系来说,就有点复杂了。在我们的第三个正规化形式的例子中,我们的一个用户与很多的url有关,而我们想将该结构变为允许多个用户与多个的urls有关,这样我们就可以得到一个多对多的结构。在讨论前,我们先看看表格结构会有些什么变化
users
userId name relCompId
1 Joe 1
2 Jill 2
companies
compId company company_address
1 ABC Work Lane
2 XYZ Job Street
urls
urlId url
1 abc.com
2 xyz.com
url_relations
relationId relatedUrlId relatedUserId
1 1 1
2 1 2
3 2 1
4 2 2
为了进一步减低数据的冗余,我们运用第四级正规化形式。我们创建了一个颇奇怪的url_relations表,里面的字段均为主键或者foreign key。通过这个表,我们就可以消除urls表中的重复项目。以下是第四个正规化形式的具体要求:
第四个正规化形式 (第四范式)
1.在一个多对多的关系中,独立的实体不能存放在同一个表格中
由于它仅应用于多对多的关系,因此大多数的开发者可以忽略这条规定。不过在某些情况下,它是非常实用的,这个例子就是这样,我们通过将相同的实体分离出来,并且将关系移到它们自己的表格中,从而改进了urls表格。
为了令你更容易明白,我们举个具体的例子,以下将用一个SQL语句选择出所有属于joe的urls:
SELECT name, url FROM users, urls, url_relations WHERE url_relations.relatedUserId = 1 AND users.userId = 1 AND urls.urlId = url_relations.relatedUrlId
如果我们想要遍历每个人的个人信息和url信息,我们可以这样做:
SELECT name, url FROM users, urls, url_relations WHERE users.userId = url_relations.relatedUserId AND urls.urlId = url_relations.relatedUrlId
第五级正规化形式 (第五范式)
还有一级正规化的形式,它并不常见,有点深奥,并且在大部分的情况下都是不必要的。它的原则是:
1.原来的表格必须可以通过由它分离出去的表格重新构建
使用这个规定的好处是,你可以确保不会在分离的表格中引入多余的列,所有你创建的表格结构都与它们的实际需要一样大。应用这条规定是一个好习惯,不过除非你要处理一个非常大型的数据,否则你将不需要用到它。
你可能想知道这些方法是从哪来的,前面三个正规化的规定是1972年,Dr. E.F. Codd在他的论文“进一步正规化数据库的关系模型中”提出的,其余的规定是经过后来的集合理论和关系数学家理论化的。 评论:正所谓物级必反,将表格分得过细有时并不好,因为这样需要将各表进行各种的关联,这会令查询时变得复杂,而且效率也可能降低,这些正规化的规定可以参考,在实际应用时,要根据项目的大小,必要时可以进行一些测试,以设计出更合理的表格结构。
分享到:
相关推荐
数据库三大范式详解 数据库范式1NF 2NF 3NF BCNF(实例) 设计范式(范式,数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式...
##### 第五范式(5NF)/BCNF(Bachman-Codd-Normal Form): 消除非平凡的函数依赖 - **前提条件**:符合4NF。 - **定义**:在符合4NF的基础上,消除所有非平凡的函数依赖,使得每一个决定因素都是候选码。 - **示例**:...
### 数据库中的范式理论详解 #### 一、范式理论概述 范式理论是数据库设计中的一个重要概念,主要用于指导数据库的设计与优化,确保数据的一致性和减少数据冗余。该理论最早由被称为“关系数据库之父”的E.F.Codd...
数据库设计三大范式五大约束 数据库设计是指对数据库的结构、数据模型和数据关系的设计和规划。好的数据库设计可以提高数据库的性能、安全性和可维护性。本文将对数据库设计三大范式和五大约束进行详细的介绍和分析...
五、第五范式(5NF,也称为投影-连接范式PJ/NF) 5NF是最高级别的范式,它要求消除投影-连接依赖。如果一个属性集可以被投影并连接得到,那么这个属性集应该被拆分为单独的表。5NF旨在减少冗余数据,使得数据库结构...
数据库五大约束 数据库约束是对数据的限制和规则,目的是确保数据的一致性和正确性。数据库的五大约束分别是 PRIMARY KEY、UNIQUE、DEFAULT、NOT NULL 和 FOREIGN KEY。 PRIMARY KEY PRIMARY KEY 是设置主键约束...
除了上述三个最常用的范式,还有第四范式(4NF)和第五范式(5NF),它们分别对应多值依赖和投影依赖,主要应用于更复杂的数据结构和更高的数据规范化需求。在实际应用中,大多数数据库设计只需要满足3NF即可保证...
数据库表的设计是否应该遵从五大范式
数据库设计三大范式(重点): 第一范式(1NF):数据表中的每一列(每个字段)必须是不可拆分的小单元,也是确保每一列的原子性; 例如:userInfo:山东省烟台市 131777368781 userAds:山东0省烟台市 ...
文章中的一些概念候选码主属性函数依赖完全函数依赖部分函数依赖传递函数依赖什么是范式范式的分类第一范式(1NF)第二范式(2NF)第三范式(3NF)巴斯-科德范式(BCNF)第四范式(4NF)第五范式(5NF) 文章中的...
第五范式(5NF)要求一个数据库表中不包含连接依赖。 数据库设计中,数据库范式是指数据库设计所需要满足的标准,满足这些标准的数据库是简洁的结构明晰的,同时,不会发生插入、删除和更新操作异常。反之,则是...
数据库设计的三大范式——第一范式(1NF)、第二范式(2NF)和第三范式(3NF)——是构建高效、无冗余、易于维护的数据库的基础。它们确保了数据的一致性和完整性,避免了数据异常,如插入异常、删除异常和更新异常...
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,也称完美范式)。 第一范式(1NF)是指每一列的值的原子性、不可分割性...
关系数据库的范式分为六个级别:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。以下是对这三个基本范式的详细解释: 1. **第一范式(1NF)**:1NF 是最...
范式是关系数据库设计的准则,分为六个级别:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF,也称投影联接范式)和第六范式(6NF)。1NF要求每一列不可分割,2NF要求消除部分...
不过,实际应用中,可能还需要考虑更高的范式,如第四范式(4NF)和第五范式(5NF),以进一步消除多值依赖和函数依赖,但这通常需要根据具体业务需求来平衡规范化和性能之间的关系。在设计数据库时,理解并应用这些...
第五范式(5NF):消除循环依赖。例如,循环依赖就如其名,是一个个闭环的依赖系统。A 依赖于 B,B 依赖于 C,C 依赖于 A。 在实际操作中,我们需要根据具体情况选择合适的范式,来满足性能要求和存储空间的需求。...
- 这些实例可能涉及数据库设计的基本原则,如范式理论(第一范式到第三范式),以确保数据的规范化,避免数据冗余和不一致性。 4. **索引与查询优化**: - 学习如何通过创建索引来提高查询性能,如B树索引、哈希...
关系数据库的范式分为六个级别:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。这些范式按照递增的复杂性和规范性进行排序,通常在实际应用中,满足第三...
本压缩包文件包含了五套数据库复习试题,旨在帮助学习者巩固和加深对数据库理论及实践的理解。下面将对这些试题可能涉及的知识点进行详细的阐述。 1. 数据库基本概念: - 数据库(Database):一个组织有序的数据...