标准化表示从你的数据存储中移去数据冗余的过程。如果数据库设计达到了完全的标准化,则把所有的表通过关键字连接在一起时,不会出现任何数据的复本。标准化的优点是明显的,它避免了数据冗余,自然就节省了空间,也对数据的一致性提供了根本的保障,杜绝了数据不一致的现象,同时也提高了效率。
范式,是关系型数据库关系模式规范化的标准,从规范化的宽松到严格,分别为不同的范式,通常使用的有第一范式 (1NF) 、第二范式 (2NF) 、第三范式 (3NF) 等。
1NF :字段具有原子性 , 不可再分。(所有关系型数据库系统都满足第一范式)
2NF :对于具有组合关键字的表 . 不存在组合关键字中的任意字段决定其它非关键字字段的情况。
3NF :在 2N 的基础上 , 每一个非主属性既不部分依赖于码也不传递依赖于码 .
第一范式( 1NF )
第一范式是最低的规范化要求,第一范式要求数据表不能存在重复的记录,即存在一个关键字。 1NF 的第二个要求是每个字段都不可再分,即已经分到最小。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。
例如:
符合第一范式: 字段 1 、字段 2 、字段 3 、字段 4
不符合第一范式: 字段 1 、 字段 2 、字段 3 、字段 4 、字段 3.1 、字段 3.2
很显然,在当前的任何关系数据库管理系统( DBMS )中,也不可能做出不符合第一范式的数据库,因为这些 DBMS 不允许你把数据库表的一列再分成二列或多列。 1NF 是关系模式应具备的最起码的条件,如果数据库设计不能满足第一范式,就不称为关系型数据库。关系数据库设计研究的关系规范化是在 1NF 之上进行的。满足 1NF 的关系模式有许多不必要的重复值,并且增加了修改其数据时疏漏的可能性。为了避免这种数据冗余和更新数据的遗漏,就引出了第二范式( 2NF )。
第二范式( 2NF )
如果一个关系属于 1NF ,且所有的非主关键字段都完全地依赖于主关键字,则称之为第二范式。简单的说,第二范式要满足以下的条件:首先要满足第一范式,其次每个非主属性要完全函数依赖与候选键,或者是主键。也就是说,每个非主属性是由整个主键函数决定的,而不能由主键的一部分来决定。
例如:
选课关系表 SelectCourse 中包括字段 ( 学号 , 姓名 , 年龄 , 课程名称 , 成绩 , 学分 ) ,关键字为组合关键字 ( 学号 , 课程名称 ) ,此表存在的决定关系: ( 学号 , 课程名称 ) → ( 姓名 , 年龄 , 成绩 , 学分 )
,这个表是不满足第二范式的,因为存在如下决定关系:
( 课程名称 ) → ( 学分 )
( 学号 ) → ( 姓名 , 年龄 )
即存在组合关键字中的字段决定非关键字的情况。由于不符合 2NF ,这个选课关系表会存在如下问题:
(1) 数据冗余:同一门课程由 n 个学生选修, " 学分 " 就重复 n-1 次;同一个学生选修了 m 门课程,姓名和年龄就重复了 m-1 次。
(2) 更新异常:若调整了某门课程的学分,数据表中所有行的 " 学分 " 值都要更新,否则会出现同一门课程学分不同的情况。
(3) 插入异常:假设要增加一门新的课程,暂时还没有人选修。这样,由于还没有 " 学号 " 关键字 , 课程名称和学分也无法记录入数据库。
(4) 删除异常:假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。
如果把选课关系表改为如下三个表:
1 )学生: Student( 学号 , 姓名 , 年龄 ) ;
2 )课程: Course( 课程名称 , 学分 ) ;
3 )选课关系: SelectCourse( 学号 , 课程名称 , 成绩 ) 。
这样的数据库表是符合第二范式的,消除了数据冗余、更新异常、插入异常和删除异常。另外,所有单关键字的数据库表都符合第二范式,因为不可能存在组合关键字。
第三范式( 3NF )
如果一个关系属于 2NF ,且每个非关键字不传递依赖于主关键字,这种关系是 3NF 。
简单的说,第三范式要满足以下的条件:首先要满足第二范式,其次非主属性之间不存在函数依赖。由于满足了第二范式,表示每个非主属性都函数依赖于主键。如果非主属性之间存在了函数依赖,就会存在传递依赖,这样就不满足第三范式。
所谓传递函数依赖,指的是如果存在 "A → B → C" 的决定关系,则 C 传递函数依赖于 A 。因此,满足第三范·式的数据库表应该不存在依赖关系:关键字段 → 非关键字段 x→ 非关键字段 y 。
例如:
学生关系表 Student 中字段包括 ( 学号 , 姓名 , 年龄 , 所在学院 , 学院地点 , 学院电话 ) , 关键字为单一关键字 " 学号 " ,存在如下决定关系:
( 学号 ) → ( 姓名 , 年龄 , 所在学院 , 学院地点 , 学院电话 )
这个数据库是符合 2NF 的,但是不符合 3NF ,因为存在如下决定关系:
( 学号 ) → ( 所在学院 ) → ( 学院地点 , 学院电话 )
即存在非关键字段 " 学院地点 " 、 " 学院电话 " 对关键字段 " 学号 " 的传递函数依赖。它也会存在数据冗余、更新异常、插入异常和删除异常的情况。
如果把学生关系表分为如下两个表:
学生: ( 学号 , 姓名 , 年龄 , 所在学院 ) ;
学院: ( 学院 , 地点 , 电话 ) 。
这样的数据库表是符合第三范式的,消除了数据冗余、更新异常、插入异常和删除异常。
利弊
有一利必有一弊。它最大的不利是把信息放置在不同的表中,增加了操作的难度,同时把多个表连接在一起的花费也是巨大的。因为表和表的连接操作是做两个关系的笛卡儿积,必然会产生大量无用甚至无效的记录,性能的代价是巨大的。
规范化的优点也是明显的。避免了大量的数据冗余,节省了空间,保持了数据的一致性,如果完全达到 3NF ,就不会在超过一个地方更改同一个值。如果记录经常的改变,这个优点会超过所有可能的缺点!
即使花费很多的时间,作出一个完全规范化的数据库,它仍然不是完美的。规范化设计所带来的性能问题可能是无法承受的。如果出现这种情况,就要准备进行非规范化了。非规范化就是为了获得性能上的利益所进行的违反规范化规则的操作,不过大部分都与实际应用有关系,包括复制属性,复制外来关键字,表合并,表重新组合等等。 满足范式要求的数据库设计是结构清晰的,同时可避免数据冗余和操作异常。这并意味着不符合范式要求的设计一定是错误的,在数据库表中存在 1 : 1 或 1 : N 关系这种较特殊的情况下,合并导致的不符合范式要求反而是合理的。 总之,要学会根据实际的应用选择最有效的方法。
分享到:
相关推荐
数据库的三大范式是数据库设计的基本原则,它们旨在确保数据的规范化,避免数据冗余、更新异常、插入异常和删除异常等问题。以下是这三个范式的详细解释: 1. 第一范式(1NF):1NF 强调的是字段的原子性,即数据库...
### 数据库建表原则详解 #### 一、原始单据与实体之间的关系 在数据库设计过程中,原始单据与实体之间的关系是理解数据结构的基础。根据业务需求的不同,这种关系可以表现为一对一、一对多或者多对多的形式。最...
数据库三大范式详解 数据库范式1NF 2NF 3NF BCNF(实例) 设计范式(范式,数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式...
关系型数据库---第一范式 关系型数据库的理论是基于范式的概念,范式是指数据库设计中的一种规则,用于确保数据库的规范化和数据的一致性。第一范式(1NF)是关系型数据库设计理论中的一种规则,要求每个字段都是...
第三范式是在第二范式的基础上进一步确保数据库的正确性。它要求每个非主属性都直接依赖于主键,且不存在传递依赖。换言之,每个非主属性都必须直接依赖于主键,而不是通过其他非主属性间接依赖于主键。 例如,学生...
范式是一种衡量数据库设计质量的标准,常见的有第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。1NF要求每个字段都是原子性的,不可再分;2NF要求消除部分函数依赖,确保非主属性完全依赖于主键;3NF进一步要求...
数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的,同时,...第三范式:在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。
此文档是关于数据库三大范式的描述,以及在何种情况下应该用何种范式已达到数据库的良好效率!
这将涉及到数据库设计的范式理论,如第一范式(1NF)、第二范式(2NF)和第三范式(3NF),以及BCNF(Boyce-Codd范式)等,确保数据的规范化,减少数据冗余和提高数据一致性。 在实现这些功能时,你可能会用到JDBC...
3. 数据库设计:理解数据库设计的范式理论,如第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及BCNF(Boyce-Codd范式),确保数据的规范化,减少数据冗余和异常。 4. 数据库模型:探讨ER(实体-关系)模型,...
数据库范式化是数据库设计中保证数据关系清晰、降低数据冗余和提高数据一致性的过程。...通过阅读和实践本教程,读者可以对数据库结构有一个清晰的理解,并学会如何应用范式化原则来优化数据库设计。
3. **数据库设计**:涉及到数据库的概念设计和逻辑设计,包括需求分析、范式理论(第一范式到第三范式)和数据库规范化,以减少数据冗余和提高数据一致性。 4. **索引与性能优化**:学习如何通过创建索引来提高查询...
- 数据库设计原则:理解第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及BCNF(Boyce-Codd范式)。 - 正确处理冗余数据:避免数据冗余,减少更新异常和插入异常。 - 关系模型:理解实体、属性、键的概念,...
- 填空题考察了数据库的基本组成部分、数据库设计流程以及数据库范式。 - 解答题则通过实例分析了数据库的范式状态和规范化操作,以及SQL Server 2000在数据操作中的可能异常。 总结,SQL Server 2000数据库应用...
本文将从基本概念入手,逐步深入地探讨数据库三范式及其扩展至六范式的具体内容,帮助读者建立对这些概念的理解。 #### 一、基础概念 在正式介绍范式之前,我们需要了解几个关键术语: 1. **关系数据库**:通过二...
6. **数据库设计原则**:在设计数据库时,遵循一些基本原则至关重要,如范式理论(第一范式到第五范式)、最小冗余、数据完整性(实体完整性、参照完整性和用户定义的完整性)等。这些原则可以帮助我们创建高效、...
1. 数据库的三范式原则:理解第一范式(1NF)、第二范式(2NF)和第三范式(3NF),以及如何应用这些规则来减少数据冗余,提高数据完整性。 2. 关系数据库的规范化:学习如何将一个非规范化的数据库设计转化成规范...