数据库设计的范式大纲
第一范式:
对于表中的每一行,必须且仅仅有唯一的行值.
在一行中的每一列仅有唯一的值并且具有原子性.
第二范式:
第二范式要求非主键列是主键的子集,非主键列活动必须完全依赖整个主键。主键必须有唯一性的元素,
一个主键可以由一个或更多的组成唯一值的列组成。一旦创建,主键无法改变,外键关联一个表的主键。主外键关联意味着一对多的关系.
第三范式:
第三范式要求非主键列互不依赖.
第四范式:
第四范式禁止主键列和非主键列一对多关系不受约束
第五范式:
第五范式将表分割成尽可能小的块,为了排除在表中所有的冗余.
下面先讨论前3
个范式:
引言
数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入
(insert
)、删除(delete
)和更新(update
)操作异常。反之则是乱七八糟,不仅给数据库的编程人员制造麻烦,而且面目可憎,可能存储了 大量不需要的冗余信息。
设计范式是不是很难懂呢?非也,大学教材上给我们一堆数学公式我们当然看不懂,也记不住。所以我们很多人就根本不按照范式来设计数据库。
实质上,设计范式用很形象、很简洁的话语就能说清楚,道明白。本文将对范式进行通俗地说明,并以笔者曾经设计的一个简单论坛的数据库为例来讲解怎样将这些范式应用于实际工程。
范式说明
第一范式(1NF
):数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。
例如,如下的数据库表是符合第一范式的:
而这样的数据库表是不符合第一范式的:
字段1
|
字段2
|
字段3
|
字段4
|
|
|
字段3.1
|
字段3.2
|
|
<!---->
|
|
|
|
|
<!---->
很显然,在当前的任何关系数据库管理系统(DBMS
)中,傻瓜也不可能做出不符合第一范式的数据库,因为这些DBMS
不允许你把数据库表的一列再分成二列或多列。因此,你想在现有的DBMS
中设计出不符合第一范式的数据库都是不可能的。
第二范式(2NF
):数据库表中不存在非关键字段对任一候选关键字段的部分函数依赖(部分函数依赖指的是存在组合关键字中的某些字段决定非关键字段的情况),也即所有非关键字段都完全依赖于任意一组候选关键字。
假定选课关系表为SelectCourse(
学号,
姓名,
年龄,
课程名称,
成绩,
学分)
,关键字为组合关键字(
学号,
课程名称)
,因为存在如下决定关系:
(
学号,
课程名称) → (
姓名,
年龄,
成绩,
学分)
这个数据库表不满足第二范式,因为存在如下决定关系:
(
课程名称) → (
学分)
(
学号) → (
姓名,
年龄)
即存在组合关键字中的字段决定非关键字的情况。
由于不符合2NF
,这个选课关系表会存在如下问题:
(1)
数据冗余:
同一门课程由n
个学生选修,"
学分"
就重复n-1
次;同一个学生选修了m
门课程,姓名和年龄就重复了m-1
次。
(2)
更新异常:
若调整了某门课程的学分,数据表中所有行的"
学分"
值都要更新,否则会出现同一门课程学分不同的情况。
(3)
插入异常:
假设要开设一门新的课程,暂时还没有人选修。这样,由于还没有"
学号"
关键字,课程名称和学分也无法记录入数据库。
(4)
删除异常:
假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。
把选课关系表SelectCourse
改为如下三个表:
学生:Student(
学号,
姓名,
年龄)
;
课程:Course(
课程名称,
学分)
;
选课关系:SelectCourse(
学号,
课程名称,
成绩)
。
这样的数据库表是符合第二范式的,消除了数据冗余、更新异常、插入异常和删除异常。
另外,所有单关键字的数据库表都符合第二范式,因为不可能存在组合关键字。
第三范式(3NF
):在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。所谓传递函数依赖,指的是如
果存在"A → B → C"
的决定关系,则C
传递函数依赖于A
。因此,满足第三范式的数据库表应该不存在如下依赖关系:
关键字段 →
非关键字段x →
非关键字段y
假定学生关系表为Student(
学号,
姓名,
年龄,
所在学院,
学院地点,
学院电话)
,关键字为单一关键字"
学号"
,因为存在如下决定关系:
(
学号) → (
姓名,
年龄,
所在学院,
学院地点,
学院电话)
这个数据库是符合2NF
的,但是不符合3NF
,因为存在如下决定关系:
(
学号) → (
所在学院) → (
学院地点,
学院电话)
即存在非关键字段"
学院地点"
、"
学院电话"
对关键字段"
学号"
的传递函数依赖。
它也会存在数据冗余、更新异常、插入异常和删除异常的情况,读者可自行分析得知。
把学生关系表分为如下两个表:
学生:(
学号,
姓名,
年龄,
所在学院)
;
学院:(
学院,
地点,
电话)
。
这样的数据库表是符合第三范式的,消除了数据冗余、更新异常、插入异常和删除异常。
鲍依斯-
科得范式(BCNF
):在第三范式的基础上,数据库表中如果不存在任何字段对任一候选关键字段的传递函数依赖则符合第三范式。
假设仓库管理关系表为StorehouseManage(
仓库ID,
存储物品ID,
管理员ID,
数量)
,且有一个管理员只在一个仓库工作;一个仓库可以存储多种物品。这个数据库表中存在如下决定关系:
(
仓库ID,
存储物品ID) →(
管理员ID,
数量)
(
管理员ID,
存储物品ID) → (
仓库ID,
数量)
所以,(
仓库ID,
存储物品ID)
和(
管理员ID,
存储物品ID)
都是StorehouseManage
的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。但是,由于存在如下决定关系:
(
仓库ID) → (
管理员ID)
(
管理员ID) → (
仓库ID)
即存在关键字段决定关键字段的情况,所以其不符合BCNF
范式。它会出现如下异常情况:
(1)
删除异常:
当仓库被清空后,所有"
存储物品ID"
和"
数量"
信息被删除的同时,"
仓库ID"
和"
管理员ID"
信息也被删除了。
(2)
插入异常:
当仓库没有存储任何物品时,无法给仓库分配管理员。
(3)
更新异常:
如果仓库换了管理员,则表中所有行的管理员ID
都要修改。
把仓库管理关系表分解为二个关系表:
仓库管理:StorehouseManage(
仓库ID,
管理员ID)
;
仓库:Storehouse(
仓库ID,
存储物品ID,
数量)
。
这样的数据库表是符合BCNF
范式的,消除了删除异常、插入异常和更新异常。
范式应用
我们来逐步搞定一个论坛的数据库,有如下信息:
(1
) 用户:用户名,email
,主页,电话,联系地址
(2
) 帖子:发帖标题,发帖内容,回复标题,回复内容
第一次我们将数据库设计为仅仅存在表:
用户名
|
email
|
主页
|
电话
|
联系地址
|
发帖标题
|
发帖内容
|
回复标题
|
回复内容
|
这个数据库表符合第一范式,但是没有任何一组候选关键字能决定数据库表的整行,唯一的关键字段用户名也不能完全决定整个元组。我们需要增加"
发帖ID"
、"
回复ID"
字段,即将表修改为:
用户名
|
email
|
主页
|
电话
|
联系地址
|
发帖ID
|
发帖标题
|
发帖内容
|
回复ID
|
回复标题
|
回复内容
|
这样数据表中的关键字(
用户名,发帖ID
,回复ID)
能决定整行:
(
用户名,
发帖ID,
回复ID) → (email,
主页,
电话,
联系地址,
发帖标题,
发帖内容,
回复标题,
回复内容)
但是,这样的设计不符合第二范式,因为存在如下决定关系:
(
用户名) → (email,
主页,
电话,
联系地址)
(
发帖ID) → (
发帖标题,
发帖内容)
(
回复ID) → (
回复标题,
回复内容)
即非关键字段部分函数依赖于候选关键字段,很明显,这个设计会导致大量的数据冗余和操作异常。
我们将数据库表分解为(带下划线的为关键字):
(1
) 用户信息:用户名,email
,主页,电话,联系地址
(2
) 帖子信息:发帖ID
,标题,内容
(3
) 回复信息:回复ID
,标题,内容
(4
) 发贴:用户名,发帖ID
(5
) 回复:发帖ID
,回复ID
这样的设计是满足第1
、2
、3
范式和BCNF
范式要求的,但是这样的设计是不是最好的呢?
不一定。
观察可知,第4
项"
发帖"
中的"
用户名"
和"
发帖ID"
之间是1
:N
的关系,因此我们可以把"
发帖"
合并到第2
项的"
帖子信息"
中;第5
项"
回复"
中的 "
发帖ID"
和"
回复ID"
之间也是1
:N
的关系,因此我们可以把"
回复"
合并到第3
项的"
回复信息"
中。这样可以一定量地减少数据冗余,新的设计为:
(1
) 用户信息:用户名,email
,主页,电话,联系地址
(2
) 帖子信息:用户名,发帖ID
,标题,内容
(3
) 回复信息:发帖ID
,回复ID
,标题,内容
数据库表1
显然满足所有范式的要求;
数据库表2
中存在非关键字段"
标题"
、"
内容"
对关键字段"
发帖ID"
的部分函数依赖,即不满足第二范式的要求,但是这一设计并不会导致数据冗余和操作异常;
数据库表3
中也存在非关键字段"
标题"
、"
内容"
对关键字段"
回复ID"
的部分函数依赖,也不满足第二范式的要求,但是与数据库表2
相似,这一设计也不会导致数据冗余和操作异常。
由此可以看出,并不一定要强行满足范式的要求,对于1
:N
关系,当1
的一边合并到N
的那边后,N
的那边就不再满足第二范式了,但是这种设计反而比较好!
对于M
:N
的关系,不能将M
一边或N
一边合并到另一边去,这样会导致不符合范式要求,同时导致操作异常和数据冗余。
对于1
:1
的关系,我们可以将左边的1
或者右边的1
合并到另一边去,设计导致不符合范式要求,但是并不会导致操作异常和数据冗余。
结论
满足范式要求的数据库设计是结构清晰的,同时可避免数据冗余和操作异常。这并意味着不符合范式要求的设计一定是错误的,在数据库表中存在1
:1
或1
:N
关系这种较特殊的情况下,合并导致的不符合范式要求反而是合理的。
在我们设计数据库的时候,一定要时刻考虑范式的要求。
url:http://www.blogjava.net/DenisLing/archive/2005/12/20/24725.html
分享到:
相关推荐
此外,还会讲解数据库设计的基本原则,如范式理论,包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF)和BCNF(Boyce-Codd范式)。 3. **SQL语言**:SQL(结构化查询语言)是用于管理和处理关系数据库的标准...
通过实例练习,学生将理解并应用关系型数据库的范式理论,提高设计规范化数据库的能力。掌握这些设计技能是高效管理和维护数据库的前提。 ### 数据定义 在数据库设计之后,课程会讲解数据定义的核心内容。这部分...
2011年的计算机四级数据库工程师考试大纲涵盖了数据库技术的多个核心领域,旨在评估考生对数据库理论、设计、管理及最新技术的掌握程度。以下是大纲中的主要知识点详解: 1. **基本概念与原理**:这部分要求考生...
总的来说,数据库课程设计是一个综合性的实践项目,它涵盖了数据库理论、软件工程、编程等多个领域的知识,旨在通过实际操作训练,提高学生的数据库应用能力和软件开发水平。通过这门课程,学生不仅能够巩固理论知识...
全国计算机等级考试四级数据库工程师是一项针对高级数据库管理与设计能力的认证考试,旨在评估考生对数据库理论、设计、实现及管理的深入理解。本压缩包包含的资源是备考这一考试的重要参考资料,包括了考试大纲、...
- **关系数据模型**是数据库设计的基础,通过表格形式组织数据,每个表格称为一个关系。关系模型由关系、元组、属性等元素构成。 ### Visual C++与数据库交互 #### 1. ODBC技术 - **ODBC**(Open Database ...
在这个“数据库管理大纲.ppt”中,我们可以期待深入探讨以下几个关键知识点: 1. **数据库概念**:首先,我们会理解数据库的基本定义,包括它的功能、类型和重要性。数据库不仅仅是存储数据的地方,更是管理和控制...
复习大纲可能包括关系数据库理论、数据库管理系统、SQL语言、数据库设计原则(如第三范式、BCNF)、数据库性能优化方法(如索引、查询优化)等内容。 4. **课件**:课件是教师授课时的辅助材料,通常包含详细的讲解...
在这一部分,课程将着重讲解如何进行逻辑设计和物理设计,掌握范式理论以减少数据冗余,优化索引设计,以及采取性能优化策略,从而确保数据库系统的高效运行。 在关系数据库管理系统(RDBMS)的讨论中,课程将以...
【数据库开发与应用实习大纲及指导书】 本实习大纲针对的是《数据库开发与应用》这门课程,适用于地理信息系统专业的学生,通常在第六学期进行,是一次为期两周的生产实习,可获得2个学分。实习的目标是让学生将...
4. 第四章:讨论范式理论,如第一范式到第三范式,属性闭包计算,函数依赖的概念,候选键的确定,无损连接以及保持函数依赖,这些是数据库设计的关键。 5. 第五章:混合题型,全面测试前面章节的知识点。 6. 第六章...
1. 实习实例:每个小组需选择一个不同的实例进行开发,避免重复。 2. 实例描述:以《学生档案管理系统》为例,这个系统旨在记录大学生从入学到毕业的全部档案信息,包括个人信息、学业成绩、鉴定和奖惩等多方面内容...
1. 实例选择:学生以小组为单位,从提供的多个实例中选择一个(各组不得重复选择)。 2. 实例描述:根据实习给出的实例需求,进行详细描述。如“学生档案管理系统”实例,旨在为大学生建立从入学注册到毕业离校的...
8. **实例分析**:“广告业务管理系统”是一个具体的应用案例,它利用数据库技术优化广告行业的运作,提供精细化服务,提升业务效率,适应信息化建设的需求。在Web2.0时代,这个系统对于管理和分析网络新媒体广告...
《数据库原理》课程教学大纲主要涵盖了数据库的基础理论、设计方法和高级技术,旨在使学生掌握数据库的核心概念和实用技能。课程分为设计篇、实现篇和高级数据库技术篇。 设计篇重点讲解数据库设计的基本原理,包括...
《网络数据库技术》教学大纲 课程编号:EE3221152 课程名称:网络数据库技术 英文名称:Network Database and Its Application 学时: 38+8 学分:3 课程类型:限选 课程性质:专业课 适用专业:电院各专业 先修...
这一章是后续学习的基础,要求学生理解数据库技术的历史和发展背景。 2. **关系数据库**:讲解关系模型,包括关系数据结构、关系的完整性(如实体完整性、参照完整性和用户定义完整性)以及关系代数。关系代数是本...
1. **实例选择**:学生以小组形式选取并完成一个实例,如《学生档案管理系统》,该系统需记录学生从入学到毕业的各类信息。 2. **建模要求**:使用第三范式(3NF)进行数据库规范化处理,设计E-R模型,然后转换为...
6. **数据库技术及应用1.docx**:与前一个文件类似,这可能是另一份课程资料,可能详细讨论了数据库设计原则、数据库性能优化、并发控制和安全性。 7. **应用题1.docx**:这可能是数据库课程中的练习题或案例分析,...
数据库原理与应用技术是计算机科学领域的一个核心课程,它涵盖了数据存储、管理和检索的基本理论以及实际操作技巧。这个课程由苗雪兰教授讲授,并提供了电子教案,旨在帮助学生深入理解数据库系统的运作机制和实际...