理解数据库范式
系统是短暂的
数据是永恒的
数 据库范式是数据库设计中必不可少的知识,没有对范式的理解,就无法设计出高效率、优雅的数据库。甚至设计出错误的数据库。而想要理解并掌握范式却并不是那 么容易。教科书中一般以关系代数的方法来解释数据库范式。这样做虽然能够十分准确的表达数据库范式,但比较抽象,不太直观,不便于理解,更难以记忆。
本 文用较为直白的语言介绍范式,旨在便于理解和记忆,这样做可能会出现一些不精确的表述。但对于初学者应该是个不错的入门。我写下这些的目的主要是为了加强 记忆,其实我也比较菜,我希望当我对一些概念生疏的时候,回过头来看看自己写的笔记,可以快速地进入状态。如果你发现其中用错误,请指正。
下面开始进入正题:
一、基础概念
要理解范式,首先必须对知道什么是关系数据库,如果你不知道,我可以简单的不能再简单的说一下:关系数据库就是用二维表来保存数据。表和表之间可以……(省略10W字)。
然后你应该理解以下概念:
实体:现实世界中客观存在并可以被区别的事物。比如“一个学生”、“一本书”、“一门课”等等。值得强调的是这里所说的“事物”不仅仅是看得见摸得着的“东西”,它也可以是虚拟的,不如说“老师与学校的关系”。
属性:教科书上解释为:“实体所具有的某一特性”,由此可见,属性一开始是个逻辑概念,比如说,“性别”是“人”的一个属性。在关系数据库中,属性又是个物理概念,属性可以看作是“表的一列”。
元组:表中的一行就是一个元组。
分量:元组的某个属性值。在一个关系数据库中,它是一个操作原子,即关系数据库在做任何操作的时候,属性是“不可分的”。否则就不是关系数据库了。
码:表中可以唯一确定一个元组的某个属性(或者属性组),如果这样的码有不止一个,那么大家都叫候选码,我们从候选码中挑一个出来做老大,它就叫主码。
全码:如果一个码包含了所有的属性,这个码就是全码。
主属性:一个属性只要在任何一个候选码中出现过,这个属性就是主属性。
非主属性:与上面相反,没有在任何候选码中出现过,这个属性就是非主属性。
外码:一个属性(或属性组),它不是码,但是它别的表的码,它就是外码。
二、6个范式
好了,上面已经介绍了我们掌握范式所需要的全部基础概念,下面我们就来讲范式。首先要明白,范式的包含关系。一个数据库设计如果符合第二范式,一定也符合第一范式。如果符合第三范式,一定也符合第二范式…
第一范式(1NF):属性不可分。
在前面我们已经介绍了属性值的概念,我们说,它是“不可分的”。而第一范式要求属性也不可分。那么它和属性值不可分有什么区别呢?给一个例子:
name
|
tel
|
age
|
大宝
|
13612345678
|
22
|
小明
|
13988776655
|
010-1234567
|
21
|
|
|
|
|
Ps:这个表中,属性值“分”了。
name
|
tel
|
age
|
手机
|
座机
|
大宝
|
13612345678
|
021-9876543
|
22
|
小明
|
13988776655
|
010-1234567
|
21
|
Ps:这个表中,属性 “分”了。
这两种情况都不满足第一范式。不满足第一范式的数据库,不是关系数据库!所以,我们在任何关系数据库管理系统中,做不出这样的“表”来。
第二范式(2NF):符合1NF,并且,非主属性完全依赖于码。
听起来好像很神秘,其实真的没什么。
一 个候选码中的主属性也可能是好几个。如果一个主属性,它不能单独做为一个候选码,那么它也不能确定任何一个非主属性。给一个反例:我们考虑一个小学的教务 管理系统,学生上课指定一个老师,一本教材,一个教室,一个时间,大家都上课去吧,没有问题。那么数据库怎么设计?(学生上课表)
学生
|
课程
|
老师
|
老师职称
|
教材
|
教室
|
上课时间
|
小明
|
一年级语文(上)
|
大宝
|
副教授
|
《小学语文1》
|
101
|
14:30
|
一个学生上一门课,一定在特定某个教室。所以有(学生,课程)->教室
一个学生上一门课,一定是特定某个老师教。所以有(学生,课程)->老师
一个学生上一门课,他老师的职称可以确定。所以有(学生,课程)->老师职称
一个学生上一门课,一定是特定某个教材。所以有(学生,课程)->教材
一个学生上一门课,一定在特定时间。所以有(学生,课程)->上课时间
因此(学生,课程)是一个码。
然而,一个课程,一定指定了某个教材,一年级语文肯定用的是《小学语文1》,那么就有课程->教材。(学生,课程)是个码,课程却决定了教材,这就叫做不完全依赖,或者说部分依赖。出现这样的情况,就不满足第二范式!
有什么不好吗?你可以想想:
1、 校长要新增加一门课程叫“微积分”,教材是《大学数学》,怎么办?学生还没选课,而学生又是主属性,主属性不能空,课程怎么记录呢,教材记到哪呢? ……郁闷了吧?(插入异常)
2、 下学期没学生学一年级语文(上)了,学一年级语文(下)去了,那么表中将不存在一年级语文(上),也就没了《小学语文1》。这时候,校长问:一年级语文(上)用的什么教材啊?……郁闷了吧?(删除异常)
3、 校长说:一年级语文(上)换教材,换成《大学语文》。有10000个学生选了这么课,改动好大啊!改累死了……郁闷了吧?(修改异常)
那应该怎么解决呢?投影分解,将一个表分解成两个或若干个表
学生
|
课程
|
老师
|
老师职称
|
教室
|
上课时间
|
小明
|
一年级语文(上)
|
大宝
|
副教授
|
101
|
14:30
|
学生上课表新
课程的表
第三范式(3NF):符合2NF,并且,消除传递依赖
上面的“学生上课表新”符合2NF,可以这样验证:两个主属性单独使用,不用确定其它四个非主属性的任何一个。但是它有传递依赖!
在哪呢?问题就出在“老师”和“老师职称”这里。一个老师一定能确定一个老师职称。
有什么问题吗?想想:
1、 老师升级了,变教授了,要改数据库,表中有N条,改了N次……(修改异常)
2、 没人选这个老师的课了,老师的职称也没了记录……(删除异常)
3、 新来一个老师,还没分配教什么课,他的职称记到哪?……(插入异常)
那应该怎么解决呢?和上面一样,投影分解:
学生
|
课程
|
老师
|
教室
|
上课时间
|
小明
|
一年级语文(上)
|
大宝
|
101
|
14:30
|
BC范式(BCNF):符合3NF,并且,主属性不依赖于主属性
若关系模式属于第一范式,且每个属性都不传递依赖于键码,则R属于BC范式。
通常BC范式的条件有多种等价的表述:每个非平凡依赖的左边必须包含键码;每个决定因素必须包含键码。
BC范式既检查非主属性,又检查主属性。当只检查非主属性时,就成了第三范式。满足BC范式的关系都必然满足第三范式。
还可以这么说:若一个关系达到了第三范式,并且它只有一个候选码,或者它的每个候选码都是单属性,则该关系自然达到BC范式。
一般,一个数据库设计符合3NF或BCNF就可以了。在BC范式以上还有第四范式、第五范式。
第四范式:要求把同一表内的多对多关系删除。
第五范式:从最终结构重新建立原始结构。
但在绝大多数应用中不需要设计到这种程度。并且,某些情况下,过于范式化甚至会对数据库的逻辑可读性和使用效率起到阻碍。数据库中一定程度的冗余并不一定是坏事情。如果你对第四范式、第五范式感兴趣可以看一看专业教材,从头学起,并且忘记我说的一切,以免对你产生误导。
相关推荐
数据库范式理解例题 数据库范式是relation database设计中的一种规范,旨在确保数据库的结构正确性和数据的一致性。其中包括第一范式(1NF)、第二范式(2NF)和第三范式(3NF)等。 第一范式(1NF) 第一范式是...
数据库范式理解例题 数据库范式是关系数据库设计中的一种规范约束规则,用于确保数据库的逻辑一致性和数据的完整性。下面是对数据库范式的理解和例题: 1. 属性的分类: 在关系数据库中,属性可以分为主属性和非...
"数据库范式" 数据库范式是关系数据库的设计理论,旨在消除数据冗余,提高数据的一致性和可管理性。...数据库范式是关系数据库设计的重要理论基石,通过理解和应用这些理论,可以设计出高效、可靠的数据库系统。
总结来说,理解数据库范式有助于构建高效、可靠且易于维护的数据库系统。通过对实体、属性以及各种类型的码进行合理的规划和设计,可以有效地减少数据冗余,提高数据完整性和一致性。此外,适当降低范式标准可以在...
### 数据库范式详解 #### 一、范式的概念与作用 在数据库设计过程中,为了减少数据冗余、避免更新异常等问题,引入了**数据库范式**的概念。范式是衡量关系模式优劣的标准,其核心目的是通过规范化过程来简化...
"数据库范式理解例题" 数据库范式是数据库设计中的一种原则,它可以帮助我们设计出高效、可维护的数据库。下面我们将对数据库范式的相关知识点进行详细的讲解。 函数依赖 函数依赖是指关系中一个或一组属性的值...
理解并应用数据库范式对于构建高效、可靠的数据库系统至关重要。通过遵循这些规范,我们可以有效地避免数据冗余、更新异常等问题,从而提高数据完整性和查询性能。此外,随着技术的发展,虽然第六范式可能在实际应用...
数据库范式化是数据库设计中保证数据关系清晰、降低数据冗余和提高数据一致性的过程。根据文档内容,本教程将简明扼要地介绍范式化的概念,并通过订单数据实例进行阐释。以下是基于文档内容的知识点梳理。 首先,...
数据库范式是关系型数据库设计中的核心理论,它是一组规则,用来指导如何构建和组织数据库,以...虽然数据库范式理论可能在学术上显得复杂,但理解其实质意义和应用场景,可以帮助开发者构建出更为健壮的数据库系统。
数据库范式是数据库设计中的一个重要概念,用于优化数据存储,减少数据冗余并避免数据不一致性。这个概念源自于关系数据库理论,由埃德加·科德在其关系模型中提出。在数据库设计中,遵循不同级别的范式有助于构建...
大数据库范式理解例题.doc
标题和描述均提到了“关系数据库范式归属的证明”,这一主题聚焦于关系数据库理论中的范式归属问题,即如何证明高级范式归属于低级范式。范式是关系数据库设计中用来规范数据库结构的标准,旨在减少数据冗余并提高...
首先,我们要理解数据库范式的基本概念。数据库范式是一种设计原则,旨在减少数据冗余,防止数据不一致性和操作异常,如插入、删除和更新时可能遇到的问题。遵循这些规则的数据库将拥有清晰的结构,便于管理和维护。...
总结来说,理解并应用数据库范式对于构建高效、稳定、易于维护的数据库系统至关重要。通过正确设计数据库模式,遵循这些范式,可以显著减少数据冗余,提高查询效率,避免插入、更新和删除操作时可能出现的问题。在...
"T-SQL 查询进阶 高级查询" 本篇文章主要介绍了数据库范式在数据库设计中的...本篇文章通过对数据库范式的详细介绍和 DEMO 示例,帮助读者更好地理解数据库范式的重要性和应用方法,从而提高数据库设计和开发的能力。
数据库范式堂PPT课件主要讲解了关系数据库的核心理论——关系数据理论,这是构建高效、稳定、无冗余数据库的基础。本课件涵盖了数据库逻辑设计的问题,以及如何通过规范化理论来解决这些问题。 首先,关系数据理论...