数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常。反之则是乱七八糟,不仅给数据库的编程人员制造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息。
范式说明
1.1 第一范式(1NF)无重复的列
所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1NF)中表的每一行只包含一个实例的信息。简而言之,第一范式就是无重复的列。
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。
例如,如下的数据库表是符合第一范式的:
字段1 |
字段2 |
字段3 |
字段4 |
而这样的数据库表是不符合第一范式的:
字段1 |
字段2 |
字段3 |
字段4 |
|
|
|
字段3.1 |
字段3.2 |
|
数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。很显然,在当前的任何关系数据库管理系统(DBMS)中,傻瓜也不可能做出不符合第一范式的数据库,因为这些DBMS不允许你把数据库表的一列再分成二列或多列。因此,你想在现有的DBMS中设计出不符合第一范式的数据库都是不可能的。
1.2 第二范式(2NF)属性完全依赖于主键 [ 消除部分子函数依赖 ]
如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键, 则称为第二范式模式。
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。这个惟一属性列被称为主关键字或主键、主码。
例如员工信息表中加上了员工编号(emp_id)列,因为每个员工的员工编号是惟一的,因此每个员工可以被惟一区分。
简而言之,第二范式(2NF)就是非主属性完全依赖于主关键字。
所谓完全依赖是指不能存在仅依赖主关键字一部分的属性(设有函数依赖W→A,若存在XW,有X→A成立,那么称W→A是局部依赖,否则就称W→A是完全函数依赖)。如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。
假定选课关系表为SelectCourse(学号, 姓名, 年龄, 课程名称, 成绩, 学分),关键字为组合关键字(学号, 课程名称),因为存在如下决定关系:
(学号, 课程名称) → (姓名, 年龄, 成绩, 学分)
这个数据库表不满足第二范式,因为存在如下决定关系:
(课程名称) → (学分)
(学号) → (姓名, 年龄)
即存在组合关键字中的字段决定非关键字的情况。
由于不符合2NF,这个选课关系表会存在如下问题:
(1) 数据冗余:
同一门课程由n个学生选修,"学分"就重复n-1次;同一个学生选修了m门课程,姓名和年龄就重复了m-1次。
(2) 更新异常:
若调整了某门课程的学分,数据表中所有行的"学分"值都要更新,否则会出现同一门课程学分不同的情况。
(3) 插入异常:
假设要开设一门新的课程,暂时还没有人选修。这样,由于还没有"学号"关键字,课程名称和学分也无法记录入数据库。
(4) 删除异常:
假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。
把选课关系表SelectCourse改为如下三个表:
学生:Student(学号, 姓名, 年龄);
课程:Course(课程名称, 学分);
选课关系:SelectCourse(学号, 课程名称, 成绩)。
这样的数据库表是符合第二范式的, 消除了数据冗余、更新异常、插入异常和删除异常。
另外,所有单关键字的数据库表都符合第二范式,因为不可能存在组合关键字。
1.3 第三范式(3NF)属性不依赖于其它非主属性 [ 消除传递依赖 ]
如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R为第三范式模式。
满足第三范式(3NF)必须先满足第二范式(2NF)。第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。
例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。
第三范式(3NF):在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。简而言之,第三范式就是属性不依赖于其它非主属性。
所谓传递函数依赖,指的是如果存在"A → B → C"的决定关系,则C传递函数依赖于A。
因此,满足第三范式的数据库表应该不存在如下依赖关系:
关键字段 → 非关键字段x → 非关键字段y
假定学生关系表为Student(学号, 姓名, 年龄, 所在学院, 学院地点, 学院电话),关键字为单一关键字"学号",因为存在如下决定关系:
(学号) → (姓名, 年龄, 所在学院, 学院地点, 学院电话)
这个数据库是符合2NF的,但是不符合3NF,因为存在如下决定关系:
(学号) → (所在学院) → (学院地点, 学院电话)
即存在非关键字段"学院地点"、"学院电话"对关键字段"学号"的传递函数依赖。
它也会存在数据冗余、更新异常、插入异常和删除异常的情况,读者可自行分析得知。
把学生关系表分为如下两个表:
学生:(学号, 姓名, 年龄, 所在学院);
学院:(学院, 地点, 电话)。
这样的数据库表是符合第三范式的,消除了数据冗余、更新异常、插入异常和删除异常。
1.4 鲍依斯-科得范式(BCNF是3NF的改进形式)
若关系模式R是第一范式,且每个属性都不传递依赖于R的候选键。这种关系模式就是BCNF模式。即在第三范式的基础上,数据库表中如果不存在任何字段对任一候选关键字段的传递函数依赖则符合鲍依斯-科得范式。
假设仓库管理关系表为StorehouseManage(仓库ID, 存储物品ID, 管理员ID, 数量),且有一个管理员只在一个仓库工作;一个仓库可以存储多种物品。这个数据库表中存在如下决定关系:
(仓库ID, 存储物品ID) →(管理员ID, 数量)
(管理员ID, 存储物品ID) → (仓库ID, 数量)
所以,(仓库ID, 存储物品ID)和(管理员ID, 存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。但是,由于存在如下决定关系:
(仓库ID) → (管理员ID)
(管理员ID) → (仓库ID)
即存在关键字段决定关键字段的情况,所以其不符合BCNF范式。它会出现如下异常情况:
(1) 删除异常:
当仓库被清空后,所有"存储物品ID"和"数量"信息被删除的同时,"仓库ID"和"管理员ID"信息也被删除了。
(2) 插入异常:
当仓库没有存储任何物品时,无法给仓库分配管理员。
(3) 更新异常:
如果仓库换了管理员,则表中所有行的管理员ID都要修改。
把仓库管理关系表分解为二个关系表:
仓库管理:StorehouseManage(仓库ID, 管理员ID);
仓库:Storehouse(仓库ID, 存储物品ID, 数量)。
这样的数据库表是符合BCNF范式的,消除了删除异常、插入异常和更新异常。
四种范式之间存在如下关系:
转载:http://jacki6.iteye.com/blog/774866
相关推荐
### 数据库范式详解 #### 一、第一范式(1NF) 第一范式强调的是数据库表中的每一列都是不可分割的基本数据项,也就是说,在一个表中,每一列都应该是原子性的,不能再细分。例如,如果一个表中有一个字段表示地址...
数据库范式1NF 2NF 3NF BCNF(实例) 设计范式(范式,数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式。关系数据库中的关系...
"关系型数据库1NF~6NF,BCNF详解" 关系型数据库的范式是指数据库中数据组织和存储的方式,它直接影响着数据库的性能、可维护性和可扩展性。了解关系型数据库的各种范式是非常重要的,它可以帮助我们设计和优化...
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列...
数据库范式主要包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及BCNF(Boyce-Codd范式)。下面我们详细介绍这些范式及其相互之间的转换方法。 ##### 第一范式(1NF) - **定义**:如果关系模式R属于第...
"Java面试中数据库三范式详解" 数据库设计范式是指在设计数据库时需要遵守的一些基本规则,以确保数据的一致性、完整性和简洁性。在 Java 面试中,数据库三范式是常见的考察点,本文将对三范式进行详细的解释,并以...
### 数据库范式详解 #### 一、基础知识 在深入探讨数据库范式之前,我们需要先了解几个基础概念。 ##### 实体(Entity) 实体是指现实世界中客观存在的、可以被区别的事物。例如:“一个学生”、“一本书”、...
### 数据库范式详解 #### 一、基础知识 在深入探讨数据库范式之前,我们先来了解一下几个重要的基本概念。 **实体(Entity)**: 实体指的是现实世界中能够被区分和独立存在的对象或事物。例如,“学生”、“课程...
### 数据库中的范式理论详解 #### 一、范式理论概述 范式理论是数据库设计中的一个重要概念,主要用于指导数据库的设计与优化,确保数据的一致性和减少数据冗余。该理论最早由被称为“关系数据库之父”的E.F.Codd...
范式是衡量数据库结构合理性和优化程度的重要标准,通常包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC范式(BCNF)以及第四范式(4NF)。这些范式旨在减少数据冗余、消除异常并确保数据的一致性,但在...
从1NF到3NF再到BCNF,每一步都在逐步减少数据的复杂性,提高数据库的整体性能。在实际应用中,根据具体的需求和场景选择合适的范式级别是非常重要的。合理的范式设计不仅可以简化查询,还可以有效避免数据更新异常等...
### 关系型数据库范式详解 #### 范式的概念与意义 关系型数据库的设计遵循一系列规范化原则,称为“范式”。范式是确保数据库结构合理、数据冗余最小化和数据完整性的一种方法论。通过规范化,数据库可以避免数据...
文章中的一些概念候选码主属性函数依赖完全函数依赖部分函数依赖传递函数依赖什么是范式范式的分类第一范式(1NF)第二范式(2NF)第三范式(3NF)巴斯-科德范式(BCNF)第四范式(4NF)第五范式(5NF) 文章中的...
### 数据库三范式详解 在数据库设计领域中,遵循一系列规范来构建高效、合理的关系型数据库至关重要。这些规范称为“范式”,旨在减少数据冗余并提高数据完整性。范式按照递进的方式进行规范,越高级别的范式对...
例如,一个符合1NF的表不应有复合列,每个字段都应是单一属性,如:`字段1, 字段2, 字段3`,而不应有如`字段3.1, 字段3.2`这样的子字段。在现代的关系数据库管理系统中,1NF是基础,所有表都应满足此规则。 2. **第...
本文将详细介绍四种主要的范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及布尔依斯范式(BCNF),并探讨它们如何帮助设计高效、健壮的数据库系统。 #### 二、第一范式(1NF) 1NF是最基础的范式,...
本文主要介绍1NF、2NF、3NF以及BCNF,并通过实例解析如何应用这些范式。 #### 二、第一范式(1NF) **定义:** 在1NF中,要求关系中的每个属性都是原子性的,即不能再被细分为更小的数据单位。换句话说,表中的每一列...
其中最常用的规范化级别就是第一范式(1NF)、第二范式(2NF)和第三范式(3NF),这三种范式被称为“三范式”。 #### 第一范式(1NF) 第一范式是所有数据库设计的基础,要求数据库表中的每一列都是不可分割的...
SQL三个范式是数据库设计中重要的理论基础,它们分别是第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。这些范式确保了数据库的规范化,避免数据冗余和操作异常,从而提高数据的完整性和一致性。 1. **第一...