`

数据库范式

 
阅读更多

数据库范式那些事 

转载:http://www.uml.org.cn/sjjm/201003023.asp 
 
 

简介

数据库范式在数据库设计中的地位一直很暧昧,教科书中对于数据库范式倒是都给出了学术性的定义,但实际应用中范式的应用却不甚乐观,这篇文章会用简单的语言和一个简单的数据库DEMO将一个不符合范式的数据库一步步从第一范式实现到第四范式。

范式的目标

应用数据库范式可以带来许多好处,但是最重要的好处归结为三点:

1.减少数据冗余(这是最主要的好处,其他好处都是由此而附带的)

2.消除异常(插入异常,更新异常,删除异常)

3.让数据组织的更加和谐…

但剑是双刃的,应用数据库范式同样也会带来弊端,这会在文章后面说到。

什么是范式

简单的说,范式是为了消除重复数据减少冗余数据,从而让数据库内的数据更好的组织,让磁盘空间得到更有效利用的一种标准化标准,满足高等级的范式的先决条件是满足低等级范式。(比如满足2nf一定满足1nf)

DEMO

让我们先从一个未经范式化的表看起,表如下:

0nf

先对表做一个简单说明,employeeId是员工id,departmentName是部门名称,job代表岗位,jobDescription是岗位说明,skill是员工技能,departmentDescription是部门说明,address是员工住址

对表进行第一范式(1NF)

如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。

简单的说,第一范式就是每一个属性都不可再分。不符合第一范式则不能称为关系数据库。对于上表,不难看出Address是可以再分的,比如”北京市XX路XX小区XX号”,着显然不符合第一范式,对其应用第一范式则需要将此属性分解到另一个表,如下:

1nf

对表进行第二范式(2NF)

若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF

简单的说,是表中的属性必须完全依赖于全部主键,所以只有一个主键的表如果符合第一范式,那一定是第二范式,而不是部分主键。这样做的目的是进一步减少插入异常和更新异常。在上表中,departmentDescription是由DepartmentName所决定,但却不能由EmployeeID决定,故要departmentDescription对主键是部分依赖,对其应用第二范式如下表:

3nf

对表进行第三范式(3NF)

关系模式R<U,F> 中若不存在这样的码X、属性组Y及非主属性Z(Z  Y), 使得X→Y,Y→Z,成立,则称R<U,F> ∈ 3NF。

简单的说,第三范式是为了消除数据库中关键字之间的依赖关系,在上面经过第二范式化的表中,可以看出jobDescription(岗位职责)是由job(岗位)所决定,则jobDescription依赖于job,可以看出这不符合第三范式,对表进行第三范式后的关系图为:

3nf1

上表中,已经不存在数据库属性互相依赖的问题,所以符合第三范式

对表进行BC范式(BCNF)

设关系模式R<U,F>∈1NF,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。

简单的说,bc范式是在第三范式的基础上的一种特殊情况,既每个表中只有一个候选键(在一个数据库中每行的值都不相同,则可称为候选键),在上面第三范式的noNf表中可以看出,每一个员工的email都是唯一的(难道两个人用同一个email??)则,此表不符合bc范式,对其进行bc范式化后的关系图为:

bcnf

对表进行第四范式(4NF)

关系模式R<U,F>∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y  X),X都含有候选码,则R∈4NF。

简单的说,第四范式是消除表中的多值依赖,也就是说可以减少维护数据一致性的工作。对于上面bc范式化的表中,对于员工的skill,两个可能的值是”C#,sql,javascript”和“C#,UML,Ruby”,可以看出,这个数据库属性存在多个值,这就可能造成数据库内容不一致的问题,比如第一个值写的是”C#”,而第二个值写的是”C#.net”,解决办法是将多值属性放入一个新表,则第四范式化后的关系图如下:

4nf

而对于skill表则可能的值为:

4nfdemo

总结

上面对于数据库范式进行分解的过程中不难看出,应用的范式登记越高,则表越多。表多会带来很多问题:

1 查询时要连接多个表,增加了查询的复杂度

2 查询时需要连接多个表,降低了数据库查询性能

而现在的情况,磁盘空间成本基本可以忽略不计,所以数据冗余所造成的问题也并不是应用数据库范式的理由。

因此,并不是应用的范式越高越好,要看实际情况而定。第三范式已经很大程度上减少了数据冗余,并且减少了造成插入异常,更新异常,和删除异常了。我个人观点认为,大多数情况应用到第三范式已经足够,在一定情况下第二范式也是可以的。

分享到:
评论

相关推荐

    数据库范式理解例题数据库范式理解例题.doc

    数据库范式理解例题 数据库范式是relation database设计中的一种规范,旨在确保数据库的结构正确性和数据的一致性。其中包括第一范式(1NF)、第二范式(2NF)和第三范式(3NF)等。 第一范式(1NF) 第一范式是...

    数据库范式理解例题.doc

    数据库范式理解例题 数据库范式是关系数据库设计中的一种规范约束规则,用于确保数据库的逻辑一致性和数据的完整性。下面是对数据库范式的理解和例题: 1. 属性的分类: 在关系数据库中,属性可以分为主属性和非...

    数据库范式.pdf

    "数据库范式" 数据库范式是关系数据库的设计理论,旨在消除数据冗余,提高数据的一致性和可管理性。范式是一个升级的过程,每个上层的模式都是建立在下一级范式之上的。消除数据冗余的影响包括:减少物理空间的存储...

    数据库范式详解+实例

    ### 数据库范式详解 #### 一、范式的概念与作用 在数据库设计过程中,为了减少数据冗余、避免更新异常等问题,引入了**数据库范式**的概念。范式是衡量关系模式优劣的标准,其核心目的是通过规范化过程来简化...

    数据库范式理论

    数据库系统概论数据库范式理论。数据库范式理论

    数据库范式化教程 - 订单数据实例速成.pdf

    数据库范式化是数据库设计中保证数据关系清晰、降低数据冗余和提高数据一致性的过程。根据文档内容,本教程将简明扼要地介绍范式化的概念,并通过订单数据实例进行阐释。以下是基于文档内容的知识点梳理。 首先,...

    数据库范式讲解

    数据库范式讲解

    什么是数据库范式?什么是设计范式?

    数据库范式是关系型数据库设计中的核心理论,它是一组规则,用来指导如何构建和组织数据库,以确保数据的一致性、减少冗余并避免数据异常。这些规则以不同的级别存在,即第一范式(1NF)、第二范式(2NF)、第三范式...

    数据库范式【转】

    数据库范式 数据库范式是数据库设计中的一种规则,旨在确保数据的正确性、完整性和一致性。数据库范式通常有三种:第一范式、第二范式和第三范式。下面将对每种范式进行详细的介绍。 第一范式 第一范式是最基本的...

    通俗易懂,实例讲解数据库范式,三范式,六范式

    ### 数据库范式详解 #### 一、基础知识 在深入探讨数据库范式之前,我们需要先了解几个基础概念。 ##### 实体(Entity) 实体是指现实世界中客观存在的、可以被区别的事物。例如:“一个学生”、“一本书”、...

    数据库范式练习题.doc

    数据库范式练习题 数据库范式是数据库设计的重要概念,它们是关系数据库设计的基本原则。下面是对数据库范式的详细介绍: 第一范式(1NF) 第一范式是指数据库表中的每一列都是不可分割的数据项,即每一列的值不...

    数据库范式解析,看了秒懂

    数据库范式是关系数据库设计中的核心理论,它们是用来衡量数据依赖规范化的程度,确保数据库的结构合理、数据冗余最小,从而减少数据异常。本文将深入解析数据库的几个主要范式,包括第一范式(1NF)、第二范式(2NF...

    数据库范式理解例题.docx

    "数据库范式理解例题" 数据库范式是数据库设计中的一种原则,它可以帮助我们设计出高效、可维护的数据库。下面我们将对数据库范式的相关知识点进行详细的讲解。 函数依赖 函数依赖是指关系中一个或一组属性的值...

    关系数据库范式归属的证明

    标题和描述均提到了“关系数据库范式归属的证明”,这一主题聚焦于关系数据库理论中的范式归属问题,即如何证明高级范式归属于低级范式。范式是关系数据库设计中用来规范数据库结构的标准,旨在减少数据冗余并提高...

    数据库范式以及范式的级别

    数据库范式是数据库设计中的一个重要概念,用于优化数据存储,减少数据冗余并避免数据不一致性。这个概念源自于关系数据库理论,由埃德加·科德在其关系模型中提出。在数据库设计中,遵循不同级别的范式有助于构建...

    数据库范式的详细讲解

    "数据库范式的详细讲解" 数据库范式是数据库 normalization 的一个重要概念,指的是将关系数据库中的数据组织成一个优化的结构,以提高数据的存储效率、减少数据冗余和更新异常。数据库范式有多种,分别是第一范式...

    数据库范式(123BCNF范式)详解.docx

    数据库范式(123BCNF范式)详解 数据库设计中,数据库范式是指数据库设计所需要满足的标准,满足这些标准的数据库是简洁的结构明晰的,同时,不会发生插入、删除和更新操作异常。反之,则是乱七八糟,不仅给数据库...

    数据库设计的基础-数据库范式

    数据库设计的基础——数据库范式

Global site tag (gtag.js) - Google Analytics