原文地址http://www.ccvita.com/418.html
前言
为什么要写这篇文章呢,从去年年底开始,就和很多做技术的朋友交流过,从数据库设计到数据库架构各个方面的内容。有一些朋友执着于ORM,执着于所谓的数据库设计,却忘记了一切技术是要为业务服务这个基石。当然这文章里也有一些自己的理解,想向大家表达。
范式是什么
范式是符合某一种级别的关系模式的集合。关系数据库中的关系必须满足一定的要求,即满足不同的范式。目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
范式的原理
-
第一范式(1NF)无重复的列
所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1NF)中表的每一行只包含一个实例的信息。简而言之,第一范式就是无重复的列。
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。 -
第二范式(2NF)属性完全依赖于主键[消除部分子函数依赖]
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。
例如员工信息表中加上了员工编号(emp_id)列,因为每个员工的员工编号是惟一的,因此每个员工可以被惟一区分。这个惟一属性列被称为主关键字或主键、主码。
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。简而言之,第二范式就是属性完全依赖于主键。 -
第三范式(3NF)属性不依赖于其它非主属性[消除传递依赖]
满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。
那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。
范式的说明
- 第一范式:1NF是对属性的原子性约束,要求属性具有原子性,不可再分解;
通俗的理解是字段还可以再分吗?如过不能,则是符合1NF的设计。 - 第二范式:2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性;
简单的解释,比如你和一个女生约会建立一张表,不用每条约会记录都记录她的身高、体重,将身高体重单独的存在一张表中供查询即可。 - 第三范式:3NF是对字段冗余性的约束,即任何字段不能由其他字段派生出来,它要求字段没有冗余。
打个比方,比如评论表,如果你将用户ID,用户头像都放在这留言表中,就是不合适的了。用户头像是依赖于用户ID,而不依赖该评论。
我对范式的理解
一个严格恪守数据库设计范式来进行数据库设计的人,必定是个傻球;
一个没有研究过数据库设计范式就进行数据库设计的人,必定也是个傻球;
在现代数据库设计中,尤其是web 2.0的系统中的数据库设计,我可以断言,大多数都是违反2NF、3NF的,少数设计甚至是违反1NF的。数据库设计范式只是对数据库惯用设计的一些说明,并不能定性为标准。
而从数据库的发展来看,以MySQL举例,随着MySQL实现越来越多的功能,它的宣传材料上会越来越多的出现以前被MySQL所摒弃的复杂设计理念,并且宣称这是MySQL所独创或一贯倡导的。这是一个数据库系统发展所必然经历的过程。而这却会给MySQL的使用者以极大的误导,从而忽视了是否新特性是业务所真正需要的。
数据库设计不是一种编程语言这么简单,与面向对象、面向过程无关。数据库设计代表的是一种与应用开发语言完全不同的思想。现在绝大多数的程序,无论任何人采用什么方式进行程序开发,其最终还是会回归到对数据库的操作上(当然如果你的程序只是个教学演示则不在此范围内)。
数据库发展
各种缓存方案,说到底是以key为基础的数据解决方案,而数据库与应用层之间的中间件,为了实现逻辑的简单和高性能,更多的也会是基于key的实现。比如我所使用过的腾讯的TTC。
从下面的列表可以看出当前SNS的网站对于高并发、高性能的数据库解决方案有多么渴求,Facebook贡献了Cassandra、Linkedin贡献了Voldemort、mixi.jp贡献了Tokyo Cabinet和Tokoy Tyrant、green.jp贡献了Flare、甚至包括Google的BigTable。
总结
写到这里,我发现单单是这些新的数据库解决方案就有太多可写的内容,而这些已经超过了本文所要说明的主要内容,而现在所写的内容就全当是个引子吧,我写的很意犹未尽。后面会就反范式设计实例,内存缓存方案、NoSQL数据库等逐渐展开。
PS:这篇文章写的很杂乱,尤其是后面两端,见谅!
相关推荐
第一范式是最基本的数据库设计规范,它要求每个表中的每一行都具有唯一的值,且每个字段都不可分割。换言之,每个表中的每一行都必须具有唯一的标识符,且每个字段都必须是一个原子值。 例如,如果我们设计一个学生...
首先,我们需要理解数据库设计范式的概念。在关系型数据库中,范式主要包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)和第四范式(4NF)。每种范式都有其特定的要求,例如1NF要求每...
关系数据库设计范式是数据库设计中的核心概念,用于确保数据的规范化和高效存储。以下是关于关系数据库设计范式的详细介绍: 1. 第一范式(1NF):这是最基本的要求,规定数据库表中的每一列(属性)都必须是不可再...
关系型数据库设计范式是数据库设计的核心原则,用于确保数据的一致性、减少冗余和避免数据异常。在设计数据库时,遵循这些范式能够提高数据的组织...总的来说,理解并应用数据库设计范式是每个数据库设计师必备的技能。
在"MLDN魔乐科技JAVA培训_Oracle课堂25_数据库设计范式 PowerDesigner工具.wmv"这个视频教程中,你将学习如何使用PowerDesigner来理解和应用数据库设计范式。首先,你可能需要了解如何在CDM中定义实体和属性,以及...
数据库范式理解例题 数据库范式是关系数据库设计中的一种规范约束规则,用于确保数据库的逻辑一致性和数据的完整性。下面是对数据库范式的理解和例题: 1. 属性的分类: 在关系数据库中,属性可以分为主属性和非...
数据库设计范式是关系数据库设计的核心概念,它们是用来确保数据的一致性、减少冗余、避免数据异常的关键原则。在数据库领域,特别是Oracle等大型关系型数据库系统中,理解和掌握这些范式至关重要。 首先,第一范式...
数据库范式是关系型数据库设计中的核心理论,它是一组规则,用来指导如何构建和组织数据库,以确保数据的一致性、减少冗余并避免数据异常。这些规则以不同的级别存在,即第一范式(1NF)、第二范式(2NF)、第三范式...
数据库设计范式是关系数据库设计的核心原则,它们确保了数据的规范化程度,减少了数据冗余,提升了数据一致性。关系数据库的范式分为六个级别:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)...
数据库设计三范式是数据库规范化理论中的核心概念,主要用于优化数据存储,避免数据冗余和更新异常。这里我们将深入探讨第一范式(1NF)和第二范式(2NF...在实际的数据库设计过程中,理解和应用这些原则是至关重要的。
关系数据库设计范式是数据库设计的重要理论基础,它规范了数据库的设计过程,以确保数据的一致性、完整性和减少冗余。在关系数据库中,数据以表格形式存储,这些表格遵循特定的规则,以满足不同级别的范式要求。 ...
本资源“MLDN魔乐科技_Oracle课堂25_数据库设计范式.PowerDesigner工具”聚焦于数据库设计中的范式理论以及PowerDesigner这一强大的数据库建模工具。 首先,数据库设计范式是数据库理论中的核心概念,它有助于避免...
数据库设计范式是关系数据库设计的核心原则,它们确保了数据的一致性、减少冗余和避免数据异常。这里主要介绍了1NF(第一范式)、2NF(第二范式)、3NF(第三范式)和BCNF(博科斯范式)。 1NF(第一范式)强调每个...
理解并遵循这些范式,可以帮助数据库设计者创建出简洁、清晰且易于维护的数据库结构。在实际工程中,虽然完全满足BCNF可能在某些情况下过于复杂,但理解和应用1NF、2NF和3NF是确保数据库设计基础扎实的关键。通过...
"数据库范式理解例题" 数据库范式是数据库设计中的一种原则,它可以帮助我们设计出高效、可维护的数据库。下面我们将对数据库范式的相关知识点进行详细的讲解。 函数依赖 函数依赖是指关系中一个或一组属性的值...
数据库的设计范式是指一系列用于指导数据库设计的规范化准则,其目的是确保数据的完整性、减少数据冗余,并提高数据库的操作效率。遵循这些范式可以避免在数据库设计中常见的错误,如插入异常、删除异常和更新异常等...
数据库设计是信息系统构建的核心环节,其中的三大范式——第一范式、第二范式和第三范式,是确保数据规范化和避免数据冗余的关键原则。这些范式是根据关系数据库理论建立的,目的是提高数据库的逻辑独立性和减少数据...
"数据库范式" 数据库范式是关系数据库的设计理论,旨在消除数据冗余,提高数据的一致性和可管理性。...数据库范式是关系数据库设计的重要理论基石,通过理解和应用这些理论,可以设计出高效、可靠的数据库系统。
本篇文章将深入探讨数据库设计的重要性、基础概念以及设计范式。 首先,为什么需要设计数据库?数据库设计是为了应对大数据量和复杂性的挑战。在大型项目中,数据种类繁多,存储需求大,设计的目标在于: 1. 避免...