`
跳跃的心灵
  • 浏览: 13744 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

数据库设计5步骤(转载)

阅读更多
1.确定entities及relationships

a)设计宏观行为。你用此数据库来做什么?比如,希望管理雇员的信息。

b)确定entities。对于一系列的行为,确定所管理信息所涉及到的主题范围。这将变成table。比如,雇用员工,指定具体部门,确定技能等级。

c)确定relationships。看着行为,确定tables之间有何种关系。比如,在部门与雇员之间存在一种关系。给这种关系命名。

d)细化行为。你从宏观行为开始,现在仔细检查这些行为,看有哪些行为能转为微观行为。比如,管理雇员的信息可细化为:
● 增加新员工
● 修改存在员工信息
● 删除调走的员工

e)确定业务规则。看着你的业务规则,确定你要采取哪种。比如,可能有这样一种规则,一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。

范例:

ACME是一个小公司,在5个地方都设有办事处。当前,有75名员工。公司准备快速扩大规模,划分了9个部门,每个部门都有其领导。
为有助于寻求新的员工,人事部门规划了68种技能,为将来人事管理作好准备。员工被招进时,每一种技能的专业等级都被确定。

定义宏观行为
一些ACME公司的宏观行为包括:
● 招聘员工
● 解雇员工
● 管理员工个人信息
● 管理公司所需的技能信息
● 管理哪位员工有哪些技能
● 管理部门信息
● 管理办事处信息

确定entities及relationships
我们可以确定要存放信息的主题领域(表)及其关系,并创建一个基于宏观行为及描述的图表。
我们用方框来代表table,用菱形代表relationship。我们可以确定哪些relationship是一对多,一对一,及多对多。
这是一个E-R草图,以后会细化。



细化宏观行为
以下微观行为基于上面宏观行为而形成:
● 增加或删除一个员工
● 增加或删除一个办事处
● 列出一个部门中的所有员工
● 增加一项技能
● 增加一个员工的一项技能
● 确定一个员工的技能
● 确定一个员工每项技能的等级
● 确定所有拥有相同等级的某项技能的员工
● 修改员工的技能等级

这些微观行为可用来确定需要哪些table或relationship。

确定业务规则
业务规则常用于确定一对多,一对一,及多对多关系。
相关的业务规则可能有:
● 现在有5个办事处;最多允许扩展到10个。
● 员工可以改变部门或办事处
● 每个部门有一个部门领导
● 每个办事处至多有3个电话号码
● 每个电话号码有一个或多个扩展
● 员工被招进时,每一种技能的专业等级都被确定。
● 每位员工拥有3到20个技能
● 某位员工可能被安排在一个办事处,也可能不安排办事处。

2.确定所需数据

要确定所需数据:
1. 确定支持数据
2. 列出所要跟踪的所有数据。描述table(主题)的数据回答这些问题:谁,什么,哪里,何时,以及为什么
3. 为每个table建立数据
4. 列出每个table目前看起来合适的可用数据
5. 为每个relationship设置数据
6. 如果有,为每个relationship列出适用的数据

确定支持数据

你所确定的支持数据将会成为table中的字段名。比如,下列数据将适用于表Employee,表Skill,表Expert In。



如果将这些数据画成图表,就像:



需要注意:
● 在确定支持数据时,请一定要参考你之前所确定的宏观行为,以清楚如何利用这些数据。
● 比如,如果你知道你需要所有员工的按姓氏排序的列表,确保你将支持数据分解为名字与姓氏,这比简单地提供一个名字会更好。
● 你所选择的名称最好保持一致性。这将更易于维护数据库,也更易于阅读所输出的报表。
● 比如,如果你在某些地方用了一个缩写名称Emp_status,你就不应该在另外一个地方使用全名(Empolyee_ID)。相反,这些名称应当是Emp_status及Emp_id。
● 数据是否与正确的table相对应无关紧要,你可以根据自己的喜好来定。在下节中,你会通过测试对此作出判断。

3.标准化数据

标准化是你用以消除数据冗余及确保数据与正确的table或relationship相关联的一系列测试。共有5个测试。本节中,我们将讨论经常使用的3个。
关于标准化测试的更多信息,请参考有关数据库设计的书籍。

标准化格式
标准化格式是标准化数据的常用测试方式。你的数据通过第一遍测试后,就被认为是达到第一标准化格式;通过第二遍测试,达到第二标准化格式;通过第三遍测试,达到第三标准化格式。

如何标准格式:
1. 列出数据
2. 为每个表确定至少一个键。每个表必须有一个主键。
3. 确定relationships的键。relationships的键是连接两个表的键。
4. 检查支持数据列表中的计算数据。计算数据通常不保存在数据库中。
5. 将数据放在第一遍的标准化格式中:
6. 从tables及relationships除去重复的数据。
7. 以你所除去数据创建一个或更多的tables及relationships。
8. 将数据放在第二遍的标准化格式中:
9. 用多于一个以上的键确定tables及relationships。
10. 除去只依赖于键一部分的数据。
11. 以你所除去数据创建一个或更多的tables及relationships。
12. 将数据放在第三遍的标准化格式中:
13. 除去那些依赖于tables或relationships中其他数据,并且不是键的数据。
14. 以你所除去数据创建一个或更多的tables及relationships。

数据与键
在你开始标准化(测试数据)前,简单地列出数据,并为每张表确定一个唯一的主键。这个键可以由一个字段或几个字段(连锁键)组成。

主键是一张表中唯一区分各行的一组字段。Employee表的主键是Employee ID字段。Works In relationship中的主键包括Office Code及Employee ID字段。给数据库中每一relationship给出一个键,从其所连接的每一个table中抽取其键产生。


将数据放在第一遍的标准化格式中
● 除去重复的组
● 要测试第一遍标准化格式,除去重复的组,并将它们放进他们各自的一张表中。
● 在下面的例子中,Phone Number可以重复。(一个工作人员可以有多于一个的电话号码。)将重复的组除去,创建一个名为Telephone的新表。在Telephone与Office创建一个名为Associated With的relationship。

将数据放在第二遍的标准化格式中
● 除去那些不依赖于整个键的数据。
● 只看那些有一个以上键的tables及relationships。要测试第二遍标准化格式,除去那些不依赖于整个键的任何数据(组成键的所有字段)。
● 在此例中,原Employee表有一个由两个字段组成的键。一些数据不依赖于整个键;例如,department name只依赖于其中一个键(Department ID)。因此,Department ID,其他Employee数据并不依赖于它,应移至一个名为Department的新表中,并为Employee及Department建立一个名为Assigned To的relationship。


将数据放在第三遍的标准化格式中
● 除去那些不直接依赖于键的数据。
● 要测试第三遍标准化格式,除去那些不是直接依赖于键,而是依赖于其他数据的数据。
● 在此例中,原Employee表有依赖于其键(Employee ID)的数据。然而,office location及office phone依赖于其他字段,即Office Code。它们不直接依赖于Employee ID键。将这组数据,包括Office Code,移至一个名为Office的新表中,并为Employee及Office建立一个名为Works In的relationship。





4.考量关系

当你完成标准化进程后,你的设计已经差不多完成了。你所需要做的,就是考量关系。

考量带有数据的关系
你的一些relationship可能集含有数据。这经常发生在多对多的关系中。



遇到这种情况,将relationship转化为一个table。relationship的键依旧成为table中的键。

考量没有数据的关系
要实现没有数据的关系,你需要定义外部键。外部键是含有另外一个表中主键的一个或多个字段。外部键使你能同时连接多表数据。

有一些基本原则能帮助你决定将这些键放在哪里:

一对多 在一对多关系中,“一”中的主键放在“多”中。此例中,外部键放在Employee表中。



一对一 在一对一关系中,外部键可以放进任一表中。如果必须要放在某一边,而不能放在另一边,应该放在必须的一边。此例中,外部键(Head ID)在Department表中,因为这是必需的。



多对多 在多对多关系中,用两个外部键来创建一个新表。已存的旧表通过这个新表来发生联系。



5.检验设计

在你完成设计之前,你需要确保它满足你的需要。检查你在一开始时所定义的行为,确认你可以获取行为所需要的所有数据:
● 你能找到一个路径来等到你所需要的所有信息吗?
● 设计是否满足了你的需要?
● 所有需要的数据都可用吗?
如果你对以上的问题都回答是,你已经差不多完成设计了。

最终设计
最终设计看起来就像这样:




设计数据库的表属性
数据库设计需要确定有什么表,每张表有什么字段。此节讨论如何指定各字段的属性。

对于每一字段,你必须决定字段名,数据类型及大小,是否允许NULL值,以及你是否希望数据库限制字段中所允许的值。

选择字段名
字段名可以是字母、数字或符号的任意组合。然而,如果字段名包括了字母、数字或下划线、或并不以字母打头,或者它是个关键字(详见关键字表),那么当使用字段名称时,必须用双引号括起来。

为字段选择数据类型
SQL Anywhere支持的数据类型包括:
整数(int, integer, smallint)
小数(decimal, numeric)
浮点数(float, double)
字符型(char, varchar, long varchar)
二进制数据类型(binary, long binary)
日期/时间类型(date, time, timestamp)
用户自定义类型

关于数据类型的内容,请参见“SQL Anywhere数据类型”一节。字段的数据类型影响字段的最大尺寸。例如,如果你指定SMALLINT,此字段可以容纳32,767的整数。INTEGER可以容纳2,147,483,647的整数。对CHAR来讲,字段的最大值必须指定。

长二进制的数据类型可用来在数据库中保存例如图像(如位图)或者文字编辑文档。这些类型的信息通常被称为二进制大型对象,或者BLOBS。

关于每一数据类型的完整描述,见“SQL Anywhere数据类型”。

NULL与NOT NULL

如果一个字段值是必填的,你就将此字段定义为NOT NULL。否则,字段值可以为NULL值,即可以有空值。SQL中的默认值是允许空值;你应该显示地将字段定义为NOT NULL,除非你有好理由将其设为允许空值。

关于NULL值的完整描述,请见“NULL value”。有关其对比用法,见“Search conditions”。

选择约束

尽管字段的数据类型限制了能存在字段中的数据(例如,只能存数字或日期),你或许希望更进一步来约束其允许值。

你可以通过指定一个“CHECK”约束来限制任意字段的值。你可以使用能在WHERE子句中出现的任何有效条件来约束被允许的值,尽管大多数CHECK约束使用BETWEEN或IN条件。

更多信息

有关有效条件的更多信息,见“Search conditions”。有关如何为表及字段指定约束,见“Ensuring Data Integrity”。

例子
例子数据库中有一个名为department的表,字段是dept_id, dept_name, dept_head_id。其定义如下:


注意每一字段都被指定为“not null”。这种情况下,表中每一记录的所有字段的数据都必填。

选择主键及外部键
主键是唯一识别表中每一项记录的字段。如何你的表已经正确标准化,主键应当成为数据库设计的一部分。
外部键是包含另一表中主键值的一个或一组字段。外部键关系在数据库中建立了一对一及一对多关系。如果你的设计已经正确标准化,外部键应当成为数据库设计的一部分。

来自百度文库。
分享到:
评论

相关推荐

    秒杀应用的MySQL数据库优化 (转载)

    在数据库设计上,**分表分库**是解决大数据量问题的有效手段。通过对数据进行水平或垂直切分,可以分散负载,提升处理能力。例如,可以按商品ID的哈希值进行分区,使得每个分区的压力相对均衡。 还要关注的是**事务...

    sqlserver数据库优化总结的资料

    10. **数据库设计**:良好的数据库设计是优化的基础。正常化、适当的数据类型选择、合理的范式化程度,都可以影响到数据库的性能。 在提供的压缩文件中,"SQLSERVER 2005管理与开发 优化SQL Server数据库(转载).mht...

    转载 用例场景法设计

    - "bbk3055"可能是具体的测试用例文档、数据库脚本或其他与场景法设计相关的资源。由于信息有限,无法提供详细内容分析,但可以肯定的是,这个文件可能包含了用例场景的详细描述,用于指导测试人员执行测试任务。 ...

    基于SolidWorks三维设计在选煤工程中的应用

    使用SolidWorks进行三维设计的过程通常包括以下几个关键步骤:首先是前期的概念设计阶段,设计者通过SolidWorks的草图工具创建初步的模型,为后续的详细设计提供基础。接下来是详细的三维建模阶段,在这个阶段中,...

    android设计模式详解转载

    在Android中,单例常用于管理全局资源,如网络连接、数据库访问等。例如,我们可以创建一个单例的SharedPreferences对象,以便在应用的任何地方都能方便地读写配置。 2. 工厂模式:提供一个创建对象的接口,但让...

    毕业设计-数值分析.net在线考试系统(完整版.).rar(第1部分)

    4.2.2数据库设计的基本步骤 9 4.3属性图 10 4.3.1学生属性图 10 4.3.2考生得分属性图 10 4.3.3选择题属性图 11 4.3.4填空题属性图 11 4.3.5判断题属性图 11 4.3.6管理员属性图 12 4.4考试系统数据库建表及其说明 12 ...

    毕业设计-数值分析.net在线考试系统(完整版.)(第2部分)

    4.2.2数据库设计的基本步骤 9 4.3属性图 10 4.3.1学生属性图 10 4.3.2考生得分属性图 10 4.3.3选择题属性图 11 4.3.4填空题属性图 11 4.3.5判断题属性图 11 4.3.6管理员属性图 12 4.4考试系统数据库建表及其说明 12 ...

    【转载】NET平台下的架构开发(最全的).docx

    2. **系统需求分析及数据库设计** - 阐述需求分析的重要性,并为示例系统定义基本功能和用例,同时设计数据库结构。 3. **架构概要设计** - 描述整体架构的设计,包括各个层的职责划分。 4. **实体类的实现** - 展示...

    jBPM-jPDL学习笔记——流程设计与控制(转载)

    jPDL(jBPM Process Definition Language)是jBPM特有的流程定义语言,它是一种XML格式,用于描述工作流的各个步骤、决策和交互。jPDL提供了丰富的元素,如任务(Task)、事件(Event)、网关(Gateway)等,帮助...

    题库系统与试卷生成(毕业设计含论文).rar

    【描述】:“特别声明:转载希望作者本人允许。包括毕业论文,答辩ppt中期报告。”这表明该压缩包可能包含了整个毕业设计过程的重要组成部分。毕业论文是对整个项目研究的详细书面阐述,通常包括问题背景、设计目标...

    sso详细设计说明书(下篇)转载(海纳百川文章http://www.cnblogs.com/David-weihw/a)

    “工具”可能指的是实现SSO所需的辅助工具或服务,如数据库用于存储用户信息,密钥管理工具用于安全地生成和存储令牌,以及可能的API网关或负载均衡器来协调SSO服务和应用系统之间的通信。 至于"Passport"这个...

    Laneser MSRS学习日志转载

    这个压缩包中的"Laneser"文件很可能包含了这10天的日志详细内容,包括每个主题的讲解、步骤演示和可能的练习案例,对于想要系统学习MSRS的人来说是一份宝贵的资源。通过深入学习和实践,你将能够熟练运用MSRS进行...

    《转载》ora-00020超出最大进程数

    5. 源码分析:如果标签提到“源码”,可能涉及Oracle数据库的源代码片段,解释了进程管理的相关逻辑。 总之,遇到"ORA-00020 超出最大进程数"的错误,需要理解数据库的进程管理机制,通过适当的方法找出问题的根源...

    Protel设计提高经验

    - **保护声明**:鉴于此资料的重要性和原创性,明确指出任何网站和其他媒体不得转载,确保了知识内容的独特性和版权的安全。 #### 二、书籍特点 - **面向实际需求**:本书直接面向需要学习和提升Protel技能的读者...

    新闻动态生成HTML,asp.net,功能强大,欢迎转载!

    1. **数据库设计**:首先,我们需要设计一个合适的数据库结构来存储新闻信息,如`News`表,包含字段如`ID`(主键)、`Title`(标题)、`Content`(内容)、`PublishDate`(发布日期)等。 2. **数据访问层(DAL)**...

    [转载] JDBC+Servlet+JSP整合开发之-JSP项目实战

    在JDBC中,我们通常会经历以下步骤: 1. 加载数据库驱动。 2. 建立数据库连接。 3. 创建Statement或PreparedStatement对象。 4. 执行SQL查询或更新语句。 5. 处理结果集。 6. 关闭资源。 **Servlet** 是Java编写...

    Spring-Security-3应用的11个步骤.docx

    3. **数据库验证** - 用户信息通常存储在数据库中,Spring Security可以通过UserDetailsService接口与数据库交互,进行用户验证。 4. **Web页面验证规则** - 使用`<intercept-url>`元素设置URL模式及其对应的访问...

    【RPA之家转载视频教程5】在Uipath中添加数据列活动-如何将数据列添加到数据表中.rar

    UiPath是一款领先的RPA平台,它允许用户通过直观的工作流程设计界面来创建自动化流程,从而提高工作效率并减少人为错误。 首先,我们需要理解什么是数据列活动。在UiPath中,数据列活动是处理数据结构的核心组件之...

Global site tag (gtag.js) - Google Analytics