第 3 部分 - 选择键和索引数据采掘要预先计划我所在的某一客户部门一度要处理 8 万多份联系方式,同时填写每个客户的必要数据(这绝对不是小活)。我从中还要确定出一组客户作为市场目标。当我从最开始设计表和字段的时候,我试图不在主索引里增加太多的字段以便加快数据库的运行速度。然后我意识到特定的组查询和信息采掘既不准确速度也不快。结果只好在主索引中重建而且合并了数据字段。我发现有一个指示计划相当关键--当我想创建系统类型查找时为什么要采用号码作为主索引字段呢?我可以用传真号码进行检索,但是它几乎就象系统类型一样对我来说并不重要。采用后者作为主字段,数据库更新后重新索引和检索就快多了。可操作数据仓库(ODS)和数据仓库(DW)这两种环境下的数据索引是有差别的。在 DW 环境下,你要考虑销售部门是如何组织销售活动的。他们并不是数据库管理员,但是他们确定表内的键信息。这里设计人员或者数据库工作人员应该分析数据库结构从而确定出性能和正确输出之间的最佳条件。
使用系统生成的主键这类同技巧 1,但我觉得有必要在这里重复提醒大家。假如你总是在设计数据库的时候采用系统生成的键作为主键,那么你实际控制了数据库的索引完整性。这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。采用系统生成键作为主键还有一个优点:当你拥有一致的键结构时,找到逻辑缺陷很容易。
分解字段用于索引为了分离命名字段和包含字段以支持用户定义的报表,请考虑分解其他字段(甚至主键)为其组成要素以便用户可以对其进行索引。索引将加快 SQL 和报表生成器脚本的执行速度。比方说,我通常在必须使用 SQL LIKE 表达式的情况下创建报表,因为 case number 字段无法分解为 year、serial number、case type 和 defendant code 等要素。性能也会变坏。假如年度和类型字段可以分解为索引字段那么这些报表运行起来就会快多了。
键设计 4 原则 为关联字段创建外键。 所有的键都必须唯一。 避免使用复合键。 外键总是关联唯一的键字段。别忘了索引索引是从数据库中获取数据的最高效方式之一。95% 的数据库性能问题都可以采用索引技术得到解决。作为一条规则,我通常对逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列[字段]采用非成组索引。不过,索引就象是盐,太多了菜就咸了。你得考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。还有,不要索引 memo/note 字段,不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。
不要索引常用的小型表不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。
不要把社会保障号码(SSN)或身份证号码(ID)选作键永远都不要使用 SSN 或 ID 作为数据库的键。除了隐私原因以外,须知政府越来越趋向于不准许把 SSN 或 ID 用作除收入相关以外的其他目的,SSN 或 ID 需要手工输入。永远不要使用手工输入的键作为主键,因为一旦你输入错误,你唯一能做的就是删除整个记录然后从头开始。我在破解他人的程序时候,我看到很多人把 SSN 或 ID 还曾被用做系列号,当然尽管这么做是非法的。而且人们也都知道这是非法的,但他们已经习惯了。后来,随着盗取身份犯罪案件的增加,我现在的同行正痛苦地从一大摊子数据中把 SSN 或 ID 删除。
不要用用户的键在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情况下不要选择用户可编辑的字段作为键。这样做会迫使你采取以下两个措施: 在创建记录之后对用户编辑字段的行为施加限制。假如你这么做了,你可能会发现你的应用程序在商务需求突然发生变化,而用户需要编辑那些不可编辑的字段时缺乏足够的灵活性。当用户在输入数据之后直到保存记录才发现系统出了问题他们该怎么想?删除重建?假如记录不可重建是否让用户走开? 提出一些检测和纠正键冲突的方法。通常,费点精力也就搞定了,但是从性能上来看这样做的代价就比较大了。还有,键的纠正可能会迫使你突破你的数据和商业/用户界面层之间的隔离。所以还是重提一句老话:你的设计要适应用户而不是让用户来适应你的设计。不让主键具有可更新性的原因是在关系模式下,主键实现了不同表之间的关联。比如,Customer 表有一个主键 CustomerID,而客户的定单则存放在另一个表里。Order 表的主键可能是 OrderNo 或者 OrderNo、CustomerID 和日期的组合。不管你选择哪种键设置,你都需要在 Order 表中存放 CustomerID 来保证你可以给下定单的用户找到其定单记录。假如你在 Customer 表里修改了 CustomerID,那么你必须找出 Order 表中的所有相关记录对其进行修改。否则,有些定单就会不属于任何客户--数据库的完整性就算完蛋了。如果索引完整性规则施加到表一级,那么在不编写大量代码和附加删除记录的情况下几乎不可能改变某一条记录的键和数据库内所有关联的记录。而这一过程往往错误丛生所以应该尽量避免。
可选键(候选键)有时可做主键记住,查询数据的不是机器而是人。假如你有可选键,你可能进一步把它用做主键。那样的话,你就拥有了建立强大索引的能力。这样可以阻止使用数据库的人不得不连接数据库从而恰当的过滤数据。在严格控制域表的数据库上,这种负载是比较醒目的。如果可选键真正有用,那就是达到了主键的水准。我的看法是,假如你有可选键,比如国家表内的 state_code,你不要在现有不能变动的唯一键上创建后续的键。你要做的无非是创建毫无价值的数据。如你因为过度使用表的后续键[别名]建立这种表的关联,操作负载真得需要考虑一下了。
别忘了外键大多数数据库索引自动创建的主键字段。但别忘了索引外键字段,它们在你想查询主表中的记录及其关联记录时每次都会用到。还有,不要索引 memo/notes 字段而且不要索引大型文本字段(许多字符),这样做会让你的索引占据大量的数据库空间。
分享到:
相关推荐
设计一个完善的数据库系统是一项系统工程,它需要在深入理解用户需求的基础上,合理规划信息模型、数据的逻辑与物理组织,并确保系统的安全性与完整性。本篇文章将详细探讨如何设计一个满足用户需求、高效可用的...
在实际设计过程中,数据库结构设计通常包括需求分析、逻辑设计和物理设计三个阶段。 需求分析阶段主要解决的是内容要求的问题,即调查用户需要操作的数据,并决定在数据库中存储哪些信息。逻辑设计阶段则关注数据...
数据库课程设计是计算机科学教育中的一个重要环节,它涵盖了数据库理论、设计原则以及实际操作技能的实践应用。在这个项目中,"包含源数据库"意味着你将有机会深入研究并操作实际的数据库系统,这对于理解数据库的...
### 数据库原理与设计 #### 一、数据库基本知识 **1.1 信息、数据与数据处理** ...通过以上内容的详细介绍,读者可以对数据库原理与设计有一个全面的理解,这对于学习和掌握数据库技术非常有帮助。
数据库课程设计是计算机科学专业中一项重要且实用的教育活动,它强调理论与实践的结合,通过模拟真实的工作流程,使学生在实际操作中深入理解并掌握数据库系统的设计方法。在本课程设计中,学生将经历从需求分析到...
数据库系统设计实验是计算机科学与信息技术领域中一个重要的实践环节,它涵盖了理论知识与实际操作的结合,旨在帮助学生深入理解和掌握数据库管理系统的原理、设计方法以及应用技巧。在这个实验中,我们将探讨以下几...
【高级数据库技术】是计算机科学领域中的一个重要主题,尤其对于那些深入学习数据库管理和系统开发的专业人士来说,这一领域的知识至关重要。上海交通大学计算机硕士的高级数据库课程课件涵盖了这个主题的多个核心...
数据库课程设计是计算机科学与信息技术领域中的一个重要环节,它涵盖了数据管理、数据存储、数据查询以及数据安全等多个方面的知识。在本次课程设计中,学生通常会深入学习并实践如何使用数据库管理系统(DBMS)来...
数据库原理及设计是计算机科学中的一个关键领域,它涉及到数据的组织、存储、检索和管理。这个主题对于软件开发者、系统管理员以及任何处理大量数据的人来说都至关重要。在本课件中,我们将深入探讨数据库的基本概念...
2. **非关系型数据库(NoSQL)**:为了应对大规模数据存储需求而出现的一类数据库技术,具有灵活的数据模型、高性能和可扩展性等特点。 3. **分布式数据库**:将数据分布在多个物理位置上,提供全局视图,适用于大型...
数据库课程设计是计算机科学与信息管理领域中的一项重要实践教学活动,它不仅要求学生掌握理论知识,还要求学生能够将理论应用于实践中,以解决实际问题。课程设计的完成度和质量,直接关系到学生对于数据库知识的...
数据库设计是一项复杂的任务,涉及到技术、管理和业务等多个层面。良好的数据库设计不仅能提高数据的存储效率和访问速度,还能显著提升信息系统的整体性能。通过遵循上述设计规范和原则,可以有效避免常见的设计缺陷...
遵守这三大范式可以确保数据库的设计是合理的和科学的。 在设计数据库时,还需要注意表之间的关联关系,可以分为一对一、一对多和多对多三种关系。 二、数据库性能优化 数据库性能优化是非常重要的,主要是优化...
综上所述,数据库设计是一个涉及多个层面的复杂过程,既需要深厚的理论知识作为支撑,也需要丰富的实践经验来指导实践操作。通过遵循上述步骤和技巧,可以有效地构建出既能满足当前需求又能适应未来发展变化的高质量...
在计算机科学领域,数据库系统课程设计是一项具有深远意义的实践教学活动,它不仅强化了学生对数据库管理系统(DBMS)理论知识的理解,同时也培养了学生运用数据模型和E-R工具解决现实问题的能力。此外,它还能提高...
上海应用技术学院计算机科学与信息工程专业将这一理念融入到了《数据库课程设计任务书》中,旨在通过实践教学模式,深化学生对数据库原理的理解,并培养学生在实际业务场景中应用数据库技术的能力。本课程设计的主题...
需求分析是设计数据库的起点,是整个数据库设计过程中最重要的环节之一。需求分析的准确性直接影响到后续设计的合理性和实用性。需求分析的过程通常可以分为三个部分:系统调查、需求整理和需求规格说明书的编写。...
本文通过一个具体案例——树形菜单的数据表设计,阐述如何合理利用冗余数据来优化数据库结构,并讨论传统设计方案存在的不足之处。 #### 树形菜单设计背景 树形结构在计算机科学领域中有着广泛的应用,尤其是在...
通过学习和应用规范化设计理论,设计师可以更加科学地选择关系模式,优化数据库结构,提高系统的整体性能。此外,规范化设计还有助于减少数据冗余和避免异常问题,从而确保数据库的数据一致性和操作的正确性。 综上...
数据库设计与高级查询是计算机科学中的关键领域,特别是在管理和处理大量数据时。这些笔记涵盖了从基本概念到复杂操作的广泛内容,旨在帮助学习者深入理解如何有效地构建和操作数据库。 一、数据库设计基础 数据库...