数据实际上就是描述事物的符号记录,是信息存在的一种形式。只有通过解释或处理的数据才能成为有用的信息。
数据模型是对现实世界数据特征的抽象。
数据模型一般应满足三个要求:
(1)能比较真实地模拟现实世界
(2)数据模型要容易被人们理解
(3)数据模型要能够很方便地在计算机上实现
用一种模型来同时很好地满足这三方面的要求是比较困难的,所以在数据据系统中可以针对不同的使用对象和应用目的采用不同的数据模型。
在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。数据模型是为数据和信息建模的工具。
数据模型分成两个不同的层次:
(1)概念模型,也称信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计。各种DBMS软件都是基于某种数据模型的。
(2)组织层数据模型,是从数据的组织层来描述数据.主要包括网状模型、层次模型、关系模型以及对象-关系模型等,它是按计算机系统的观点对数据建模。主要用于DBMS的实现。
数据模型的三要素:据的基本结构、数据的约束条件和定义在数据上的操作。
概念层数据模型
1.基本概念
概念模型用于信息世界的建模。概念模型是面向用户、面向世界的数据模型,它不依赖于某一个DBMS。但可以转换为计算机上某一DBMS支持的特定数据模型。
概念模型特点:
(1)具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识.
(2)应该简单、清晰、易于用户理解,是用户与数据库设计人员之间进行交流的语言。
2.实体-联系模型
(1) 实体(Entity)
客观存在并可相互区别的事物称为实体。实体可以是具体的人、事、物,也可以是抽象的概念或联系.
(2) 属性(Attribute)
实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。
(3) 联系(Relationship)
现实世界事物内部及事物之间的联系在信息世界中反映为实体内部的联系和实体间的联系。
● 体型之间的一对一、一对多、多对多联系不仅存在于两个实体型之间,也存在于两个以上的实体型之间。
● 一个实体集内的各实体之间也可以存在一对一、一对多、多对多的联系 。
● 系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来。
组织层数据模型
关系数据模型是目前最重要的一种数据模型。关系数据库采用关系模型作为数据的组织方式。
一、关系模型的数据结构
1.关系的性质
①列是同质的,即每一列中的分量是同一类型的数据,来自同一个域。
②不同的列可出自同一个域,称其中的每一列为一个属性,不同的属性要给予不同的属性名。
③列的顺序无所谓,即列的次序可以任意交换。
④任意两个元组不能完全相同。
⑤行的顺序无所谓,即行的次序可以任意交换。
⑥分量必须取原子值,即每一个分量都必须是不可分的数据项。
2.元组
表中的每一行称为一个元组,也称为一个记录。
3.属性
表中的每一列是一个属性值集。属性分为属性名与属性值。
4.主码
是表中的属性或属性组,用于唯一地确定一个组。
5.域
属性的取值范围称为域。
二、关系模型的数据操作
1.选择
是在关系中选择满足给定条件的诸元组。
2.投影
是从关系中选择出若干属性列组成新的关系。
3.连接是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。
自然连接:要求两个关系中进行比较的分量必须是相同的属性组,并且要在结果中把重复的属性去掉。
三、关系模型的数据完整性约束
关系模型的完整性规则是对关系的某种约束条件。关系模型中可以有三类完整性约束:实体完整性、参照完整性和用户定义的完整性。
1.实体完整性(Entity Integrity)
实体完整性规则:若属性A是基本关系R的主属性,则属性A不能取空值。
实体完整性是指关系数据库中所有的表都必须有主码,而且表中不允许存在如下的记录:
·无主码值的记录
·主码值相同的记录
2.参照完整性(Referential integrity)
现实世界中的实体之间往往存在某种联系,在关系模型中实体及实体间的联系都是用关系来描述的。这样就自然存在着关系与关系间的引用。
定义外码:设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码,并称基本关系R为参照关系,基本关系S为被参照关系或目标关系。
参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:
·或者取空值(F的每个属性值均为空值);
·或者等于S中某个元组的主码值。
例1:
学生(学号,姓名,性别,专业号,年龄)
专业(专业号,专业名)
“学生”的“专业号”必须参照“专业”的“专业号”
例2:
学生(学号,姓名,性别,专业号,年龄)
课程(课程号,课程名,学分)
选修(学号,课程号,成绩)
3.用户定义的完整性(User-defined integrity)
实体完整性和参照性适用于任何关系数据库系统。除此之外,不同的关系数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件,用户定义的完整性就是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。例如某个属性必须取唯一值、某些属性值之间应满足一定的函数关系、某个属性的取值范围在0~100之间等。关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。
http://jsj.zjwchc.com/shujuku/shujuku/default.htm
分享到:
相关推荐
3. 术语和定义:数据中台元数据规范定义了元数据相关的术语和概念,例如元模型、元数据描述、技术属性、业务属性、操作属性等。 4. 缩略语:数据中台元数据规范定义了元数据相关的缩略语,例如ICS、CCS、L等。 5. ...
该数据集包括yolo和slp两种格式,数据集根据与猪只估重和姿态跟踪相关的体表参数,确定关键点; yolo格式数据集中除了常规的目标框外,还多了16个关键点,从而便于体表参数提取与姿态跟踪; slp数据集为猪只关键点...
数据湖解决方案和相关资料集合,供大家学习参考。包括: 2020阿里云数据湖高峰论坛发布资料合集: 阿里云数据湖应用实践白皮书; 阿里云云原生数据湖体系; 数据湖解决方案-本地生活行业应用最佳实践; 数据湖解决...
猪参数数据集(包括yolo和slp两种格式,数据集中根据与猪只估重和姿态跟踪相关的体表参数,确定关键点。其中yolo格式数据集中除了常规的目标框外,还多了16个关键点;而slp数据集为猪只关键点组成的骨架).zip 猪...
Ip数据有关信息 IP数据报的格式是指IP数据报的基本结构,包括报头区和数据区两部分。报头区中包括版本、协议类型、长度、服务类型、生存周期、头部校验和、地址等字段,而数据区则是高层传输的数据。报头区的主要...
4. **合规性**:遵守相关的法律法规,如数据隐私保护法,确保数据采集和使用的合法性。 5. **数据质量**:建立严格的数据质量控制机制,确保采集的数据准确无误。 在使用LabVIEW进行数据采集和处理时,开发者需要...
本手册参考了多种数据质量元数据管理相关的文档和标准。 1.3 预期读者 本手册的预期读者是数据质量用户,包括数据管理员、数据分析员、数据科学家等。 1.4 术语定义 本手册中使用了一些专业术语,例如数据质量、...
因此,对数据交易相关法规的研究对于理解我国数据要素市场的现状和发展趋势至关重要。 #### 二、数据交易相关法规体系概述 我国已初步建立起一套涵盖政策、发展规划、国家标准和法律法规在内的数据交易法规体系。...
和营养饮食相关的数据集 数据说明; 训练数据包含不同类型的坚果,在测试数据包含一盘坚果,你必须检测不同的坚果,并把他们的平方。 这个数据集中的项目是从杂货店中收集的,数据集中用到的元素都是从商店里拿来的。...
大智慧新一代数据管理提供了三种数据扩展方式,分别是附加数据、扩展数据和自定义数据,以满足用户对股票分析的深度需求。 1. **附加数据**: - 由服务器提供,客户端按需请求。 - 包括三种类型:股票相关序列值...
自然景观图片数据集 数据说明: 数据集创建的方式来测试CartoonsGan方法与fastai。 内容: 这些数据集是由flickr网站的7项研究创建的 这些研究包括 风景(900张图片) 风景山 (900张图片) 风景沙漠(100张图片 风景海...
该数据集是一个用于训练、验证和评估基于人工智能的混凝土裂缝检测算法的注释图像数据集。包含超过 56,000 张混凝土桥梁桥面、墙壁和铺路面的裂缝和非裂缝图像。该数据集包括最窄 0.06 毫米和最宽 25 毫米的裂缝。该...
本书系统地介绍了数据仓库和数据挖掘技术,全本由两部分组成,第1章到第3章介绍数据仓库的基本概念和相关技术,第4章到第11章介绍数据挖掘的基本概念和各种算法,包括数据仓库构建、OLAP技术、分类方法、聚类方法、...
"数据透视表和数据透视图PPT学习教案" 数据透视表是一种数据显示的组织方式,能够快速合并比较大量的数据。它由7部分组成,包括页字段、页字段项、数据字段、数据项、行字段、列字段和数据区域等。创建数据透视表...
例如,故障轴承可能会产生特定的振动频率,这些频率通常与轴承的缺陷类型(如滚道损伤、球破损等)和位置有关。 在机器学习方面,该数据集可以用于训练各种监督学习模型,如支持向量机(SVM)、随机森林(RF)、神经...
企业数据模型是中国联通IT系统数据架构规范的重要组成部分,该规范旨在为中国联通企业提供一个统一的数据架构,以促进企业数据的集成和共享。 中国联通企业数据模型体系 中国联通企业数据模型体系是一种统一的数据...
8. **培训与沟通**:对员工进行数据治理的培训和教育,提高全员的数据意识,使他们理解数据治理的重要性,并知道如何在日常工作中遵循相关规定。 9. **持续改进**:数据治理不是一次性项目,而是一个持续的过程。...
《利用Python进行数据分析》这本书是数据科学领域的一本经典之作,它主要介绍如何使用Python语言和相关的数据分析库,如pandas、numpy等,来进行高效的数据处理、分析和可视化。书中包含了许多实例,这些实例的数据...
石头剪刀布包含来自不同种族、年龄和性别的不同手的图像,摆出石头剪刀布的姿势,并贴上标签。这些图像都是使用CGL技术生成的,作为一个实验,以确定是否可以使用基于CGL的数据集对真实图像进行分类。 请注意,所有...