数据模型
数据模型是指用实体、实体的属性、实体之间的关系对企业在运营活动中涉及到所有业务概念和业务活动进行统一的定义和描述。数据模型是业务人员和技术开发人员之间沟通的平台。这里先解释下两个概念
实体:现实世界中存在的可以相互区分的事务或概念念称为实体。实体可以分为事物实体和概念实体。例如:一个学生、一个工人等是事物实体。一门课、一个班级等称为概念实体。
实体的属性:每个实体都有自己的特征,利用实体的属性可以区别不同的实体。例如。学生的属性为姓名、性别、年龄等
数据建模
数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,用图形化的形式去描述业务规则的过程,从而表示现实世界中事务的相互关系的一种映射。数据建模主要包括概念模型设计、逻辑模型设计和物理模型设计。建模的流程图如下:,
概念模型
概 念模型是一种高层次的数据模型。它定义了主要的业务概念及其关系,通过对业务需求和调研访谈内容的分析,对业务模型进行初步的归纳和提炼。概念模型的主题 域主要反映了企业活动中某方面的业务概念和内容,一般由同一类别的或者关系较为紧密的主题组成。主题数通过分析业务的需求,业务活动的流程和各种活动得到 的。主题根据实际的业务需要可以进一步细化成更小的主题或者实体,而实体是概念模型的最小单元,是不可再分的。例如:人员基本信息主题域由人员职位信息, 人员社会关系信息和人员通信信息等主题或者实体组成。主题域、主题、实体以及它们之间的关系组成了整个概念模型的基础架构,如下图所示
逻辑模型
逻辑模型是对概念模型的进一步分解和细化,描述了实体、实体属性以及实体之间的关系,是概念模型延伸,一般的逻辑模型有第三范式,星型模型和雪花模型。模型的主要元素为主题、实体、实体属性和关系。
所 谓主题,是指与业务相关的数据主要类别;实体通常定义为一个概念、一个事件或者一个人,是唯一的;实体属性用来描述实体的特征,处于最低层次;关系用来描 述实体之间的业务规则。例如:客户实体包括客户姓名、地址、出生日期等属性。逻辑模型的作用主要有两点。一是便于技术开发人员和业务人员或者用户进行沟通 交流,使得整个概念模型更易于理解,进一步明确需求。二是作为物理模型设计的基础,由于逻辑模型不依赖于具体的数据库实现,使用逻辑模型可以生成针对具体 数据库管理系统的物理模型,保证物理模型充分满足用户的需求。
物理模型
物 理模型中逻辑模型的基础上描述模型实体的细节,包括数据库产品对应的数据类型、长度、索引等因素,为逻辑模型选择一个最有的物理存储环境。逻辑模型转化为 物理模型的过程也就是实体名转化为表名,属性名转化为物理列名的过程。在设计物理模型时,还需要考虑数据存储空间的分配,包括对列属性必须做出明确的定 义。例如:客户姓名的数据类型是varchar2,长度是20,存储在Oracle数据库中,并且建立索引用于提高该字段的查询效率。
如何设计数据模型
设计概念模型
从定义上来说,概念模型时最高层次的数据模型,反映了数据仓库的主要主题和重要业务之间的关系。
一般来说,在进行数据仓库系统设计和开发之前,设计开发人员和业务人员已经对概念模型达成了
共识,因为概念模型反映的是核心的业务问题。
概念模型的设计步骤如下:
1、从业务需求中提取出重要的业务数据主题,包括对业务主题的详细解释,建下表
2、在业务数据主题的基础上进行数据主题的划分,包括对数据主题域的详细解释,如下图所示
3、划分主题域概念模型:根据数据主题域的划分,细化内部的组织结构和业务关系,如下图所示
总 结:概念模型建模的流程大致可以分成如下几部分:通过对业务系统的详细说明,进行数据的梳理,列出数据主题的详细清单,并对每个数据主题做出详细的解释, 然后结果归纳、分类,整理成各个数据主题域,列出每个数据主题域包括哪些部分,并对每个数据主题域做出详细解释,最后划分成主题域模型概念。
设计逻辑模型
从定义上讲,逻辑模型是以概念模型为基础,对概念模型的进一步细化、分解。逻辑模型通过实体和实体之间的关系描述业务的需求和系统显示的技术领域,是业务人员和技术人员沟通的桥梁和平台。概念模型和逻辑模型的关系如下图。
逻辑模型除了在概念模型的基础上丰富和细化主题域,并且确定每个主题域包含哪些主题外,还需要以下几个步骤:
1、分析需求,列出需要分析的主题,事实(需求目标),维度指标,维度层次、分析的指标、分析的方法、数据的来源、关注的对象等。
事实是数据仓库中的信息单元,处于数据模型的中心,也可以称作指标实体或者需求目标。事实体现了在现实世界中所获取的事务处理值,这些值只与每个相关维度的 一个点对应。事实应一般具有如下特性:可以为用户提供定量的数据、商务数据或实际数据的基本分析点,是用户进行分析活动的中心和灵魂;包含了多种访问指标 数据的路径、维度或指标;包含相关的标准数据;构成了每个维度中最低一级的类别和一个信息组中的指标;能够扩大成很大的表,容纳今后日益增加的数据。常见 维度有,Product_Name,Category,TimeKey,Date
维度在数据仓库中主要对事实指标进行过滤和重新组织提供指导。可以将用户对事实的查询结果按照维度指标进行筛选,只允许与维度指标相关的数据返回给用户。维 度一般具有如下特性:可以形成一个维度体系,具备访问和过滤事实的能力,能够提供相关的非标准实体,包括一个完整的维度体系编码、关键词以及相关的表示, 可以映射到用户所需要信息的列。在物理数据仓库中是较小的表,可以对前台用户的应用程序进行数据填充,或引用红花的数据仓库分析。
维度层级用来描述维度的各个层级。根据维度细节程度的不同,划分数据在逻辑上的等级关系,例如,时间维度包括年、季度、月、日等层次,地区维度包括国家、省、市等层次
下表为主题是电力营销业务分析处理情况
2、选择用户感兴趣的数据,通过业务需求将需要分析的指标分离抽取出来,转化成逻辑模型需要的实体。
例如,从用户数量、用电储存容量等分析指标中分离出用户实体和用电量实体。
3、在实体中需要增加时间戳属性,因为实体需要保存各个阶段的历史数据。通常情况下,如果实体为
统一编码,则不需要增加时间戳属性。
4、需要考虑粒度层次的划分。数据仓库的粒度层次划分直接影响了数据仓库的设计,通常细粒度的数据模型
直接从企业模型选取实体作为逻辑模型的实体,而粗粒度的数据模型需要经过汇总计算得到相应的实体。
粒度决定了企业数据仓库的实现方式、性能、灵活性和数据仓库的数据量。
5、在粒度层次划分的基础上,还需要进行关系模式的定义。关系模式可以采用第三范式、星型模型或者
雪花模型的特点进行定义,对当前的主题进行关系模式的划分,形成各个实体,实体属性,实体之间的
的关系等内容。同时在逻辑模型框架的基础上对实体的中英文名称、属性、属性的值域进行明确、完善和细化,真实反映业务逻辑关系和业务规则。
逻辑模型的设计流程可参见下图
设计物理模型
在逻辑模型的基础上,为用户生成环境选取一个合适的物理结构的过程,包括合适的
存储结构和存储方法,称作物理模型的设计过程。物理模型必须对列的属性进行明确的
定义,包括:列名、数据类型、长度、能否为空、有效性规则、默认值等。
逻辑模型转变为物理模型包括以下几个步骤:
1、实体名(Entity)转变为表名(Table)。
2、属性名(Attribute)转换为列名(Column),确定列的属性(Property)。
物理模型确定后,可以进一步确定数据的存放位置和存储空间的分配,最后生成定义
数据库的SQL命令
数据仓库的物理模型可参见下图
参考至:《商业智能深入浅出 Cognos,Informatica技术与应用》王飞著
http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0803zhousb/
http://www.cnblogs.com/luowende2012/archive/2012/07/18/2596762.html
http://books.google.com.hk/books?id=cR_8GrGyw-MC&pg=PA82&lpg=PA82&dq=%E6%95%B0%E6%8D%AE%E4%BB%93%E5%BA%93+%E6%95%B0%E6%8D%AE%E5%88%86%E5%89%B2&source=bl&ots=VmCS7gvrGo&sig=LDYQ73fnkcCJ2jCbwFQGuqNiGMc&hl=zh-CN&sa=X&ei=m9AsUczOD9DTkgWf-ICIBg&ved=0CDUQ6AEwAQ#v=onepage&q&f=false
http://wenku.baidu.com/view/bb53626ef5335a8102d22081.html
本文原创,转载请注明出处、作者
如有错误,欢迎指正
邮箱:czmcj@163.com
相关推荐
在数据仓库的设计中,数据库建模是关键步骤。常见的方法有概念数据模型、逻辑数据模型和物理数据模型。概念模型描绘业务实体及其关系,逻辑模型进一步细化并引入数据库规范,物理模型关注存储和性能优化,如分区、...
"浅谈oracle数据库的建模与设计--Oracle专区--IT胖子2.htm"和"浅谈oracle数据库的建模与设计--Oracle专区--IT胖子1.htm"讨论了数据库的设计原则和方法。数据库建模包括概念数据模型、逻辑数据模型和物理数据模型,...
互联网技术的进步,如3D建模技术的发展,使得设计者能够将二维图纸转化为三维模型,不仅增强了作品的直观性和互动性,还提高了设计的效率和精确度。 其次,互联网对艺术设计产生的影响主要体现在以下几个方面: 1....
7. 浅谈SUPL技术标准对位置业务发展的机遇与挑战:分析卫星定位技术对服务创新的影响。 8. IEEE 802.16e调度服务中的切换算法分析:探讨移动WiMAX网络中的效率优化。 9. MIMO信道模型综述:总结多输入多输出无线通信...
Delphi 12.3控件之TraeSetup-stable-1.0.12120.exe
基于GPRS,GPS的电动汽车远程监控系统的设计与实现.pdf
内容概要:本文详细介绍了如何利用MATLAB/Simulink 2018a进行单机无穷大系统的暂态稳定性仿真。主要内容包括搭建同步发电机模型、设置无穷大系统等效电源、配置故障模块及其控制信号、优化求解器设置以及绘制和分析转速波形和摇摆曲线。文中还提供了多个实用脚本,如故障类型切换、摇摆曲线计算和极限切除角的求解方法。此外,作者分享了一些实践经验,如避免常见错误和提高仿真效率的小技巧。 适合人群:从事电力系统研究和仿真的工程师和技术人员,尤其是对MATLAB/Simulink有一定基础的用户。 使用场景及目标:适用于需要进行电力系统暂态稳定性分析的研究项目或工程应用。主要目标是帮助用户掌握单机无穷大系统的建模和仿真方法,理解故障对系统稳定性的影响,并能够通过仿真结果评估系统的性能。 其他说明:文中提到的一些具体操作和脚本代码对于初学者来说可能会有一定的难度,建议结合官方文档或其他教程一起学习。同时,部分技巧和经验来自于作者的实际操作,具有一定的实用性。
KUKA机器人相关资料
基于DLR模型的PM10–能见度–湿度相关性 研究.pdf
内容概要:本文详细介绍了如何使用MATLAB/Simulink进行光伏并网系统的最大功率点跟踪(MPPT)仿真,重点讨论了电导增量法的应用。首先阐述了电导增量法的基本原理,接着展示了如何在Simulink中构建光伏电池模型和MPPT控制系统,包括Boost升压电路的设计和PI控制参数的设定。随后,通过仿真分析了不同光照强度和温度条件对光伏系统性能的影响,验证了电导增量法的有效性,并提出了针对特定工况的优化措施。 适合人群:从事光伏系统研究和技术开发的专业人士,尤其是那些希望通过仿真工具深入理解MPPT控制机制的人群。 使用场景及目标:适用于需要评估和优化光伏并网系统性能的研发项目,旨在提高系统在各种环境条件下的最大功率点跟踪效率。 其他说明:文中提供了详细的代码片段和仿真结果图表,帮助读者更好地理解和复现实验过程。此外,还提到了一些常见的仿真陷阱及解决方案,如变步长求解器的问题和PI参数整定技巧。
KUKA机器人相关文档
内容概要:本文详细探讨了双馈风力发电机(DFIG)在Simulink环境下的建模方法及其在不同风速条件下的电流与电压波形特征。首先介绍了DFIG的基本原理,即定子直接接入电网,转子通过双向变流器连接电网的特点。接着阐述了Simulink模型的具体搭建步骤,包括风力机模型、传动系统模型、DFIG本体模型和变流器模型的建立。文中强调了变流器控制算法的重要性,特别是在应对风速变化时,通过实时调整转子侧的电压和电流,确保电流和电压波形的良好特性。此外,文章还讨论了模型中的关键技术和挑战,如转子电流环控制策略、低电压穿越性能、直流母线电压脉动等问题,并提供了具体的解决方案和技术细节。最终,通过对故障工况的仿真测试,验证了所建模型的有效性和优越性。 适用人群:从事风力发电研究的技术人员、高校相关专业师生、对电力电子控制系统感兴趣的工程技术人员。 使用场景及目标:适用于希望深入了解DFIG工作原理、掌握Simulink建模技能的研究人员;旨在帮助读者理解DFIG在不同风速条件下的动态响应机制,为优化风力发电系统的控制策略提供理论依据和技术支持。 其他说明:文章不仅提供了详细的理论解释,还附有大量Matlab/Simulink代码片段,便于读者进行实践操作。同时,针对一些常见问题给出了实用的调试技巧,有助于提高仿真的准确性和可靠性。
linux之用户管理教程.md
内容概要:本文详细介绍了利用三菱PLC(特别是FX系列)和组态王软件构建3x3书架式堆垛式立体库的方法。首先阐述了IO分配的原则,明确了输入输出信号的功能,如仓位检测、堆垛机运动控制等。接着深入解析了梯形图编程的具体实现,包括基本的左右移动控制、复杂的自动寻址逻辑,以及确保安全性的限位保护措施。还展示了接线图和原理图的作用,强调了正确的电气连接方式。最后讲解了组态王的画面设计技巧,通过图形化界面实现对立体库的操作和监控。 适用人群:从事自动化仓储系统设计、安装、调试的技术人员,尤其是熟悉三菱PLC和组态王的工程师。 使用场景及目标:适用于需要提高仓库空间利用率的小型仓储环境,旨在帮助技术人员掌握从硬件选型、电路设计到软件编程的全流程技能,最终实现高效稳定的自动化仓储管理。 其他说明:文中提供了多个实用的编程技巧和注意事项,如避免常见错误、优化性能参数等,有助于减少实际应用中的故障率并提升系统的可靠性。
基于STM32的循迹避障小车 主控:STM32 显示:OLED 电源模块 舵机云台 超声波测距 红外循迹模块(3个,左中右) 蓝牙模块 按键(6个,模式和手动控制小车状态) TB6612驱动的双电机 功能: 该小车共有3种模式: 自动模式:根据红外循迹和超声波测距模块决定小车的状态 手动模式:根据按键的状态来决定小车的状态 蓝牙模式:根据蓝牙指令来决定小车的状态 自动模式: 自动模式下,检测距离低于5cm小车后退 未检测到任何黑线,小车停止 检测到左边或左边+中间黑线,小车左转 检测到右边或右边+中间黑线,小车右转 检测到中边或左边+中间+右边黑线,小车前进 手动模式:根据按键的状态来决定小车的状态 蓝牙模式: //需切换为蓝牙模式才能指令控制 *StatusX X取值为0-4 0:小车停止 1:小车前进 2:小车后退 3:小车左转 4:小车右转
矢量边界,行政区域边界,精确到乡镇街道,可直接导入arcgis使用
内容概要:本文探讨了基于IEEE33节点的主动配电网优化方法,旨在通过合理的调度模型降低配电网的总运行成本。文中详细介绍了模型的构建,包括风光发电、储能装置、柴油发电机和燃气轮机等多种分布式电源的集成。为了实现这一目标,作者提出了具体的约束条件,如储能充放电功率限制和潮流约束,并采用了粒子群算法进行求解。通过一系列实验验证,最终得到了优化的分布式电源运行计划,显著降低了总成本并提高了系统的稳定性。 适合人群:从事电力系统优化、智能电网研究的专业人士和技术爱好者。 使用场景及目标:适用于需要优化配电网运行成本的研究机构和企业。主要目标是在满足各种约束条件下,通过合理的调度策略使配电网更加经济高效地运行。 其他说明:文章不仅提供了详细的理论推导和算法实现,还分享了许多实用的经验技巧,如储能充放电策略、粒子群算法参数选择等。此外,通过具体案例展示了不同电源之间的协同作用及其经济效益。
KUKA机器人相关文档
内容概要:本文详细介绍了将光热电站(CSP)和有机朗肯循环(ORC)集成到综合能源系统中的优化建模方法。主要内容涵盖系统的目标函数设计、关键设备的约束条件(如CSP储热罐、ORC热电耦合)、以及具体实现的技术细节。文中通过MATLAB和YALMIP工具进行建模,采用CPLEX求解器解决混合整数规划问题,确保系统在经济性和环境效益方面的最优表现。此外,文章还讨论了碳排放惩罚机制、风光弃能处理等实际应用场景中的挑战及其解决方案。 适合人群:从事综合能源系统研究的专业人士,尤其是对光热发电、余热利用感兴趣的科研工作者和技术开发者。 使用场景及目标:适用于需要评估和优化包含多种能源形式(如光伏、风电、燃气锅炉等)在内的复杂能源系统的项目。目标是在满足供电供热需求的同时,最小化运行成本并减少碳排放。 其他说明:文中提供了大量具体的MATLAB代码片段作为实例,帮助读者更好地理解和复现所提出的优化模型。对于初学者而言,建议从简单的确定性模型入手,逐渐过渡到更复杂的随机规划和鲁棒优化。
网站设计与管理作业一.ppt