一、多维数据模型及相关概念
数据模型一般有两个层次:概念层(逻辑层)和物理层。逻辑数据模型是从概念角度抽象出现实世界的内在规律,如业务流程、数据架构等;物理数据模型则侧重于特定环境下的具体实现,如效率、安全性等.
多维数据模型是一个逻辑概念,该模型主要解决如何对大量数据进行快速查询和多角度展示,以便得出有利于管理决策的信息和知识。多维数据模型的应用领域主要有数据仓库、OLAP和数据挖掘三个方面。其中,多维结构是OLAP的核心。
多维数据模型通过引入维、维分层和度量等概念,将信息在概念上视为一个立方体。
1、立方体:用三维或更多的维数描述一个对象,每个维彼此垂直。数据的度量值发生在维的交叉点上,数据空间的各个部分都有相同的维属性。
2、维:是人们观察数据的特定角度,是考虑问题时的一类属性。属性的集合构成一个维(如时间维、机构维等)。
3、维分层:同一维度还可以存在细节程度不同的各个描述方面(如时间维可包括年、季度、月份、旬和日期等)。
4、维属性:维的一个取值,是数据项在某维中位置的描述(例如“某年某月某日”是在时间维上位置的描述)。
5、度量:立方体中的单元格,用以存放数据。
OLAP的基本多维分析操作有钻取(roll up,drill down)、切片(Slice)、切块(Dice)及旋转(Pivot)等。
钻取包含向下钻取和向上钻取。上卷操作,钻取的深度与维所划分的层次相对应。上卷操作通过维规约,在数据立方体上进行聚集。下钻操作是上卷操作的逆操作,由不太详细的数据到更详细的数据。
切片和切块是在一部分维上选定值后,度量数据在剩余维上的分布。在多维数据结构中,按照二维、三维进行切块可得到所需数据。如在“机构、产品、时间”三维立方体中进行切块和切片,可得到各城市、各产品的销售情况。
旋转(转轴)是变换维的方向,即在表格中重新安排维的放置(如行列互换),通过旋转得到不同视角的数据。
二、多维数据模型的物理实现
OLAP多维数据模型的实现有多种途径,其中主要有采用数组的多维数据库、关系型数据库以及两者相结合的方式,人们通常称之为MOLAP、ROLAP和HOLAP。
1、多维联机分析处理(多维数据库管理系统)
多维联机分析处理(molap)严格遵照库德的定义,自行建立多维数据库来存放联机分析系统的数据,它以多维数据组织方式为核心,也就是说,多维联机分析处理使用多维数组存储数据。
当利用多维数据库存储OLAP数据时,不需要将多维数据模型中的维度、层划分和立方体等概念转换成其他的物理模型,因为多维数组(矩阵)能很好地体现多维数据模型特点。
利用数组实现多维数据模型的优点,在于对数据的快速访问,但同时也会带来存储空间的冗余,即稀疏矩阵问题,进而导致对存储空间的极大需求。
为了解决稀疏矩阵问题,某些产品提出了稀疏维(Sparse)和密度维(Dense)策略。由稀疏维产生索引块,由密度维形成数据块。只有当稀疏维的组合在交易事件初次发生时才创建索引块,进而创建数据块。稀疏维和密度维的引入在一定程度上降低了立方体的存储冗余问题。此外,通过数据压缩技术可降低数据块的存储空间。
2、关系联机分析处理(关系数据库管理系统)
ROLAP以关系数据库为核心 以关系型结构进行多维数据的表示和存储,将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成“星型模式”。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表描述,这种星型模式的扩展称为“雪花模式”。这种多维数据的表示方式能够让使用者以较简单的方式了解这些资料,增加查询效率,并对海量数据存储空间有较少要求。
在星型架构架构中有一个事实表和未经正规化的维表。
事实表有如下特性:
①大量的数据列,存储容量可达到Tbt;
②主要是数值信息,只有少数的文字或者多媒体信息;
③有和维表连接的外关键字;
④静态数据和聚集数据。
维表中的信息是对事实表的相应说明,它主要有以下特性:
①记录数较少,可能只有上千或者上万个记录;
②大多为文字资料;
③信息具有层次结构;
④只有一个主键(Primary Key或Dimension Key);
⑤信息可修改。
雪花架构是对星型架构的变形,它将星型架构下的维表格经过正规化处理,使其能表现更丰富的信息,也使得信息处理更加灵活。
3、混合联机分析处理
混合联机分析处理(holap)利用多维联机分析处理技术存储上层汇总数据,利用关系联机分析处理存储细节数据,即低层是关系型的,高层是多维矩阵型的。这种方式具有更好的灵活性。
还有其他一些实现OLAP的方法,如提供一个专用的SQL Server,对某些存储模式(如星型、雪花型)提供对SQL查询的特殊支持。
三、存储模式的比较和选择
多维联机分析处理的优势不仅在于能清晰地表达多维概念,更重要的是它有着极高的综合速度。在关系数据库管理系统中,如果要得到某一地区的销售总量,只能逐条记录检索,找到满足条件的记录后将数据相加。而在多维数据库中,数据可以直接按行或列累加,其统计速度远远超过关系数据库管理系统。数据库中的记录数越多,其效果越明显。但是对多维联机分析处理来说,随着维度和维成员的增加,其存储空间可能出现组合爆炸。
关系联机分析处理的存储空间没有大小限制,现有的关系数据库的技术可以沿用,可以通过SQL实现详细数据与概要数据的存储,现有关系型数据库已经对OLAP做了很多优化,包括并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL的OLAP扩展等,大大提高了关系联机分析处理的访问效率。相比较而言,关系联机分析处理技术具有更大的可伸缩性。
在项目实施过程中,对OLAP产品和存储模式的选择应考虑企业数据量的大小、数据处理过程、访问效率和性价比等多个方面。由于多维联机分析处理访问具有高效性,可以将企业应用的大部分聚集层数据以MOLAP形式存储;对有大量细节数据的应用,为防止立方体存储空间过于膨胀,可考虑对于聚集数据以MOLAP方式存储;而对于原子数据可以以ROLAP方式存储。MOLAP存储依靠多维数据集聚合的设计和百分比,提供快速的查询响应能力。一般来说,MOLAP比较适合于需要频繁使用和快速查询响应的多维数据集。ROLAP查询响应通常比使用MOLAP或HOLAP的查询响应要慢。ROLAP一般用于不经常查询的大型数据集,如年份较早的历史数据等。
对访问汇总数据的查询,HOLAP与MOLAP功能相同。对访问基本数据的查询,必须从关系数据库中检索数据,其速度不如将基本数据存储在MOLAP结构中快。用HOLAP存储的多维数据集比同等的MOLAP多维数据集要小,而对于使用汇总数据的查询,其响应比ROLAP多维数据集快。HOLAP存储一般适用于对基于大量基本数据的汇总进行查询时,需要快速响应的多维数据集。
相关推荐
内容概要:本文详细介绍了利用Matlab进行三相逆变器SPWM调制仿真的全过程。首先明确了将110V直流电转换为220V/50Hz交流电的需求,接着阐述了SPWM调制的基本原理及其MATLAB代码实现方法,包括载波频率、调制比的选择以及三相调制信号的生成。文中还展示了逆变桥的Simulink模型搭建步骤,强调了关键参数如死区时间和LC滤波器的设计要点。通过对输出电压、电流波形的分析,验证了模型的有效性和稳定性,并提供了调参技巧和常见问题解决方案。 适合人群:从事电力电子、新能源系统研究的技术人员及高校相关专业师生。 使用场景及目标:适用于希望深入了解SPWM调制机制、掌握三相逆变器设计与优化方法的研究者;可用于教学实验、项目开发和技术培训等场合。 其他说明:文中提供的完整代码和详细的注释有助于初学者快速入门,而丰富的波形分析则为进阶用户提供宝贵的参考资料。此外,作者还分享了一些实用的小贴士,如如何避免常见的错误配置,确保仿真的顺利进行。
Android5.3 Android 组件-基础控件-例子-broadcast图片
内容概要:本文详细介绍了如何使用MATLAB实现风光场景生成与削减,特别是在处理风电和光伏发电的不确定性方面。文章首先解释了风光场景生成的概念,即通过蒙特卡洛方法模拟各种可能的风电和光伏出力情况。接着,针对生成的大量场景可能导致计算复杂的问题,提出了基于概率距离的快速削减法,通过计算场景间的概率距离,将大量场景削减至少数关键场景,从而简化后续计算。文中还展示了具体的MATLAB代码实现,包括场景生成、距离计算、场景削减等关键步骤,并讨论了一些优化技巧如并行计算、数据标准化等。此外,文章强调了该方法在电力系统调度中的重要性和实用性,能够有效提高计算效率和准确性。 适合人群:从事电力系统研究的科研人员、工程师及相关领域的学生。 使用场景及目标:适用于需要处理风电、光伏等可再生能源出力不确定性的电力系统调度和优化项目。主要目标是通过减少计算复杂度,提高调度模型的计算效率和准确性。 其他说明:文中提供的MATLAB代码具有良好的可移植性和复用性,可以根据具体应用场景进行适当修改和扩展。
毕业设计(论文) 直动式液压往复泵设计说明书.doc.doc
电动剃须刀的结构设计说明书.docx.docx
内容概要:本文介绍了DeepSeek这一开源深度学习模型的使用方法和提问技巧。DeepSeek不仅能够执行指令,还能进行思考和推理。文章提出了几种提问模板,帮助用户更有效地利用DeepSeek解决问题。其中包括“背景+需求+约束条件”、“身份+任务+要求+例子”、“我要做什么→要做什么用→希望达到什么效果→但担心什么问题”、“需求+担忧+反向验证”、“问题+追问预期+调整方向”以及“目标+条件+验证方式”。每种模板都配有详细的解释和示例,以指导用户如何构建问题,从而获得更有针对性的答案。 适合人群:适合对深度学习感兴趣的开发者、研究人员以及希望通过DeepSeek解决实际问题的用户。 使用场景及目标:①帮助用户更好地理解和使用DeepSeek,提高问题解决效率;②通过具体的提问模板,让用户能够更精准地获取所需信息;③适用于各种场景,包括但不限于技术问题解答、学习计划制定、课程推广方案设计等。 其他说明:为了充分利用DeepSeek的功能,用户在提问时应尽量提供详尽的背景信息,明确需求,并根据实际情况设置合理的约束条件。此外,用户还可以通过设定角色和任务,让DeepSeek从特定角度进行思考,从而得到更具创意和实用性的解决方案。
内容概要:本文详细介绍了支持向量机(SVM)、BP神经网络和LSTM网络在时间序列预测中的应用及其MATLAB实现。首先,针对SVM部分,文章讲解了如何将时间序列数据转化为特征矩阵并通过滑动窗口进行预测,强调了交叉验证的重要性。对于BP神经网络,则着重于数据归一化以及网络结构的选择,并指出BP网络容易陷入局部最优的问题。最后,在LSTM部分,文章展示了如何利用MATLAB的深度学习工具箱实现LSTM网络,解决了输入数据格式转换的问题,并实现了滚动预测。文中提供了具体的代码示例,确保读者能够轻松替换数据源并运行程序。 适用人群:适用于有一定MATLAB基础的时间序列预测初学者和技术爱好者。 使用场景及目标:帮助读者掌握三种不同类型的机器学习模型在时间序列预测任务中的具体应用,理解各自的特点和优缺点,从而选择合适的模型应用于实际项目中。 其他说明:文章不仅提供了详细的理论解释,还给出了完整的代码实现,使得读者可以直接上手实践。同时,作者提醒了一些常见的错误和注意事项,如数据格式、归一化等问题,有助于提高预测准确性。
(精品)热转印制作人物主题个性杯子毕业论文设计说明书.doc
5000吨年氧化羰化制碳酸二甲酯合成工艺设计说明书.doc
【3D文件】可爱小鹿3D建模,3D打印文件,免费下载 资源图片查看链接:https://blog.csdn.net/weixin_60324241/article/details/147233616?spm=1011.2415.3001.5331 欢迎查看下载
内容概要:本文详细介绍了如何利用Simulink进行BUCK变换器的电压电流双闭环控制以及多相控制的设计方法,并探讨了无刷直流电机(BLDCM)控制系统的构建。文中不仅涵盖了基本的控制理论,还提供了具体的MATLAB/Simulink代码示例,帮助读者理解和实现复杂的电力电子控制系统。对于常见的调试问题,如代数环错误、谐波失真、电流不平衡等,作者分享了许多实践经验和技术技巧。 适合人群:从事电力电子、自动化控制领域的工程师和技术人员,尤其适用于有一定Simulink基础并希望深入掌握BUCK变换器和BLDCM控制设计的专业人士。 使用场景及目标:① 学习如何在Simulink中搭建和优化BUCK变换器的电压电流双闭环控制系统;② 掌握多相BUCK变换器的均流控制策略;③ 实现BLDCM的高效换相逻辑和速度环参数整定;④ 解决仿真过程中可能出现的各种问题。 其他说明:文章强调了实际应用中的注意事项,如参数选择、模块配置、信号处理等方面的经验,有助于提高仿真的准确性和效率。同时提醒读者关注硬件保护措施,避免实验过程中损坏设备。
内容概要:本文详细介绍了如何利用粒子群优化(PSO)算法解决电力系统经济调度问题,特别是在IEEE30节点六机系统中的应用。文章首先解释了关键参数的选择及其意义,如最大迭代次数、惯性权重、学习因子等。接着深入探讨了适应度函数的设计,包括火电成本计算、失负荷惩罚以及弃风弃光惩罚。此外,还讨论了重要的约束处理方法,如爬坡速率限制和出力上下限截断。通过这些措施,实现了对六个发电机组的智能调度,使得总发电成本最小化,同时保证了系统的稳定性和可靠性。实验结果显示,相比传统调度方案,新方法使总成本降低了12.7%,弃风弃光量控制在5%以内。 适合人群:从事电力系统调度、优化算法研究的专业人士,尤其是对智能算法应用于能源管理感兴趣的工程师和技术研究人员。 使用场景及目标:适用于希望提高电力系统经济效益和环境效益的企业和个人。主要目标是在满足电力需求的前提下,减少化石燃料消耗,增加可再生能源利用率,从而达到节能减排的目的。 其他说明:文中提供的代码片段仅为示意,具体实现时还需考虑更多实际情况,如不同类型的发电机组特性、精确的气象预测数据等。此外,尽管PSO算法表现良好,但在某些极端情况下仍可能存在局限性,因此建议结合其他优化手段共同使用。
内容概要:本文详细介绍了如何使用MATLAB和CVX工具箱,通过模型预测控制(MPC)优化楼宇空调系统的能耗管理。首先,作者通过对建筑热力学特性的建模,建立了状态空间模型来描述楼宇的温度变化规律。接着,设计了一个24小时预测时域的MPC控制器,结合动态电价信号,实现了在电价低谷期预冷建筑并在电价高峰期减少制冷功率的目标。文中展示了具体的MATLAB代码片段,解释了关键参数的选择及其物理意义,并讨论了如何通过引入舒适度约束和反馈校正机制提高控制精度。最终,仿真实验表明该方法不仅能够显著降低电费支出,还能保持室内温度在舒适的范围内。 适合人群:从事楼宇自动化、能源管理和控制系统设计的研究人员和技术人员。 使用场景及目标:适用于商业建筑和工业园区的空调系统节能改造项目,旨在通过智能化控制手段实现节能减排和成本优化。 其他说明:文章强调了模型简化与计算效率之间的权衡,以及在实际应用中需要根据不同建筑物的具体情况进行参数调整。同时指出,良好的用户体验是衡量控制算法成功与否的重要标准之一。
内容概要:本文详细介绍了基于CANoe的Bootloader上位机软件开发流程及其应用,重点在于飞思卡尔MC9S12G128MLL这款16位单片机。首先解释了选择CANoe的原因,因其强大的CAN总线仿真能力和灵活的数据格式定义,非常适合Bootloader开发。接着深入探讨了下位机MC9S12G128MLL的基本配置,包括系统时钟、端口初始化以及CAN模块的设置。随后展示了具体的CAN报文收发实现方法,如通过CAPL语言编写上位机发送命令,下位机接收并处理这些命令,从而实现进入Bootloader模式的功能。此外还讨论了进一步的功能扩展,如程序下载、校验等复杂操作的设计思路和技术细节。最后强调了实际开发过程中遇到的问题及解决方案,例如Flash擦写、通信协议设计、CRC校验等方面的经验教训。 适合人群:从事嵌入式系统开发的技术人员,尤其是专注于汽车电子领域CAN总线相关项目的工程师。 使用场景及目标:适用于需要开发或优化基于CANoe的Bootloader上位机软件的项目,旨在提高嵌入式系统的升级效率和可靠性,确保在复杂环境下能够顺利完成固件更新任务。 其他说明:文中不仅提供了详细的理论讲解,还包括大量实用的代码示例,帮助读者更好地理解和掌握具体实施步骤。同时,作者分享了许多宝贵的实践经验,有助于避免常见错误,提升开发成功率。
dwaDWADWAWADWAWDADWADWA
内容概要:本文详细介绍了利用西门子S7-300 PLC和组态王软件构建散装水泥生产线在线称重控制系统的全过程。首先阐述了硬件配置,包括CPU315-2DP作为主站、ET200M分布式从站以及SM331模拟量模块用于接收称重传感器信号。接着深入解析了梯形图程序的关键部分,如OB35中断组织块用于每100ms采集一次重量数据,并采用浮点数比较器实时判断重量变化趋势。此外,还讨论了组态王的画面设计,包括实时重量显示、趋势图控件的应用以及报警机制的设置。文中特别强调了针对动态称重过程中信号跳变的问题采取了移动平均滤波算法进行优化,并分享了一些实际工程中的经验和教训,如正确的接线方式、抗干扰措施等。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是那些对PLC编程、组态软件应用有一定基础的人群。 使用场景及目标:适用于新建或改造散装水泥生产线的称重控制系统项目。主要目标是提高称重精度,确保生产效率的同时保障产品质量。通过学习本文可以掌握完整的系统设计方案,包括硬件选型、软件编程及人机界面设计等方面的知识。 其他说明:文中提供了大量具体的代码片段和配置细节,有助于读者更好地理解和实施相关技术。同时,作者结合自身经验给出了许多宝贵的建议,对于初学者来说非常有价值。
内容概要:本文详细介绍了使用三菱FX3U PLC和MCGS触摸屏构建四路抢答器控制系统的全过程。首先明确了系统的硬件组成,包括PLC、触摸屏以及四个抢答台的按钮和指示灯。接着阐述了IO分配的具体细节,如输入输出端口的功能定义。然后深入讲解了梯形图程序的设计思路,特别是抢答锁存和互锁逻辑的实现方法。此外,还讨论了接线图原理图的关键要点,如限流电阻的选择和公共端的处理。最后介绍了MCGS组态画面的设计技巧,包括状态指示灯的颜色变化、得分统计等功能。文中还提到了一些常见的调试问题及其解决方案,如按钮触点抖动引起的误触发和指示灯闪烁问题。 适合人群:对PLC编程和工业自动化感兴趣的初学者,尤其是希望深入了解三菱PLC应用的技术人员。 使用场景及目标:适用于需要设计和实现简单但完整的PLC控制系统的场合,帮助读者掌握PLC编程的基本技能,提高实际动手能力。 其他说明:文章提供了详细的梯形图代码和接线图示例,便于读者理解和实践。同时强调了一些实用的小技巧,如防作弊机制和硬件消抖措施,有助于提升系统的可靠性和稳定性。
预防沉迷网络安全教育主题班会专业知识讲座.ppt
内容概要:本文详细介绍了基于西门子S7-200 PLC和MCGS组态软件构建的灌装生产线系统的具体实现方法和技术细节。主要内容涵盖IO分配、接线图原理、梯形图程序设计、组态画面设计以及常见问题的解决方案。文中通过具体的实例展示了如何利用PLC进行逻辑控制,确保生产过程中各个环节的安全性和准确性。同时,还探讨了如何优化传感器信号处理、提高系统稳定性和调试技巧。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是对PLC编程和组态软件有一定了解的人群。 使用场景及目标:适用于食品饮料行业的灌装生产线自动化控制项目。主要目标是帮助技术人员理解和掌握PLC与组态软件的联合应用,提高生产线的效率和可靠性。 其他说明:文章提供了丰富的实践经验,包括硬件接线注意事项、软件编程技巧以及故障排除方法,为实际工程应用提供了宝贵的参考资料。
内容概要:本文详细介绍了基于西门子S7-1200 PLC构建的小区换热站自动控制系统的设计与实施。主要内容涵盖IO分配、流量和温度控制的具体实现方法,特别是针对流量计和电动阀的配合、PID闭环控制的应用以及温度前馈补偿等关键技术点进行了深入探讨。此外,文中还分享了多个调试过程中遇到的实际问题及其解决方案,如温度漂移、阀门响应延迟、模拟量模块干扰等问题。通过合理的硬件配置和软件优化,实现了系统的稳定运行,显著减少了热力公司的维护成本。 适合人群:从事工业自动化控制领域的工程师和技术人员,尤其是对PLC编程和换热站自动化感兴趣的从业者。 使用场景及目标:适用于新建或改造小区换热站项目的规划与实施,旨在提高供暖系统的效率和稳定性,减少人为干预,确保居民冬季取暖的安全性和舒适性。 其他说明:文章不仅提供了详细的编程实例和电路连接图,还强调了实际应用中的注意事项和经验教训,对于理解和掌握类似项目的开发具有重要参考价值。