Data Warehouse
本世纪80年代中期,"数据仓库之父"William H.Inmon先生在其《建立数据仓库》一书中定义了数据仓库的概念,随后又给出了更为精确的定义:数
据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。
Data mart
数据集市,或者叫做"小数据仓库"。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只是面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。
OLAP
联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出了多维数据库和多维分析的概念,即OLAP。Codd提出OLAP的12条准则来描述OLAP系统:
准则1 OLAP模型必须提供多维概念视图
准则2 透明性准则
准则3 存取能力推测
准则4 稳定的报表能力
准则5 客户/服务器体系结构
准则6 维的等同性准则
准则7 动态的稀疏矩阵处理准则
准则8 多用户支持能力准则
准则9 非受限的跨维操作
准则10 直观的数据操纵
准则11 灵活的报表生成
准则12 不受限的维与聚集层次
ROLAP
基于Codd的12条准则,各个软件开发厂家见仁见智,其中一个流派,认为可以沿用关系型数据库来存储多维数据,于是,基于稀疏矩阵表示方法的星型结构(star schema)就出现了。后来又演化出雪花结构。为了与多维数据库相区别,则把基于关系型数据库的OLAP称为Relational OLAP,简称ROLAP。代表产品有Informix Metacube、Microsoft SQL Server OLAP Services。
MOLAP
Arbor Software严格遵照Codd的定义,自行建立了多维数据库,来存放联机分析系统数据,开创了多维数据存储的先河,后来的很多家公司纷纷采用多维数据存储。被人们称为Muiltdimension OLAP,简称MOLAP,代表产品有Hyperion(原Arbor Software) Essbase、Showcase Strategy等。
Client OLAP
相对于Server OLAP而言。部分分析工具厂家建议把部分数据下载到本地,为用户提供本地的多维分析。代表产品有Brio Designer,Business Object。
DSS
决策支持系统(Decision Support System),相当于基于数据仓库的应用。决策支持就是在收集所有有关数据和信息,经过加工整理,来为企业决策管理层提供信息,为决策者的决策提供依据。
ETL
数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
Ad hoc query
即席查询,数据库应用最普遍的一种查询,利用数据仓库技术,可以让用户随时可以面对数据库,获取所希望的数据。
EIS
主管信息系统(Executive Information System),指为了满足无法专注于计算机技术的领导人员的信息查询需求,而特意制定的以简单的图形界面访问数据仓库的一种应用。
BPR
业务流程重整(Business Process Reengineering),指利用数据仓库技术,发现并纠正企业业务流程中的弊端的一项工作,数据仓库的重要作用之一。
BI
商业智能(Business Intelligence),指数据仓库相关技术与应用的通称。指利用各种智能技术,来提升企业的商业竞争力。
Data Mining
数据挖掘,Data Mining是一种决策支持过程,它主要基于AI、机器学习、统计学等技术,高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确的决策
CRM
客户关系管理(Customer Relationship Management),数据仓库是以数据库技术为基础但又与传统的数据库应用有着本质区别的新技术,CRM就是基于数据仓库技术的一种新应用。但是,从商业运作的角度来讲,CRM其实应该算是一个古老的"应用"了。比如,酒店对客人信息的管理,如果某个客人是某酒店的老主顾,那么该酒店很自然地会知道这位客人的某些习惯和喜好,如是否喜欢靠路边,是否吸烟,是否喜欢大床,喜欢什么样的早餐,等等。当客人再次光临时,不用客人自己提出来,酒店就会提供客人所喜欢的房间和服务。这就是一种CRM。
Meta Data
元数据,关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理。为数据仓库的发展和使用提供方便。
分享到:
相关推荐
2010年10月13日发布的“QQ输入法词汇大全”是一个重要的更新,它包含了大量的词汇和词语,旨在提高输入效率,增强用户的输入体验。 这个词汇大全包含了多个分类,具体如下: 1. **深圳地名.qpyd**:这个文件包含了...
报告指出,人工智能在抗击新冠疫情中发挥了重要作用,通过防疫态势与指挥平台、AI测温、无感通行、疫情问询机器人、AI辅助诊疗等应用,人工智能走进了人们的生产生活,成为高频词汇。报告强调,人工智能不再仅仅是...
例如,它会对智能建筑中常用的词汇,如“智能建筑”、“信息化应用系统”、“建筑设备管理系统”等进行定义,以及对使用的符号和表达方法进行说明。 智能化集成系统是智能建筑中的重要组成部分,它涉及到将建筑内的...
以下是一些编程英语常用词汇的详细解释: 1. **Application**:应用程式,指的是用于特定任务的软件,如文本编辑器、浏览器等。 2. **Framework**:应用程式框架,是一种设计模式,它提供了构建应用程序的标准结构...
基于HowNet的词汇语义倾向计算方法可以自动分析大规模文本中的态度倾向信息,对企业商业智能系统、政府舆情分析等领域具有广阔的应用空间和发展前景。 HowNet是一个大规模的语义网络,包含了大量的词汇语义信息,...
大数据词汇中英文对照表是大数据领域中的一个重要参考资源,它涵盖了从算法到数据分析、人工智能、商业智能、云计算、数据存储、数据分析等多个方面的词汇。在本篇文章中,我们将对该表中的词汇进行详细的解释和分析...
TF-IDF是一种常用的计算词频与逆文档频率的方法,可以评估词语对文档集或一文档集合中的一个文档的重要性。在该研究中,通过词频-反稳定频率(TF-IDF)函数计算词语的语义相似度,以识别相关性较高的信息。 API...
以下是一些与C#编程相关的高频词汇及其在IT领域的应用: 1. **rational** - 在编程中,"rational"可以指合理的设计或算法,表示逻辑清晰、符合最佳实践的代码设计。 2. **decent** - 在软件开发中,"decent"可能...
4. **权重计算**:IF-IDF(Inverse Document Frequency)算法用于计算词汇的权重,确保高频但低信息量的词汇(如“的”、“是”等)不会占据过多的权重,而真正具有区分度的词汇则会被赋予更高的权重。 #### 三、...
### 计算机英语词汇大全知识点详解 #### Active-matrix(主动矩阵) - **定义**:一种用于LCD屏幕的技术,可以提高图像的质量和响应速度。 - **应用领域**:广泛应用于笔记本电脑、智能手机和平板电脑等设备的显示...
17. **Analysis Server**:分析服务器,用于处理复杂的商业智能和数据分析任务。 18. **Archive File**:存档文件,用于长期存储不再频繁访问的数据。 19. **Atomic**:在编程和数据库中,表示不可分割的操作,要么...
根据给定文件的信息,我们可以总结出一系列重要的IT相关的日语词汇及其对应的英文和中文翻译。以下是对这些术语的详细解释: ### 1. 邮件 (メール, mail, 邮件) - **含义**: 指的是通过电子邮件系统发送和接收的...
13. **商业智能(Business Intelligence)**:商业智能是提高数据理解性的技术和方法,包括报告、数据分析和数据挖掘。 14. **分类分析(Classification analysis)**:分类分析是系统地从数据中提取相关性,帮助理解...
总的来说,智能分词工具在解析中文公司名称方面起着核心作用,它们帮助我们从杂乱无章的文本中抽取出有价值的结构化信息,为商业分析、市场研究等领域提供了强大的支持。在实际应用中,开发者需要根据具体需求选择...
5118是一个知名的数据智能平台,提供各种行业关键词挖掘服务,其中包括保险行业的词库。本话题主要围绕“5118保险行业词库”展开,详细探讨其在保险领域的应用和价值。 首先,我们要理解的是什么是“保险行业词库”...
### 常用汉字(2.5万)拼音词库:深入解读与应用 #### 标题解析: 标题“常用汉字(2.5万)拼音词库”清晰地表明了该资源是一个包含大约2.5万个常用汉字及其拼音的数据库。这不仅仅是一个简单的列表,而是一个全面...
在当今信息化快速发展的时代,数据可视化和基于情感分析的人工智能技术在商业分析和产品开发领域扮演着至关重要的角色。数据可视化通过图形和图表使复杂的数据易于理解和解读,而情感分析则通过解读文本数据中的情感...
根据提供的文件内容,这份名为“5A智能系统[收集].pdf”的文件似乎包含了大量零散的技术词汇和可能的缩写。虽然内容显得杂乱无章,但我们可以尝试从中提取一些可能的知识点。首先,我们可以看到文中出现了一些关于...
人工智能机器翻译(Artificial Intelligence Machine Translation, 简称AIT)是指利用计算机程序来进行自然语言文本或语音的自动翻译。这一技术已经成为自然语言处理(Natural Language Processing, NLP)领域中发展...