数据仓库如何在电信网络资源分析系统中应用
作者: 国信朗讯网络科技技术有限公司资源二部
闫景辉 王修伦
日前,随着中国电信企业管理理念的发展,电信信息化建设逐步走上了规范化的道路。中国电信集团的IT信息化系统建设规范CTG-MBOSS详细的描述了各个域(MSS、BSS、OSS)的范围及组成。各个电信公司建设的OSS系统积累了很多业务数据,但是这些数据分散在不同的系统里,相互之间没有有机的联系起来,无法为统计、综合查询、业务分析提供更好的服务,也没有体现出数据蕴涵的价值。为此,国信朗讯公司通过提供集中的网络资源综合分析系统,将这些分散的数据有机地整合在一起,形成一个集中式的网络资源数据仓库,并且在此基础上开发出综合的统计、查询、分析应用功能,更好地挖掘数据的价值,发现数据中蕴涵的知识,使客户投资的价值最大化。
系统总体结构
为什么资源分析系统要基于数据仓库?我们先分析一下联机系统数据的特点。联机系统的数据为了满足应用的要求,通常采用范式结构,通常数据一直在变化,通常对性能要求很高,通常每个系统只存储了自己关心的数据,而分析系统要求的数据是面向主题的,某个指定时间/时间段的数据是固定的,所有相关数据是集成的,并且随着时间的变化,数据也要体现变化的趋势,并且统计、分析对硬件资源的瞬时占用是很高的。联机系统(OLTP)和分析系统(OLAP)截然不同的特点决定了我们建设的网络资源分析系统必须要基于数据仓库,网络资源分析系统是构建在数据仓库上的BI系统。
网络资源分析系统中采取的关键技术
网络资源分析系统的建设涉及到数据存储技术、ETL技术、数据分析、数据展示等四个主要方面。
1:数据存储技术
数据仓库和ODS采用了Oracle
9i数据库作为数据存储平台。Oracle在数据仓库领域有着自己独到的优势。如基于物化视图(Materialized
View)的汇总表管理。汇总是统计分析最常用的功能,采用汇总表之后每个查询都是预先计算的结果,不需要对数据进行动态的计算,Oracle通过物化视图实现了类似汇总表自动管理的功能并且使用方便。可以管理大数据量的分区表技术,分区的方式有range分区、hash分区和composite分区,并且对索引表和索引表的二级索引也可以进行分区,Oracle的分区机制保证了对大数据量的高枕无忧。
另外Oracle还提供了Parallel
Query等可以提高查询性能的手段。Oracle还可以支持PB级的数据量,并且可以和第三方的ETL工具很好的集成。Oracle的这些特性很好的满足了我们对数据仓库的需求。
2:ETL技术
目前业界典型的商业化ETL产品包括Data Intergrator、Data
Stage、Informatica、OWB等。其中OWB和Oracle的结合比较好,但是开发过程较为复杂;Intergrator的优化结果明显,版本管理功能比较方便;Informatica的功能比较完善,细节考虑的也很周到。
这些专业的ETL软件功能上是各有千秋,都能满足系统设计的需求,唯一的不足是价格过于昂贵。受项目预算限制,我们把目光转向了开放源代码,选择了Object
web组织提供的Enhydra
Octopus。Octopus是基于Java的ETL工具,访问数据库采用了JDBC驱动,可以连接异构的数据源,包括各种DBMS、文件等,并且可以运行在各种平台下,方便部署。
解决了ETL软件的问题,还要谈谈ETL的策略。ETL软件只是一个工具,如何让这个工具发挥作用,还是要看如何使用它。网络资源分析系统需要与多个外部数据源进行集成,这些数据源根据不同的客户需求,可能是几个到几十个。在数据源多,网络复杂的情况下保证数据抽取能够按时完成变得相当有难度。
为此我们采取了如下策略:"需要抽取的数据首先在数据源进行一次聚合,抛弃不需要的信息,减少数据传输量。数据抽取到数据仓库的临时数据区再进行转化,装载"。事实证明这个策略将计算分散到了源数据库,大大的减少了计算需要的时间,并且减少了网络传输数据量,再加上并发的机制很好的解决了对性能的要求。现在可以做到每天运行一次ETL过程,每次花费2至3个小时时间。
3:数据分析和展示技术
在数据仓库和数据都准备好的条件下,就可以开始资源分析系统最主要的统计、分析功能了。统计方面的功能实现,我们采用了成熟的第三方平台:Microstrategy(简称Mstr)。Mstr是在BI领域的统计报表方面有着自己的优势:基于ROLAP(基于关系型数据库的OLAP实现)的方式,基于数据立方的分析机制,完善的桌面工具,同时支持ASP和JSP标准,丰富的开放API(应用程序接口)方便集成。事实证明一个好的平台可以让我们把精力更关注于业务领域。基于Mstr,我们快速的建立了业务模型,并且在上面实现了各种应用。利用Mstr提供的功能,方便的实现了切片,钻取,汇总等各种功能。
结束语
随着项目的实施,积极效果一点点体现出来。电信公司各个层次的客户可以方便的在系统中查看到自己关心的内容。原来需要登录不同系统才能查看的报表可以在资源分析系统中很方便的查看。原来割裂的数据得以整合,整合后的数据更容易发现内在的规律,数据的价值也得以体现。依托于平台的优势,我们可以快速地响应用户需求的变化,使客户的投资得到回报,为客户提供了更好的服务。
分享到:
相关推荐
数据仓库和数据挖掘技术在电信网络资源管理中的应用,可以极大地增强企业的运营效率和市场响应速度,为企业创造更大的价值。而这一切都依赖于企业对数据仓库和数据挖掘技术的深入理解和有效运用。随着技术的不断进步...
在实际应用中,决策树算法可用来预测电信网络规划热点区域。通过对相关数据进行预处理后得到的规划区域数据集,可以创建决策树运算模型,并通过训练模型、浏览模型及模型预测等步骤,实现对新的区域信息进行分类预测...
总结来说,基于DB2的数据仓库解决方案在电信行业中能够提供高效的数据存储、处理和分析能力,帮助企业在海量数据中挖掘价值,支持业务决策,提升运营效率。通过深入学习和应用这些技术,企业可以充分利用数据驱动的...
本文主要探讨了数据仓库技术在国内电信行业的应用,特别是其在企业信息系统建设中的重要作用。文章不仅从建设原则、体系结构、关键环节等方面进行了深入剖析,还通过一个具体的电信运营商案例来说明数据仓库技术的...
通过对电信行业应用数据仓库技术的研究,我们可以看到这一技术在实际应用中的巨大潜力。未来,随着大数据和人工智能技术的发展,数据仓库将在更多领域发挥重要作用,为企业提供更精准、高效的数据分析支持。
通过ETL可以有效地从不同的数据源中提取数据,并将其转换为统一格式,最后加载到数据仓库中供后续分析使用。 - **数据模型**: 在系统中,数据模型的设计至关重要。它不仅需要考虑到数据的结构化和非结构化特性,还要...
本文从基于数据仓库的电信网络资源管理系统的整体架构出发,设计了该系 统的主题分析;完成了基于主题分析的数据仓库模型的构建;并对相关的主题分 析的内容引入成熟的数据挖掘算法完成对决策辅助信息的挖掘工作等。
数据仓库是企业信息化建设中的重要组成部分,用于存储历史数据并支持决策分析。各大厂商纷纷推出自己的数据仓库解决方案,以满足不同企业的业务需求。本篇文章将深入探讨这些主要厂商的数据仓库解决方案,包括它们的...
2. **ETL(Extract-Transform-Load)层**:负责从不同的源系统抽取数据,对数据进行清洗、转换和加载到数据仓库中。 3. **数据仓库层**:这是整个架构的核心部分,包含了大量的历史数据和当前数据。Teradata采用的是...
这些问题限制了数据业务分析在电信业务发展和市场竞争中的作用。 商业智能(BI)开始进入电信行业,它的应用被称作电信数据分析系统,可以帮助企业提高工作效率和服务质量。随着电信全业务运营时代的到来,电信公司...
- **高度可扩展性**:Teradata的数据仓库系统支持线性扩展,随着业务需求的增长,可以通过增加硬件资源来提升系统的处理能力和存储容量。 - **智能查询优化**:Teradata具备智能查询优化功能,可以根据查询请求...
分析型CRM系统方案是数据仓库和BI在客户关系管理中的应用。通过集成销售、市场和服务数据,企业可以深入了解客户行为,预测需求,提升客户满意度和忠诚度。在零售业,这样的系统可以帮助商家进行精准营销,优化库存...
在2004年,浙江电信开始实施数据仓库项目,整合了11个本地网络和83套系统的数据,显著提升了市场营销的成功率。通过数据仓库,他们解决了省公司与本地网之间的管理难题,消除了分散的IT基础设施导致的数据分散和报告...
#### 一、数据仓库与数据挖掘概述 数据挖掘(Data Mining)作为一门交叉学科,融合了计算机科学、统计学、机器学习等多领域知识,其核心目的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐藏在...
本资源摘要信息涵盖了电信运营商行业大数据应用的相关知识点,包括大数据的基本概念、Hadoop生态系统、HDFS文件系统、数据管理、数据分析、数据挖掘、数据可视化、数据应用等方面。 知识点1:大数据的基本概念 * ...
这些步骤共同确保了数据仓库中的数据是高质量且可用于分析的。 #### 大数据处理技术概述 大数据处理技术是处理大规模、高速度、多样化数据集的技术集合。这些技术涵盖了数据采集、存储、管理和分析的各个方面,并...
综上所述,数据仓库技术在IP设备智能管理系统中的应用,不仅满足了当前电信行业对高效率、低成本运维的需求,更展示了强大的发展潜力和应用前景。随着技术的不断进步和市场的持续拓展,该系统将更加完善,对行业的...