`
zhangziyangup
  • 浏览: 1119020 次
文章分类
社区版块
存档分类
最新评论

SQL Server 数据挖掘系列(一) - 探讨微软数据挖掘理念"全员BI"

 
阅读更多

最近看了很多关于数据挖掘的资料,在这里谈谈我对数据挖掘的一些理解,以及微软的数据挖掘理念。

数据挖掘可以视为OLAP的补充性技术。OLAP经常为我们提供决策支持,或者为了证明某个假设而提供数据。而数据挖掘则用在对数据没有确定假设的情况下。例如:可以使用OLAP多维数据集检验在特定时间段内购买某项产品的客户都具有哪些特征。具体来说,可以证明地区在北京的客户在2011年10月购买汽车的时候,选择红色车的比例是选择黑色车比例的两倍。可以使用数据挖掘技术自动将与购买有关的因子分解出来或分组,这样决策人员可以将客户划分为“汽车购买者”和“非汽车购买者”两类。我们可以对分组做进一步的研究,发现“汽车购买者”按优先级排列具有以下相关特征:家庭用户与非家庭用户、已婚与未婚等等。另一个利用数据挖掘技术比较多的场景是:业务需求要求对数据集中的一个或多个目标值的未来情况作出预测。例如:对销售率的预测,预计未来一段时间内商品销售的数量等等。

在这里,我想结合微软的SQLServer Analysis Service(SSAS),来和大家一起讨论数据挖掘结构这一“多彩”的世界。在SSAS当中包含有一套数据挖掘的工具,这套工具向最终用户提供了在指定的数据子集上发现模式和趋势的功能。源数据可以是关系型的,也可以是多维的。可以只查看在数据层面上应用数据挖掘技术所得到的结果,并用这些结果作为业务决策的基础。也可以使用挖掘的结果作为处理新数据的基础。微软通常将SSAS中的数据挖掘功能称作为“预测分析”,因为这套工具可以作为企业或组织积极认识其数据的一种方式。例如,根据数据聚类分析的结果设计或优化我们的营销策略。还可以利用这个分析的结果,向经过验证的模型注入新的数据,从而协助预测未来的值。数据挖掘是SSAS多维数据集的补充,多维数据集通常用来验证结果,一般是用来帮助我们解决“我们认为这件事情发生了,数据是否支持我们的观点?”这类问题。数据挖掘则用来帮助我们解决的是“将会发生什么?”这样的问题,举一个比较好理解的例子就是如果公司购买了竞争数据的时候,数据挖掘能够帮助我们分析“如果进入这类新业务会怎样?”“如果在这些地方开展业务会如何”这类问题。

微软的愿景是能够将BI以及数据挖掘变得更易实现,将结果变得更方便用户理解。数据挖掘可能是实际操作起来最有挑战性的一类数据分析解决方案,因为它需要深入理解所使用的各种挖掘算法。微软打造“人人BI”的理念,也扩展到了数据挖掘的领域,Visual Studio当中的BusinessIntelligence Development Studio(BIDS)提供的工具将数据结构的创建工作简化了很多,如果我们以前接触过BIDS的话,就像平时操作OLAP多维数据集一样,数据挖掘结构也可以通过BIDS的向导来创建,并且还有其他工具可以验证指定挖掘模型的准确性,帮助我们选择最合适的数据挖掘算法。最终用户也会从以各种方式呈现的更有意义的结果中受益。在BIDS和(SQL Server Management Studio)SSMS中都包含许多数据挖掘模型的查看器,可以针对不同的目标群体对数据挖掘的结果进行丰富的展现,我们还可以将数据挖掘集成到OfficeExcel中,以及通过API进行自定义开发以及与各类用户应用程序集成,例如.NET、JAVA等。

长期以来,只有具备相当资源的公司才有实力使用数据挖掘的产品,因为专用的数据挖掘产品非常昂贵,需要聘请咨询顾问才能实现这些产品中所包含的复杂算法,数据挖掘行业的人通常需要具备数学,尤其是统计领域相关的高级知识。数据挖掘最具挑战性的一面就是理解算法真正的功能,然后在创建的挖掘结构中包含最符合具体业务需求的算法。微软在SQL Server中内置了9种数据挖掘算法,在后面的系列文章中我会介绍更多关于SQLServer数据挖掘技术的潜在功能。

分享到:
评论

相关推荐

    SQL Server数据挖掘与商业智能基础及案例实战

    《SQL Server数据挖掘与商业智能基础及案例实战》是一本深入探讨如何利用SQL Server进行数据挖掘和商业智能的书籍。本书旨在帮助读者掌握利用SQL Server工具处理和分析数据,以支持决策制定和业务洞察。书中的范例...

    Microsoft SQL Server 2008 All-in-One Desk Reference For Dummies

    《Microsoft SQL Server 2008 All-in-One Desk Reference For Dummies》这本书是针对SQL Server 2008这一重要数据库管理系统所编写的一本全面指南。SQL Server 2008作为微软公司的一个里程碑产品,引入了众多创新...

    Microsoft SQL Server数据挖掘的高级研究

    Microsoft SQL Server提供了一系列强大的数据挖掘工具,比如SQL Server Data Mining Add-ins for Microsoft Office Excel和SQL Server Integration Services(SSIS)中的数据挖掘组件。这些工具和组件使得数据挖掘...

    MADlib-基于SQL的数据挖掘解决方案-数据挖掘入门.docx

    MADlib-基于SQL的数据挖掘解决方案-数据挖掘入门.docx

    SQLserver 数据挖掘数据样例 DMAddins_SampleData.xlsx

    SQLserver 数据挖掘数据样例 DMAddins_SampleData.xlsx

    SQLServer2005数据挖掘源码

    SQL Server 2005是微软推出的一款强大的关系数据库管理系统,它在数据挖掘和商业智能领域有着广泛的应用。数据挖掘是一种从大量数据中发现有价值信息的过程,它利用统计学、机器学习和人工智能技术来预测未来趋势、...

    Inside Microsoft SQL Server 2008 T-SQL Programming.pdf

    SQL Server 2008是微软在2008年推出的一款企业级关系型数据库管理系统,它是SQL Server系列中的一个重要版本,提供了强大的数据存储和管理功能。 #### 二、T-SQL编程基础 本书主要聚焦于T-SQL(Transact-SQL)编程...

    数据挖掘课程设计----图书馆系统数据挖掘

    在这个项目中,学生可能会接触到一系列工具和技术,包括SSIS(SQL Server Integration Services)、SSAS(SQL Server Analysis Services)和SSRS(SQL Server Reporting Services),这些都是微软BI(商业智能)套件...

    《数据挖掘原理与应用——SQL Server 2005 数据库》算法案例

    《数据挖掘原理与应用——SQL Server 2005 数据库》是一本深入探讨数据挖掘技术的书籍,其中包含了丰富的算法实例,旨在帮助读者理解并掌握如何在SQL Server 2005环境下进行数据挖掘实践。数据挖掘是利用统计学、...

    SQL Server 2005 BI系列课程(2):基于SQL SERVER 2005 BI平台实现商务智能过程

    **SQL Server 2005 BI系列课程(2)** 是一套深入探讨商务智能(Business Intelligence,简称BI)在SQL Server 2005平台上实施的教程。本课程着重讲解如何利用SQL Server 2005的工具和技术来构建高效、灵活的BI解决...

    SQL Server2008R2数据挖掘与商业智能实例详细操作

    ### SQL Server 2008 R2 数据挖掘与商业智能实例详细操作 #### 知识点一:数据导入过程 **知识点概述:** 本部分详细介绍了如何将Excel表格中的数据导入到SQL Server 2008 R2的数据库中,并进行了一些基本的数据...

    SQLServer2005数据挖掘与商业智能完全解决方案

    《SQLServer2005数据挖掘与商业智能完全解决方案》一书主要探讨如何利用SQL Server 2005构建商业智能应用,以满足日益复杂的商业需求。书中以FoodMart数据库为例,展示了如何从传统的业务数据中提取有价值的信息,...

    基于SQL Server 2005的数据挖掘

    1. **数据挖掘架构**:SQL Server 2005的数据挖掘架构基于Microsoft Analysis Services,这是一个多维数据处理引擎。它包括数据源、数据源视图、挖掘结构和挖掘模型四个主要组件。数据源是原始数据的来源,数据源...

    SQL Server数据挖掘技术应用研究.pdf

    本文所探讨的《SQL Server数据挖掘技术应用研究》是一项针对SQL Server中数据挖掘功能的深入分析,重点在于数据挖掘的基本过程、方法和特点,并通过实例来研究数据挖掘技术的实际应用。文章还探讨了数据挖掘模型的...

    使用sql2005数据挖掘截图

    SQL Server 2005 是微软公司推出的一款关系型数据库管理系统,它不仅支持传统的数据存储与管理功能,还提供了强大的数据分析工具,其中包括数据挖掘功能。数据挖掘是一种从大量数据中提取有用信息的过程,它可以帮助...

Global site tag (gtag.js) - Google Analytics