`
阅读更多

IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。

那么使用IBM SPSS Modeler访问数据库自有算法有什么优势呢?主要是两方面:

1.数据库内的算法常常与数据库服务器紧密集成,这有助于提高性能。

2.在“数据库内”构建和存储的模型不仅由可访问数据库的应用程序共享,且更易于在这些应用程序中部署。

接下来我们以Microsoft Analytics Services为例,介绍如何配置以及使用数据库内建模功能。

IBM SPSS Modeler支持集成下列Analysis Services算法包括:

  • 决策树
  • 聚类
  • 关联规则
  • 朴素贝叶斯
  • 线性回归
  • 神经网络
  • Logistic回归
  • 时间序列
  • 序列聚类

安装与配置:

在您的机器上,必须安装以下模块:

  • IBM SPSS Modeler Client
  • IBM SPSS Modeler Server
  • Microsoft Analysis Services,与相应数据库建立ODBC连接

1. 配置IBM SPSS Modeler:

在IBM SPSS Modeler中,在菜单栏的工具-->选项-->帮助应用程序,选择Microsoft面板,如下图:

spss

勾上之后,会在下面的面板节点上多了一项数据库建模,列出了Microsoft Analysis Services支持的数据库内建模算法,如下图:

spss

2. 配置 SQL Server

该配置可实现在数据库内进行评分。

在 SQL Server 主机上创建以下注册表键:

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP

为该键添加如下 DWORD 键值:

AllowInProcess 1

完成上述更改后,重新启动SQL Server。

3. 配置Microsoft Analysis Services

建立IBM SPSS Modeler 与Microsoft Analysis Services 进行通信。

通过MS SQL Server Management Studio 登录到分析服务器。

访问“属性”对话框,右键单击服务器名称,然后选择属性。

选中显示高级(所有)属性复选框。

更改以下属性:

将 DataMining\AllowAdHocOpenRowsetQueries 的值更改为 True(缺省值为False)。

将 DataMining\AllowProvidersInOpenRowset 的值更改为 [all] (无缺省值)。

4. 为SQL Server 创建 ODBC DSN

通过使用 Microsoft SQL Native Client ODBC 驱动程序,创建一个指向数据挖掘过程中使用的 SQL Server 数据库的 ODBC DSN。余下的驱动程序设置应使用缺省设置。

对于此DSN,请确保选中了使用集成的 Windows 认证。

5. 启用 SQL 生成和优化

从IBM SPSS Modeler菜单中选择:工具—>流属性—>选项—>优化面板,勾选上所有选项内容如下图:

spss

使用Microsoft Analysis Services 算法生成模型

以上内容配置完成后,即可使用数据库内的算法生成模型。如下图:

spss

源节点从SQL Server数据库中读取,终端节点又写回到SQL Server数据库中,中间使用的是Microsoft的决策树算法,整个计算过程都在数据库中实现。

介绍到这里,我们就了解了,如何使用数据库内算法进行建模的过程,经常会有朋友问说,使用这里的决策树算法和使用IBM SPSS Modeler封装好的决策树算法,结果会有什么不同?预测结果当然是会有差异的了。本身决策树算法就包含多种,像C&R、CHAID、C5.0、QUEST等,每个算法计算逻辑就不一样,因此计算得到的结果自然也不一样,前面我们已经介绍过C&R、CHAID、C5.0这三种算法,他们核心的差异就是选择最佳分组变量和分割点的标准,而Microsoft Analysis Services决策树是使用线性回归来确定决策树分割位置,它可以用于分类属性和连续属性的预测建模。那么到底选择什么算法为优呢,前面已经介绍了,使用数据库内建模的好处,大家可以综合考虑,结合实际场景和数据预测结果的评估再做选择。

SPSS试用版下载请点击>>>

0
0
分享到:
评论

相关推荐

    IBM SPSS Modeler 14 简体中文手册_IBMSPSS简体中文手册_

    SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。SPSS Modeler 可以...

    IBM SPSS Modeler 14.2 License

    IBM SPSS Modeler 14.2 是一款强大的数据挖掘和预测分析工具,广泛应用于商业智能、市场研究、风险管理等领域。这款软件的核心在于其直观的图形用户界面(GUI),允许用户通过拖放的方式构建复杂的统计模型,而无需...

    IBM SPSS Modeler 18简体中文手册

    IBM SPSS Modeler是一款强大的数据挖掘工具,专为数据分析专业人士设计。它提供了用户友好的界面,使得非编程背景的用户也能进行复杂的统计分析和预测建模。本手册针对IBM SPSS Modeler 18版本,提供了简体中文的...

    IBM SPSS Modeler数据与文本挖掘实战---数据和程序

    总的来说,这个实战教程将引导学习者掌握如何使用IBM SPSS Modeler进行数据预处理、特征工程、建模以及文本挖掘,通过实际操作提升数据驱动决策的能力。无论是对于市场趋势预测、客户行为分析,还是在社交媒体监控等...

    用-SPSS-Modeler-建立线性回归预测模型

    线性回归模型是一种常用的统计学模型, IBM SPSS Modeler 是一个强大的数据挖掘分析工具,本文将通过建立一个理赔欺诈检测模型的实例来展示如何利用 IBM SPSS Modeler 建立线性回归预测模型以及如何解释及应用该模型...

    IBM SPSS Modeler 官方操作手册

    IBM SPSS Modeler是一款强大的数据挖掘工具,专为专业人士设计,用于从大量复杂数据中提取有价值的洞察。在这款软件中,用户可以进行预测性建模、统计分析以及数据预处理,广泛应用于商业智能、市场研究、风险评估等...

    IBM SPSS Modeler 18.0 Python脚本编制和自动化指南(中文)

    IBM SPSS Modeler的Python接口还允许与外部系统交互,如数据库、Web服务或Hadoop等大数据环境。通过Python脚本,可以将Modeler的工作流程与其他平台无缝连接,实现更广泛的数据分析应用场景。 八、学习资源与社区...

    银行客户流失分析+SPSS modeler

    银行客户流失分析+SPSS Modeler 本资源摘要信息是关于银行客户流失分析的完整报告,使用SPSS Modeler作为数据分析工具。该报告涵盖了研究背景、研究问题、研究方法、数据处理和数据建模、实验结果、管理建议等多个...

    spss modeler 18.2.1 算法手册(英文版)

    一旦模型建立完毕,IBM SPSS Modeler Solution Publisher则能帮助企业将模型部署到整个组织,使决策者能够直接访问模型结果,或将模型嵌入到数据库中进行自动化决策。 IBM Business Analytics产品家族是IBM提供的...

    spss modeler 18 建模节点 手册 (简体中文)

    IBM spss modeler 18 建模节点手册,包括模型节点的详细使用说明,节点设置项的详细解释与使用方法

    《基于SPSS_Modeler的数据挖掘(第二版)》数据和流文件

    SPSS Modeler是IBM公司开发的一款专业数据挖掘软件,它以其用户友好的界面和丰富的建模功能,广泛应用于商业智能、市场预测、风险评估等多个领域。 本书的内容涵盖了数据挖掘的基础理论和SPSS Modeler的主要功能,...

    bank.rar_Data mining_SPSS modeler_SPSS 数据挖掘_spss modeler_spss的b

    SPSS Modeler(原名Clementine)是由IBM开发的一款图形化用户界面的数据挖掘工具。它提供了一种直观的方式来构建、测试和部署预测模型,无需深入编程知识。SPSS Modeler支持各种数据挖掘方法,包括分类、聚类、关联...

    IBM Spss Modeler 18 应用程序指南

    Spss Modeler 18 简体中文版的使用手册,包含大量应用实例,如怎样建模,多项Logistic回归应用电信业客户分类,时间序列预测宽带利用率,泊松回归分析船只损坏率,Gamma回归拟合汽车保险理陪,SVM细胞样本分类等。

    IBM_SPSS20.0_32bit简体中文版.zip

    IBM SPSS 20.0 32位简体中文版是一款专为数据分析和统计建模设计的强大软件,尤其适合那些参与数学建模竞赛或研究的用户。SPSS(Statistical Product and Service Solutions)以其易用性和强大的统计功能在学术界和...

    spss modeler +JMP学习资料.zip

    SPSS Modeler,原名Clementine,是一款由IBM推出的图形化数据挖掘工具。它以其直观易用的拖放界面而闻名,使得非编程背景的用户也能轻松进行数据预处理、模型构建和结果解读。SPSS Modeler的主要功能包括: 1. 数据...

    《SPSS Modeler》数据挖掘方法及应用(第3版)-2-14单元-实验报告

    《SPSS Modeler》是IBM公司推出的一款强大的数据挖掘工具,尤其在商业智能领域有着广泛的应用。本实验报告主要基于《SPSS Modeler》的第三版,由薛薇编著,电子工业出版社出版,旨在深入讲解数据挖掘的方法并提供...

    spss model数据与文本挖掘实战-数据和程序

    《SPSS Modeler数据与文本挖掘实战-数据和程序》是针对数据分析专业人士的一份宝贵资源,它涵盖了使用IBM SPSS Modeler进行数据挖掘和文本分析的实用技术和案例研究。SPSS Modeler是一款强大的数据挖掘工具,它允许...

    IBM电信数据挖掘方案

    IBM电信数据挖掘红皮书(194页)可能会详细阐述如何利用IBM的数据挖掘工具,如SPSS Modeler、Cognos Business Intelligence等,集成DB2数据库,构建端到端的数据挖掘流程。这些工具提供了数据预处理、特征工程、建模...

    IBM SPSS Data Mining Workshop_spss_

    IBM SPSS Modeler是SPSS的数据挖掘工具,包含一系列高级算法,如神经网络、规则挖掘和随机森林等。通过构建流图,用户可以组合不同的算法来解决复杂的问题,如客户细分、预测模型和关联规则发现。 6. **模型评估与...

    《基于SPSS_Modeler的数据挖掘(第二版)》数据和流文件.zip

    SPSS Modeler,原名 Clementine,是IBM公司开发的一款强大的数据挖掘和预测分析软件,广泛应用于商业智能、市场研究和风险管理等领域。 在数据挖掘过程中,SPSS Modeler提供了丰富的图形化界面,使得非编程背景的...

Global site tag (gtag.js) - Google Analytics