IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。
那么使用IBM SPSS Modeler访问数据库自有算法有什么优势呢?主要是两方面:
1.数据库内的算法常常与数据库服务器紧密集成,这有助于提高性能。
2.在“数据库内”构建和存储的模型不仅由可访问数据库的应用程序共享,且更易于在这些应用程序中部署。
接下来我们以Microsoft Analytics Services为例,介绍如何配置以及使用数据库内建模功能。
IBM SPSS Modeler支持集成下列Analysis Services算法包括:
- 决策树
- 聚类
- 关联规则
- 朴素贝叶斯
- 线性回归
- 神经网络
- Logistic回归
- 时间序列
- 序列聚类
安装与配置:
在您的机器上,必须安装以下模块:
- IBM SPSS Modeler Client
- IBM SPSS Modeler Server
- Microsoft Analysis Services,与相应数据库建立ODBC连接
1. 配置IBM SPSS Modeler:
在IBM SPSS Modeler中,在菜单栏的工具-->选项-->帮助应用程序,选择Microsoft面板,如下图:
勾上之后,会在下面的面板节点上多了一项数据库建模,列出了Microsoft Analysis Services支持的数据库内建模算法,如下图:
2. 配置 SQL Server
该配置可实现在数据库内进行评分。
在 SQL Server 主机上创建以下注册表键:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP
为该键添加如下 DWORD 键值:
AllowInProcess 1
完成上述更改后,重新启动SQL Server。
3. 配置Microsoft Analysis Services
建立IBM SPSS Modeler 与Microsoft Analysis Services 进行通信。
通过MS SQL Server Management Studio 登录到分析服务器。
访问“属性”对话框,右键单击服务器名称,然后选择属性。
选中显示高级(所有)属性复选框。
更改以下属性:
将 DataMining\AllowAdHocOpenRowsetQueries 的值更改为 True(缺省值为False)。
将 DataMining\AllowProvidersInOpenRowset 的值更改为 [all] (无缺省值)。
4. 为SQL Server 创建 ODBC DSN
通过使用 Microsoft SQL Native Client ODBC 驱动程序,创建一个指向数据挖掘过程中使用的 SQL Server 数据库的 ODBC DSN。余下的驱动程序设置应使用缺省设置。
对于此DSN,请确保选中了使用集成的 Windows 认证。
5. 启用 SQL 生成和优化
从IBM SPSS Modeler菜单中选择:工具—>流属性—>选项—>优化面板,勾选上所有选项内容如下图:
使用Microsoft Analysis Services 算法生成模型
以上内容配置完成后,即可使用数据库内的算法生成模型。如下图:
源节点从SQL Server数据库中读取,终端节点又写回到SQL Server数据库中,中间使用的是Microsoft的决策树算法,整个计算过程都在数据库中实现。
介绍到这里,我们就了解了,如何使用数据库内算法进行建模的过程,经常会有朋友问说,使用这里的决策树算法和使用IBM SPSS Modeler封装好的决策树算法,结果会有什么不同?预测结果当然是会有差异的了。本身决策树算法就包含多种,像C&R、CHAID、C5.0、QUEST等,每个算法计算逻辑就不一样,因此计算得到的结果自然也不一样,前面我们已经介绍过C&R、CHAID、C5.0这三种算法,他们核心的差异就是选择最佳分组变量和分割点的标准,而Microsoft Analysis Services决策树是使用线性回归来确定决策树分割位置,它可以用于分类属性和连续属性的预测建模。那么到底选择什么算法为优呢,前面已经介绍了,使用数据库内建模的好处,大家可以综合考虑,结合实际场景和数据预测结果的评估再做选择。
相关推荐
SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。SPSS Modeler 可以...
IBM SPSS Modeler 14.2 是一款强大的数据挖掘和预测分析工具,广泛应用于商业智能、市场研究、风险管理等领域。这款软件的核心在于其直观的图形用户界面(GUI),允许用户通过拖放的方式构建复杂的统计模型,而无需...
IBM SPSS Modeler是一款强大的数据挖掘工具,专为数据分析专业人士设计。它提供了用户友好的界面,使得非编程背景的用户也能进行复杂的统计分析和预测建模。本手册针对IBM SPSS Modeler 18版本,提供了简体中文的...
总的来说,这个实战教程将引导学习者掌握如何使用IBM SPSS Modeler进行数据预处理、特征工程、建模以及文本挖掘,通过实际操作提升数据驱动决策的能力。无论是对于市场趋势预测、客户行为分析,还是在社交媒体监控等...
线性回归模型是一种常用的统计学模型, IBM SPSS Modeler 是一个强大的数据挖掘分析工具,本文将通过建立一个理赔欺诈检测模型的实例来展示如何利用 IBM SPSS Modeler 建立线性回归预测模型以及如何解释及应用该模型...
IBM SPSS Modeler是一款强大的数据挖掘工具,专为专业人士设计,用于从大量复杂数据中提取有价值的洞察。在这款软件中,用户可以进行预测性建模、统计分析以及数据预处理,广泛应用于商业智能、市场研究、风险评估等...
IBM SPSS Modeler的Python接口还允许与外部系统交互,如数据库、Web服务或Hadoop等大数据环境。通过Python脚本,可以将Modeler的工作流程与其他平台无缝连接,实现更广泛的数据分析应用场景。 八、学习资源与社区...
银行客户流失分析+SPSS Modeler 本资源摘要信息是关于银行客户流失分析的完整报告,使用SPSS Modeler作为数据分析工具。该报告涵盖了研究背景、研究问题、研究方法、数据处理和数据建模、实验结果、管理建议等多个...
一旦模型建立完毕,IBM SPSS Modeler Solution Publisher则能帮助企业将模型部署到整个组织,使决策者能够直接访问模型结果,或将模型嵌入到数据库中进行自动化决策。 IBM Business Analytics产品家族是IBM提供的...
IBM spss modeler 18 建模节点手册,包括模型节点的详细使用说明,节点设置项的详细解释与使用方法
SPSS Modeler是IBM公司开发的一款专业数据挖掘软件,它以其用户友好的界面和丰富的建模功能,广泛应用于商业智能、市场预测、风险评估等多个领域。 本书的内容涵盖了数据挖掘的基础理论和SPSS Modeler的主要功能,...
SPSS Modeler(原名Clementine)是由IBM开发的一款图形化用户界面的数据挖掘工具。它提供了一种直观的方式来构建、测试和部署预测模型,无需深入编程知识。SPSS Modeler支持各种数据挖掘方法,包括分类、聚类、关联...
Spss Modeler 18 简体中文版的使用手册,包含大量应用实例,如怎样建模,多项Logistic回归应用电信业客户分类,时间序列预测宽带利用率,泊松回归分析船只损坏率,Gamma回归拟合汽车保险理陪,SVM细胞样本分类等。
IBM SPSS 20.0 32位简体中文版是一款专为数据分析和统计建模设计的强大软件,尤其适合那些参与数学建模竞赛或研究的用户。SPSS(Statistical Product and Service Solutions)以其易用性和强大的统计功能在学术界和...
SPSS Modeler,原名Clementine,是一款由IBM推出的图形化数据挖掘工具。它以其直观易用的拖放界面而闻名,使得非编程背景的用户也能轻松进行数据预处理、模型构建和结果解读。SPSS Modeler的主要功能包括: 1. 数据...
《SPSS Modeler》是IBM公司推出的一款强大的数据挖掘工具,尤其在商业智能领域有着广泛的应用。本实验报告主要基于《SPSS Modeler》的第三版,由薛薇编著,电子工业出版社出版,旨在深入讲解数据挖掘的方法并提供...
《SPSS Modeler数据与文本挖掘实战-数据和程序》是针对数据分析专业人士的一份宝贵资源,它涵盖了使用IBM SPSS Modeler进行数据挖掘和文本分析的实用技术和案例研究。SPSS Modeler是一款强大的数据挖掘工具,它允许...
IBM电信数据挖掘红皮书(194页)可能会详细阐述如何利用IBM的数据挖掘工具,如SPSS Modeler、Cognos Business Intelligence等,集成DB2数据库,构建端到端的数据挖掘流程。这些工具提供了数据预处理、特征工程、建模...
IBM SPSS Modeler是SPSS的数据挖掘工具,包含一系列高级算法,如神经网络、规则挖掘和随机森林等。通过构建流图,用户可以组合不同的算法来解决复杂的问题,如客户细分、预测模型和关联规则发现。 6. **模型评估与...
SPSS Modeler,原名 Clementine,是IBM公司开发的一款强大的数据挖掘和预测分析软件,广泛应用于商业智能、市场研究和风险管理等领域。 在数据挖掘过程中,SPSS Modeler提供了丰富的图形化界面,使得非编程背景的...