IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。
那么使用IBM SPSS Modeler访问数据库自有算法有什么优势呢?主要是两方面:
1.数据库内的算法常常与数据库服务器紧密集成,这有助于提高性能。
2.在“数据库内”构建和存储的模型不仅由可访问数据库的应用程序共享,且更易于在这些应用程序中部署。
接下来我们以Microsoft Analytics Services为例,介绍如何配置以及使用数据库内建模功能。
IBM SPSS Modeler支持集成下列Analysis Services算法包括:
- 决策树
- 聚类
- 关联规则
- 朴素贝叶斯
- 线性回归
- 神经网络
- Logistic回归
- 时间序列
- 序列聚类
安装与配置:
在您的机器上,必须安装以下模块:
- IBM SPSS Modeler Client
- IBM SPSS Modeler Server
- Microsoft Analysis Services,与相应数据库建立ODBC连接
1. 配置IBM SPSS Modeler:
在IBM SPSS Modeler中,在菜单栏的工具-->选项-->帮助应用程序,选择Microsoft面板,如下图:
勾上之后,会在下面的面板节点上多了一项数据库建模,列出了Microsoft Analysis Services支持的数据库内建模算法,如下图:
2. 配置 SQL Server
该配置可实现在数据库内进行评分。
在 SQL Server 主机上创建以下注册表键:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP
为该键添加如下 DWORD 键值:
AllowInProcess 1
完成上述更改后,重新启动SQL Server。
3. 配置Microsoft Analysis Services
建立IBM SPSS Modeler 与Microsoft Analysis Services 进行通信。
通过MS SQL Server Management Studio 登录到分析服务器。
访问“属性”对话框,右键单击服务器名称,然后选择属性。
选中显示高级(所有)属性复选框。
更改以下属性:
将 DataMining\AllowAdHocOpenRowsetQueries 的值更改为 True(缺省值为False)。
将 DataMining\AllowProvidersInOpenRowset 的值更改为 [all] (无缺省值)。
4. 为SQL Server 创建 ODBC DSN
通过使用 Microsoft SQL Native Client ODBC 驱动程序,创建一个指向数据挖掘过程中使用的 SQL Server 数据库的 ODBC DSN。余下的驱动程序设置应使用缺省设置。
对于此DSN,请确保选中了使用集成的 Windows 认证。
5. 启用 SQL 生成和优化
从IBM SPSS Modeler菜单中选择:工具—>流属性—>选项—>优化面板,勾选上所有选项内容如下图:
使用Microsoft Analysis Services 算法生成模型
以上内容配置完成后,即可使用数据库内的算法生成模型。如下图:
源节点从SQL Server数据库中读取,终端节点又写回到SQL Server数据库中,中间使用的是Microsoft的决策树算法,整个计算过程都在数据库中实现。
介绍到这里,我们就了解了,如何使用数据库内算法进行建模的过程,经常会有朋友问说,使用这里的决策树算法和使用IBM SPSS Modeler封装好的决策树算法,结果会有什么不同?预测结果当然是会有差异的了。本身决策树算法就包含多种,像C&R、CHAID、C5.0、QUEST等,每个算法计算逻辑就不一样,因此计算得到的结果自然也不一样,前面我们已经介绍过C&R、CHAID、C5.0这三种算法,他们核心的差异就是选择最佳分组变量和分割点的标准,而Microsoft Analysis Services决策树是使用线性回归来确定决策树分割位置,它可以用于分类属性和连续属性的预测建模。那么到底选择什么算法为优呢,前面已经介绍了,使用数据库内建模的好处,大家可以综合考虑,结合实际场景和数据预测结果的评估再做选择。
相关推荐
SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。SPSS Modeler 可以...
IBM SPSS Modeler 14.2 是一款强大的数据挖掘和预测分析工具,广泛应用于商业智能、市场研究、风险管理等领域。这款软件的核心在于其直观的图形用户界面(GUI),允许用户通过拖放的方式构建复杂的统计模型,而无需...
IBM SPSS Modeler是一款强大的数据挖掘工具,专为数据分析专业人士设计。它提供了用户友好的界面,使得非编程背景的用户也能进行复杂的统计分析和预测建模。本手册针对IBM SPSS Modeler 18版本,提供了简体中文的...
IBM SPSS Modeler 提供了一种自动化建模的功能,该功能可以自动评估和比较不同的建模方法,并按照有效性的高低进行排序。这意味着用户可以在单次建模过程中测试多种方法,从而更容易找到最佳解决方案。 #### 六、...
- **广泛的模型部署**:通过 IBM SPSS Modeler SolutionPublisher 在整个企业内部交付模型给决策者,或者直接通过数据库进行部署。 #### 二、IBM Business Analytics IBM Business Analytics 软件提供了一整套的...
IBM SPSS Modeler的Python接口还允许与外部系统交互,如数据库、Web服务或Hadoop等大数据环境。通过Python脚本,可以将Modeler的工作流程与其他平台无缝连接,实现更广泛的数据分析应用场景。 八、学习资源与社区...
总的来说,这个实战教程将引导学习者掌握如何使用IBM SPSS Modeler进行数据预处理、特征工程、建模以及文本挖掘,通过实际操作提升数据驱动决策的能力。无论是对于市场趋势预测、客户行为分析,还是在社交媒体监控等...
线性回归模型是一种常用的统计学模型, IBM SPSS Modeler 是一个强大的数据挖掘分析工具,本文将通过建立一个理赔欺诈检测模型的实例来展示如何利用 IBM SPSS Modeler 建立线性回归预测模型以及如何解释及应用该模型...
DM指南(中文).pdf 官方中文帮助文档 实用权威”,以及标签“商业智能 BI 数据挖掘 机器学习 SPSS Modeler”,我们可以推断出该文档可能详细介绍了使用IBM SPSS Modeler进行数据分析和建模的CRISP-DM方法论。...
IBM SPSS Modeler是一款广泛应用于数据分析、数据挖掘和预测建模的专业软件,它提供的功能和工具能够帮助用户从大量的数据中发现趋势,建立模型,从而做出精确的预测和决策。IBM SPSS Modeler 18.0版本是该系列软件...
IBM SPSS Modeler是一款强大的数据挖掘工具,专为专业人士设计,用于从大量复杂数据中提取有价值的洞察。在这款软件中,用户可以进行预测性建模、统计分析以及数据预处理,广泛应用于商业智能、市场研究、风险评估等...
### IBM SPSS Modeler 14.2 用户指南知识点概览 #### IBM SPSS Modeler 简介 - **定位**: IBM SPSS Modeler 是一个面向企业的数据挖掘平台,旨在帮助企业通过深入的数据分析来改善与客户及公众的关系。 - **功能**...
7. 其他功能点:IBM SPSS Modeler 18.0还具备其他高级功能,例如自动化建模流程、使用先进的算法构建预测模型、处理非结构化数据等。 以上内容涉及的部署指南中提到的各个组件和概念,对于保证SPSS Modeler 18.0在...
银行客户流失分析+SPSS Modeler 本资源摘要信息是关于银行客户流失分析的完整报告,使用SPSS Modeler作为数据分析工具。该报告涵盖了研究背景、研究问题、研究方法、数据处理和数据建模、实验结果、管理建议等多个...
IBM SPSS Modeler是一套数据挖掘工作台,它允许用户探索数据、识别数据中重要的关系,并快速建立预测模型。该工具旨在让企业基于数据驱动进行决策,而非依赖直觉或猜测。为了达到这样的目标,用户需要掌握一系列的...
SPSS Modeler是IBM公司推出的一款集成数据挖掘工具,它允许用户通过图形化界面进行数据挖掘流程的设计,也可以使用Python和R等编程语言扩展其功能。 描述部分提到了在SPSS Modeler中利用Python进行编程的文档,说明...
IBM SPSS Modeler 18.0版本中包含的建模节点大致可以分为几个大类: 1. 数据准备节点:包括Type节点(用于定义字段的数据类型)、Derive节点(用于计算新字段或修改现有字段)、Select节点(用于选择需要的字段)和...
此外,SPSS Modeler 还可通过 **IBM SPSS Modeler SolutionPublisher** 将模型结果有效地分发给决策者。 #### 二、SPSS Modeler 的核心组件与功能 1. **IBM SPSS Modeler Server**:支持大规模的数据处理和模型...
SPSS Modeler是IBM公司开发的一款专业数据挖掘软件,它以其用户友好的界面和丰富的建模功能,广泛应用于商业智能、市场预测、风险评估等多个领域。 本书的内容涵盖了数据挖掘的基础理论和SPSS Modeler的主要功能,...
[SPSS Modeler 界面](图1.SPSSModeler界面) **基本概念:** 1. **节点**:代表要对数据执行的具体操作。例如,打开数据源、添加新字段、根据字段值选择记录等。 2. **数据流**:指通过一系列节点对数据进行处理的...