`
阅读更多

IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。实现了在IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。

那么使用IBM SPSS Modeler访问数据库自有算法有什么优势呢?主要是两方面:

1.数据库内的算法常常与数据库服务器紧密集成,这有助于提高性能。

2.在“数据库内”构建和存储的模型不仅由可访问数据库的应用程序共享,且更易于在这些应用程序中部署。

接下来我们以Microsoft Analytics Services为例,介绍如何配置以及使用数据库内建模功能。

IBM SPSS Modeler支持集成下列Analysis Services算法包括:

  • 决策树
  • 聚类
  • 关联规则
  • 朴素贝叶斯
  • 线性回归
  • 神经网络
  • Logistic回归
  • 时间序列
  • 序列聚类

安装与配置:

在您的机器上,必须安装以下模块:

  • IBM SPSS Modeler Client
  • IBM SPSS Modeler Server
  • Microsoft Analysis Services,与相应数据库建立ODBC连接

1. 配置IBM SPSS Modeler:

在IBM SPSS Modeler中,在菜单栏的工具-->选项-->帮助应用程序,选择Microsoft面板,如下图:

spss

勾上之后,会在下面的面板节点上多了一项数据库建模,列出了Microsoft Analysis Services支持的数据库内建模算法,如下图:

spss

2. 配置 SQL Server

该配置可实现在数据库内进行评分。

在 SQL Server 主机上创建以下注册表键:

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP

为该键添加如下 DWORD 键值:

AllowInProcess 1

完成上述更改后,重新启动SQL Server。

3. 配置Microsoft Analysis Services

建立IBM SPSS Modeler 与Microsoft Analysis Services 进行通信。

通过MS SQL Server Management Studio 登录到分析服务器。

访问“属性”对话框,右键单击服务器名称,然后选择属性。

选中显示高级(所有)属性复选框。

更改以下属性:

将 DataMining\AllowAdHocOpenRowsetQueries 的值更改为 True(缺省值为False)。

将 DataMining\AllowProvidersInOpenRowset 的值更改为 [all] (无缺省值)。

4. 为SQL Server 创建 ODBC DSN

通过使用 Microsoft SQL Native Client ODBC 驱动程序,创建一个指向数据挖掘过程中使用的 SQL Server 数据库的 ODBC DSN。余下的驱动程序设置应使用缺省设置。

对于此DSN,请确保选中了使用集成的 Windows 认证。

5. 启用 SQL 生成和优化

从IBM SPSS Modeler菜单中选择:工具—>流属性—>选项—>优化面板,勾选上所有选项内容如下图:

spss

使用Microsoft Analysis Services 算法生成模型

以上内容配置完成后,即可使用数据库内的算法生成模型。如下图:

spss

源节点从SQL Server数据库中读取,终端节点又写回到SQL Server数据库中,中间使用的是Microsoft的决策树算法,整个计算过程都在数据库中实现。

介绍到这里,我们就了解了,如何使用数据库内算法进行建模的过程,经常会有朋友问说,使用这里的决策树算法和使用IBM SPSS Modeler封装好的决策树算法,结果会有什么不同?预测结果当然是会有差异的了。本身决策树算法就包含多种,像C&R、CHAID、C5.0、QUEST等,每个算法计算逻辑就不一样,因此计算得到的结果自然也不一样,前面我们已经介绍过C&R、CHAID、C5.0这三种算法,他们核心的差异就是选择最佳分组变量和分割点的标准,而Microsoft Analysis Services决策树是使用线性回归来确定决策树分割位置,它可以用于分类属性和连续属性的预测建模。那么到底选择什么算法为优呢,前面已经介绍了,使用数据库内建模的好处,大家可以综合考虑,结合实际场景和数据预测结果的评估再做选择。

SPSS试用版下载请点击>>>

0
0
分享到:
评论

相关推荐

    IBM SPSS Modeler 14 简体中文手册_IBMSPSS简体中文手册_

    SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。SPSS Modeler 可以...

    IBM SPSS Modeler 14.2 License

    IBM SPSS Modeler 14.2 是一款强大的数据挖掘和预测分析工具,广泛应用于商业智能、市场研究、风险管理等领域。这款软件的核心在于其直观的图形用户界面(GUI),允许用户通过拖放的方式构建复杂的统计模型,而无需...

    IBM SPSS Modeler 18简体中文手册

    IBM SPSS Modeler是一款强大的数据挖掘工具,专为数据分析专业人士设计。它提供了用户友好的界面,使得非编程背景的用户也能进行复杂的统计分析和预测建模。本手册针对IBM SPSS Modeler 18版本,提供了简体中文的...

    IBM SPSS Modeler使用教程

    IBM SPSS Modeler 提供了一种自动化建模的功能,该功能可以自动评估和比较不同的建模方法,并按照有效性的高低进行排序。这意味着用户可以在单次建模过程中测试多种方法,从而更容易找到最佳解决方案。 #### 六、...

    IBM SPSS Modeler的脚本编写指南

    - **广泛的模型部署**:通过 IBM SPSS Modeler SolutionPublisher 在整个企业内部交付模型给决策者,或者直接通过数据库进行部署。 #### 二、IBM Business Analytics IBM Business Analytics 软件提供了一整套的...

    IBM SPSS Modeler 18.0 Python脚本编制和自动化指南(中文)

    IBM SPSS Modeler的Python接口还允许与外部系统交互,如数据库、Web服务或Hadoop等大数据环境。通过Python脚本,可以将Modeler的工作流程与其他平台无缝连接,实现更广泛的数据分析应用场景。 八、学习资源与社区...

    IBM SPSS Modeler数据与文本挖掘实战---数据和程序

    总的来说,这个实战教程将引导学习者掌握如何使用IBM SPSS Modeler进行数据预处理、特征工程、建模以及文本挖掘,通过实际操作提升数据驱动决策的能力。无论是对于市场趋势预测、客户行为分析,还是在社交媒体监控等...

    用-SPSS-Modeler-建立线性回归预测模型

    线性回归模型是一种常用的统计学模型, IBM SPSS Modeler 是一个强大的数据挖掘分析工具,本文将通过建立一个理赔欺诈检测模型的实例来展示如何利用 IBM SPSS Modeler 建立线性回归预测模型以及如何解释及应用该模型...

    IBM SPSS Modeler CRISP-DM指南(中文).pdf

    DM指南(中文).pdf 官方中文帮助文档 实用权威”,以及标签“商业智能 BI 数据挖掘 机器学习 SPSS Modeler”,我们可以推断出该文档可能详细介绍了使用IBM SPSS Modeler进行数据分析和建模的CRISP-DM方法论。...

    IBM SPSS Modeler 18.0 批处理用户指南(中文).PDF

    IBM SPSS Modeler是一款广泛应用于数据分析、数据挖掘和预测建模的专业软件,它提供的功能和工具能够帮助用户从大量的数据中发现趋势,建立模型,从而做出精确的预测和决策。IBM SPSS Modeler 18.0版本是该系列软件...

    IBM SPSS Modeler 官方操作手册

    IBM SPSS Modeler是一款强大的数据挖掘工具,专为专业人士设计,用于从大量复杂数据中提取有价值的洞察。在这款软件中,用户可以进行预测性建模、统计分析以及数据预处理,广泛应用于商业智能、市场研究、风险评估等...

    ibm spss modeler 14.2 user guide中文版

    ### IBM SPSS Modeler 14.2 用户指南知识点概览 #### IBM SPSS Modeler 简介 - **定位**: IBM SPSS Modeler 是一个面向企业的数据挖掘平台,旨在帮助企业通过深入的数据分析来改善与客户及公众的关系。 - **功能**...

    IBM SPSS Modeler 18.0 部署指南(中文)

    7. 其他功能点:IBM SPSS Modeler 18.0还具备其他高级功能,例如自动化建模流程、使用先进的算法构建预测模型、处理非结构化数据等。 以上内容涉及的部署指南中提到的各个组件和概念,对于保证SPSS Modeler 18.0在...

    银行客户流失分析+SPSS modeler

    银行客户流失分析+SPSS Modeler 本资源摘要信息是关于银行客户流失分析的完整报告,使用SPSS Modeler作为数据分析工具。该报告涵盖了研究背景、研究问题、研究方法、数据处理和数据建模、实验结果、管理建议等多个...

    IBM SPSS Modeler Cookbook

    IBM SPSS Modeler是一套数据挖掘工作台,它允许用户探索数据、识别数据中重要的关系,并快速建立预测模型。该工具旨在让企业基于数据驱动进行决策,而非依赖直觉或猜测。为了达到这样的目标,用户需要掌握一系列的...

    SPSS Modeler中的python代码编写

    SPSS Modeler是IBM公司推出的一款集成数据挖掘工具,它允许用户通过图形化界面进行数据挖掘流程的设计,也可以使用Python和R等编程语言扩展其功能。 描述部分提到了在SPSS Modeler中利用Python进行编程的文档,说明...

    spss modeler 18 建模节点 手册 (简体中文)

    IBM SPSS Modeler 18.0版本中包含的建模节点大致可以分为几个大类: 1. 数据准备节点:包括Type节点(用于定义字段的数据类型)、Derive节点(用于计算新字段或修改现有字段)、Select节点(用于选择需要的字段)和...

    spss modeler 14.2 ApplicationsGuide中文版

    此外,SPSS Modeler 还可通过 **IBM SPSS Modeler SolutionPublisher** 将模型结果有效地分发给决策者。 #### 二、SPSS Modeler 的核心组件与功能 1. **IBM SPSS Modeler Server**:支持大规模的数据处理和模型...

    《基于SPSS_Modeler的数据挖掘(第二版)》数据和流文件

    SPSS Modeler是IBM公司开发的一款专业数据挖掘软件,它以其用户友好的界面和丰富的建模功能,广泛应用于商业智能、市场预测、风险评估等多个领域。 本书的内容涵盖了数据挖掘的基础理论和SPSS Modeler的主要功能,...

    spss modeler使用说明

    [SPSS Modeler 界面](图1.SPSSModeler界面) **基本概念:** 1. **节点**:代表要对数据执行的具体操作。例如,打开数据源、添加新字段、根据字段值选择记录等。 2. **数据流**:指通过一系列节点对数据进行处理的...

Global site tag (gtag.js) - Google Analytics