1.SAS EM 在所有的数据挖掘产品中唯一一家能够将数据分为训练、验证、测试三部分并能自动地在训练数据上建模,在验证数据上进行模型调整优化,在测试数据上进行模型评估而不影响模型建立,同时还能将各种模型的提升图,ROC图等在一个 页面中显示,进而很直观地进行比较,模型哪个更好一目了然;而SPSS Clementine需要用户手动去分别创建训练、验证、测试等数据然后分别学习,相互之间无法协调,各种模型的提升图,ROC图都是分别显示的,各自为政,这样很不利于选出更好的模型和保证模型的质量。
2.SAS EM的帮助文档非常全面和系统,并且还有各种数据挖掘算法的细节,而SPSS Clementine的帮助文档只涉及到软件使用上,但对各种数据挖掘算法的介绍很少,这不利于分析人员用好数据挖掘工具。
3.SAS EM 能够实现并行和多线程处理,更可以利用网格计算技术提高性能,这对于处理海量数据挖掘至关重要;而SPSS Clementine 则不能。
4.SAS EM 支持更广泛的输入数据格式,比如SAS EM支持EXCEL 和.dbf文件,而SPSS Clementine 不能。
5.SAS EM 采用的Client/Server模式,可以充分利用服务器的处理能力,而SPSS Clementine不能。
6.SAS EM可以将建好的数据挖据流程很方便地转成SAS、Java、C代码,这为模型的实施扫平了障碍,SPSS Clementine 不能。
7.SAS EM可以将数据挖掘的成果很方便地发布到BI 报表系统上,而SPSS Clementine不能。
8.SAS EM图形显示非常丰富,除了常见的直方图、散点图、盒须图,更有3D旋转图、等高线图;SPSS Clementine则做不到.
分享到:
相关推荐
本文将重点讨论数据挖掘工具的使用、比较和分析,特别是SPSS Clementine,以及它与Weka和SAS EM的对比。 SPSS Clementine是一款强大的数据挖掘和数据分析工具,由IBM开发,广泛应用于社会科学、商业分析和市场研究...
数据挖掘的基本工具有SPSS、Clementine、SAS EM等,它们提供了各种算法来处理和分析数据,如分类、聚类、关联规则、序列模式、回归分析等。数据挖掘流程通常包括数据预处理、选择模型、训练模型、评估模型和模型应用...
第二层是使用如SAS EM和Clementine这样的傻瓜式挖掘工具,它们提供直观的界面和预设的算法,适合初学者快速上手,但缺乏灵活性。第三层是R语言和Python,它们是更为自由的挖掘工具,具备丰富的算法库和高度自定义...
本文所提出的模型,是基于SAS/EM模块的数据挖掘过程。该过程不仅分析了客户固有的特征,还分析了客户的行为特征。模型采用决策树分类算法中的CART算法建立,创建了聚类分析模型和一套完整的流失预测模型,包括评估...
但是,目前的数据挖掘平台和工具,如SAS公司的SAS/EM、SPSS公司的Clementine和IBM公司的Intelligent Miner,大多价格昂贵,且对国内用户的适用性和效果并不理想。因此,研究和开发适合国情的数据挖掘平台具有重要...