`

Weka开发[8]- weka中算法说明

阅读更多

1) 数据输入和输出
WOW():查看Weka函数的参数。
Weka_control():设置Weka函数的参数。
read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。
write.arff:将数据写入Weka Attribute-Relation File Format (ARFF)格式的文件。


2) 数据预处理
Normalize():无监督的标准化连续性数据。
Discretize():用MDL(Minimum Description Length)方法,有监督的离散化连续性数值数据。


3) 分类和回归
IBk():k最近邻分类
LBR():naive Bayes法分类
J48():C4.5决策树算法(决策树在分析各个属性时,是完全独立的)。
LMT():组合树结构和Logistic回归模型,每个叶子节点是一个Logistic回归模型,准确性比单独的决策树和Logistic回归方法要好。
M5P():M5 模型数算法,组合了树结构和线性回归模型,每个叶子节点是一个线性回归模型,因而可用于连续数据的回归。
DecisionStump():单层决策树算法,常被作为boosting的基本学习器。
SMO():支持向量机分类
AdaBoostM1():Adaboost M1方法。-W参数指定弱学习器的算法。
Bagging():通过从原始数据取样(用替换方法),创建多个模型。
LogitBoost():弱学习器采用了对数回归方法,学习到的是实数值
MultiBoostAB():AdaBoost 方法的改进,可看作AdaBoost 和 “wagging”的组合。
Stacking():用于不同的基本分类器集成的算法。
LinearRegression():建立合适的线性回归模型。
Logistic():建立logistic回归模型。
JRip():一种规则学习方法。
M5Rules():用M5方法产生回归问题的决策规则。
OneR():简单的1-R分类法。
PART():产生PART决策规则。


4) 聚类
Cobweb():这是种基于模型方法,它假设每个聚类的模型并发现适合相应模型的数据。不适合对大数据库进行聚类处理。
FarthestFirst():快速的近似的k均值聚类算法
SimpleKMeans():k均值聚类算法
XMeans():改进的k均值法,能自动决定类别数
DBScan():基于密度的聚类方法,它根据对象周围的密度不断增长聚类。它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义为一组“密度连接”的点集。


5)关联规则
Apriori():Apriori是关联规则领域里最具影响力的基础算法,是一种广度优先算法,通过多次扫描数据库来获取支持度大于最小支持度的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁的;非频繁项集的任一超集一定是非频繁的。在海量数据的情况下,Apriori 算法的时间和空间成本非常高。
Tertius():Tertius算法。
6)预测和评估:
predict():根据分类或聚类结果预测新数据的类别
table():比较两个因子对象
evaluate_Weka_classifier():评估模型的执行,如:TP Rate,FP Rate,Precision,Recall,F-Measure。

分享到:
评论

相关推荐

    weka-3-8-6-azul-zulu-windows数据挖掘处理软件下载

    在 weka 中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。 Weka 基于 Java 开发,是一款开源且免费的软件,有 Windows 版本,Linux 版本和 Mac OS 版本。在数据源上支持 ARFF文件,这是一...

    weka-3-8-4.rar

    这个压缩包文件 "weka-3-8-4.rar" 包含的是 Weka 的一个特定版本,即版本 3.8.4,适配于 Azul Zulu JDK 的 Windows 版本。Azul Zulu 是一个开源的、基于 OpenJDK 的 Java 运行时环境,它为高性能和稳定性进行了优化...

    weka-3-8-2

    weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。Weka is a collection of machine learning...

    Weka-3-6.zip

    1. **算法选择**:Weka包含众多算法,选择合适的算法需要对问题有深入理解,通常需要进行多次尝试和比较。 2. **参数调优**:每个算法都有多个可配置参数,正确设置这些参数对模型性能至关重要。用户需要根据具体...

    weka-dev-3.7.10.jar

    Java weka包,提供arff文件操作和诸多聚类分类算法等。 其实网上有很多相关的教程,从如何下载weka包,到如何使用,都有很详细的说明,这里上传上来以方便使用。

    weka-3-7-0

    weka-3-7-0可执行文件 用于数据挖掘 含有聚类,分类等功能

    Weka实验----数据挖掘算法学习

    总所周知,Weka是数据挖掘算法学习的非常好的工具,附件为Weka的实验,看看你对Weka掌握的怎么杨,也可以通过实验学习Weka及算法。 本附件是下载自国外的网站,学习交流用,严禁用于商业,后果概不负责。

    weka-3-7-9jre libsvm wlsvm

    通过阅读"libsvm包的集成过程.txt"文档,用户可以学习如何在Weka中集成LibSVM,从而在Weka的环境中利用SVM的强大功能。 最后,WL-SVM是一种针对不平衡数据集的SVM改进方法。在现实世界的数据集中,类别分布往往不...

    weka-3-8-2下载exe

    在“weka-3-8-2下载exe”中,我们获取的是Weka的3.8.2版本的Windows可执行文件,这使得用户无需安装Java环境即可直接在Windows操作系统上运行。 Weka的核心在于它提供了大量的机器学习算法,包括传统的统计方法、...

    windows版weka-3-8-6下载

    标题中提到的是Windows版的Weka-3-8-6,这意味着它是专门为在Microsoft Windows操作系统上运行而设计的。这个版本适用于Windows 7及更高版本,确保了广泛的用户基础。由于原网站下载可能面临速度较慢的问题,所以...

    weka中K-means使用演示

    K-Means 算法是聚类分析中的一种常用方法,WEKA 作为一款功能强大的人工智能数据挖掘软件,也提供了 K-Means 算法的实现。下面将详细介绍如何使用 WEKA 实现 K-Means 聚类。 K-Means 算法概述 K-Means 算法是一种...

    Weka-3-8-5.rar

    这个名为"Weka-3-8-5.rar"的压缩包文件,包含了Weka的3.8.5版本,它是数据科学家和研究人员在进行数据分析和机器学习时的重要资源。 Weka的核心价值在于它提供了丰富的机器学习算法,涵盖了数据挖掘的主要任务。...

    weka-3-8-0.zip

    这个"weka-3-8-0.zip"压缩包包含了Weka的3.8.0版本,这是一个开源软件,由新西兰怀卡托大学的信息科学系开发并维护。Weka的核心是用Java编写的,因此它具有跨平台的特性,可以在多种操作系统上运行。 **1. Weka的...

    weka-3-8-4-azul-zulu-linux.zip

    例如,通过Weka4 Unsure库,用户可以在Hadoop MapReduce上运行Weka算法,处理大规模数据集。 四、案例研究 1. 信用卡欺诈检测:Weka可以用于分析信用卡交易数据,通过特征工程和学习算法识别潜在的欺诈行为。 2. ...

    weka 3-6-1 数据挖掘工具

    - **算法多样**:Weka 包含多种经典的分类和回归算法,如决策树(C4.5、ID3)、贝叶斯网络、支持向量机(SVM)、神经网络、K近邻(KNN)等。 - **评估与比较**:内置交叉验证、独立测试集验证等评估方法,可以比较...

    weka-3-8-3-x64.exe

    weka有带java环境和不带java环境的版本,这是不带jre的版本。 Weka使机器学习的应用变得简单、高效并且充满乐趣。它拥有图形界面,并且允许你加载自己的数据集,运行算法并且产生足够可靠、让人信服的结果。

    graphviz-treevisualize-weka-package-2014.8.1.zip

    在“confusionmatrix-weka-package-master”中,我们可以找到源代码和其他资源,这些资源可以帮助开发人员或研究人员自定义混淆矩阵的显示方式,例如使用Graphviz进行高级的图形渲染。Graphviz是一个强大的开源图形...

    weka-dev-3.9.0-sources

    标题 "weka-dev-3.9.0-sources" 提供了我们正在讨论的主题,即Weka的开发版本3.9.0的源代码。Weka是一个流行的数据挖掘和机器学习工具,主要用于教学、研究和实际应用。源码是软件的基础,它包含了编程语言编写的...

    weka源码学习

    Weka开发[-1]——在你的代码中使用Weka 51 挖掘多标签数据综述(multi-label data mining)[Available] 62 数据流-移动超平面(HyperPlane)构造 63 Weka开发[17]——关联规则之Apriori 66 Weka开发[18]——寻找K...

    Weka-3-8.zip

    在“Weka-3-8”这个版本中,可能包括了对之前版本的改进和错误修复,可能增加了新的算法或特性,提高了性能和稳定性。用户可以解压文件后,通过安装和运行Weka的可执行程序,直接在GUI环境中探索数据,或者通过Java ...

Global site tag (gtag.js) - Google Analytics