`
weitao1026
  • 浏览: 1053809 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
阅读更多

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自New Zealand的the University of Waikato。

 

1.简介

数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而weka,便是数据挖掘工具中的佼佼者。

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化的,基于JAVA环境下开源的机器学习以及数据挖掘软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自新西兰的the University of Waikato。(本段摘自百度百科)。

Weka提供的功能有数据处理,特征选择、分类、回归、聚类、关联规则、可视化等。本文将对Weka的使用做一个简单的介绍,并通过简单的示例,使大家了解使用weka的流程。本文将仅对图形界面的操作做介绍,不涉及命令行和代码层面的东西。

 

2.安装

Weka的官方地址是http://www.cs.waikato.ac.nz/ml/weka/。点开左侧download栏,可以进入下载页面,里面有windows,mac os,linux等平台下的版本,我们以windows系统作为示例。目前稳定的版本是3.6。

如果本机没有安装java,可以选择带有jre的版本。下载后是一个exe的可执行文件,双击进行安装即可。

安装完毕,打开启动weka的快捷方式,如果可以看到下面的界面,那么恭喜,安装成功了。

图2.1 weka启动界面

窗口右侧共有4个应用,分别是

1)Explorer

用来进行数据实验、挖掘的环境,它提供了分类,聚类,关联规则,特征选择,数据可视化的功能。(An environment for exploring data with WEKA)

2)Experimentor

用来进行实验,对不同学习方案进行数据测试的环境。(An environment for performing experiments and conducting statistical tests between learning schemes.)

3)KnowledgeFlow

功能和Explorer差不多,不过提供的接口不同,用户可以使用拖拽的方式去建立实验方案。另外,它支持增量学习。(This environment supports essentially the same functions as the Explorer but with a drag-and-drop interface. One advantage is that it supports incremental learning.)

4)SimpleCLI

简单的命令行界面。(Provides a simple command-line interface that allows direct execution of WEKA commands for operating systems that do not provide their own command line interface.)

3.数据格式

Weka支持很多种文件格式,包括arff、xrff、csv,甚至有libsvm的格式。其中,arff是最常用的格式,我们在这里仅介绍这一种。

 

分享到:
评论

相关推荐

    weka-src[weka源码]

    在Weka的源码中,`META-INF`可能包含了Weka的版本信息、签名信息以及其他元数据,这对于了解Weka的构建和打包过程是很有帮助的。 2. **weka**: 这个目录包含了Weka的核心代码。我们可以在这个目录下找到各种数据...

    Weka 中文版 v0.3 发布 基于weka 3.7.12 x64

    在第2版weka中文版的 基础上制作了第3版,暂定版本v0.3。将 guichooser 汉化完成。考虑到大家还是习惯使用 guichooser 作为默认启动界面,将 RunWeka.ini 中的设置恢复默认。但是为了支持中文,其中的编码选项从 cp...

    weka开发java版jar包和源码

    这样,就可以直接使用Weka提供的类和方法,例如`weka.classifiers.Classifier`类用于训练和预测模型,`weka.core.Instances`类用于处理数据集,`weka.filters.Filter`类则用于数据预处理。 例如,以下是一个简单的...

    weka.jar和weka.zip源码 API

    Weka,全称为“Waikato Environment for Knowledge Analysis”,是一个广泛应用于数据挖掘和机器学习领域的开源软件工具。这个工具集提供了丰富的算法库,包括分类、回归、聚类、关联规则和特征选择等,并且支持数据...

    weka_doc(weka文档)

    Weka(Waikato Environment for Knowledge Analysis)是一个强大的数据挖掘和机器学习工具,主要用于数据分析和预测建模。这个系统由新西兰怀卡托大学的计算机科学系开发,是完全开源的,采用Java语言编写,因此具备...

    Java实现对Weka算法的应用案例

    在IT领域,Weka是一个非常著名的数据挖掘工具,它提供了丰富的机器学习算法库。这个案例主要探讨了如何在Java环境中利用Weka进行数据分析和建模。以下是对标题和描述中涉及知识点的详细解释: 1. **Weka算法**:...

    weka使用中文教程

    WEKA 使用中文教程 WEKA(Waikato Environment for Knowledge Analysis)是一种开放的数据挖掘工作平台,能够承担大量数据挖掘任务,包括数据预处理、分类、回归、聚类、关联规则等。_WEKA 的主要开发者来自新西兰...

    weka java 开发软件

    "weka.jar"是Weka的核心库,包含了所有预定义的数据挖掘算法和工具,开发者可以直接在Java代码中引用这个库,调用Weka的功能。而"weka_src.jar"则包含了Weka的源代码,这对于开发者来说非常宝贵,因为可以查看并理解...

    WEKA完整中文教程 实验教程 入门教程

    **WEKA全称是Waikato Environment for Knowledge Analysis,它是一个强大的数据挖掘工具,由新西兰怀卡托大学开发。这个工具主要用于机器学习和数据挖掘领域的实验与分析,提供了丰富的算法库,涵盖了预处理、分类、...

    weka源码学习

    Weka 开发[1]-Instances类 1 Weka开发[2]-分类器类 2 Weka开发[3]-Evaluation类 3 Weka开发[4]-特征选择 4 Weka开发[5]-半监督算法 6 Weka开发[0]-导入Weka包 8 半监督算法工具SVMlin使用 12 半...

    weka机器学习十大算法

    Weka是一个流行的数据挖掘工具,它提供了多种强大的机器学习算法。本文将深入探讨Weka中包含的十大算法,包括AdaBoost、Apriori、C4.5、CART、EM、K-means、KNN、PageRank、SVM以及朴素贝叶斯。 1. AdaBoost...

    WEKA中文教程

    WEKA中文教程WEKA中文教程WEKA中文教程WEKA中文教程WEKA中文教程WEKA中文教程

    weka-3.7.3.jar- java开发包

    Weka 是一个强大的数据挖掘和机器学习工具,主要用于教学、研究和工业应用。这个压缩包包含的是 Weka 3.7.3 版本的 Java 开发包,它允许开发者在自己的 Java 应用程序中直接集成和调用 Weka 的功能。 1. **Weka ...

    weka jar包

    **Weka详解** Weka(Waikato Environment for Knowledge Analysis)是一个开源的机器学习软件,由新西兰怀卡托大学开发,主要用于数据挖掘和数据分析。它提供了丰富的机器学习算法、数据预处理工具以及可视化功能,...

    JAVA-weka包.zip

    Java-Weka包是一个集合了Java语言接口和工具的压缩文件,主要用于数据挖掘和机器学习领域。Weka(Waikato Environment for Knowledge Analysis)是新西兰怀卡托大学开发的一个开源数据挖掘软件,它提供了大量预处理...

    weka中K-means使用演示

    WEKA 中 K-Means 使用演示 K-Means 算法是聚类分析中的一种常用方法,WEKA 作为一款功能强大的人工智能数据挖掘软件,也提供了 K-Means 算法的实现。下面将详细介绍如何使用 WEKA 实现 K-Means 聚类。 K-Means ...

    weka_android.zip

    标题 "weka_android.zip" 暗示了这个压缩包包含了一个特别为Android平台优化的Weka版本。Weka是一个广泛使用的开源数据挖掘和机器学习工具集,通常在Java环境中运行,提供图形用户界面(GUI)和编程接口。在Android...

Global site tag (gtag.js) - Google Analytics