`
weitao1026
  • 浏览: 1033059 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
阅读更多

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自New Zealand的the University of Waikato。

 

1.简介

数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而weka,便是数据挖掘工具中的佼佼者。

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化的,基于JAVA环境下开源的机器学习以及数据挖掘软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自新西兰的the University of Waikato。(本段摘自百度百科)。

Weka提供的功能有数据处理,特征选择、分类、回归、聚类、关联规则、可视化等。本文将对Weka的使用做一个简单的介绍,并通过简单的示例,使大家了解使用weka的流程。本文将仅对图形界面的操作做介绍,不涉及命令行和代码层面的东西。

 

2.安装

Weka的官方地址是http://www.cs.waikato.ac.nz/ml/weka/。点开左侧download栏,可以进入下载页面,里面有windows,mac os,linux等平台下的版本,我们以windows系统作为示例。目前稳定的版本是3.6。

如果本机没有安装java,可以选择带有jre的版本。下载后是一个exe的可执行文件,双击进行安装即可。

安装完毕,打开启动weka的快捷方式,如果可以看到下面的界面,那么恭喜,安装成功了。

图2.1 weka启动界面

窗口右侧共有4个应用,分别是

1)Explorer

用来进行数据实验、挖掘的环境,它提供了分类,聚类,关联规则,特征选择,数据可视化的功能。(An environment for exploring data with WEKA)

2)Experimentor

用来进行实验,对不同学习方案进行数据测试的环境。(An environment for performing experiments and conducting statistical tests between learning schemes.)

3)KnowledgeFlow

功能和Explorer差不多,不过提供的接口不同,用户可以使用拖拽的方式去建立实验方案。另外,它支持增量学习。(This environment supports essentially the same functions as the Explorer but with a drag-and-drop interface. One advantage is that it supports incremental learning.)

4)SimpleCLI

简单的命令行界面。(Provides a simple command-line interface that allows direct execution of WEKA commands for operating systems that do not provide their own command line interface.)

3.数据格式

Weka支持很多种文件格式,包括arff、xrff、csv,甚至有libsvm的格式。其中,arff是最常用的格式,我们在这里仅介绍这一种。

 

分享到:
评论

相关推荐

    weka-src[weka源码]

    在Weka的源码中,`META-INF`可能包含了Weka的版本信息、签名信息以及其他元数据,这对于了解Weka的构建和打包过程是很有帮助的。 2. **weka**: 这个目录包含了Weka的核心代码。我们可以在这个目录下找到各种数据...

    WEKA使用教程WEKA使用教程

    ### WEKA使用教程详解 #### 1. WEKA概述 WEKA,全称为怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是由新西兰怀卡托大学开发的一款开源数据挖掘软件。它不仅是一个功能丰富的数据挖掘平台...

    weka.jar和weka.zip源码 API

    Weka,全称为“Waikato Environment for Knowledge Analysis”,是一个广泛应用于数据挖掘和机器学习领域的开源软件工具。这个工具集提供了丰富的算法库,包括分类、回归、聚类、关联规则和特征选择等,并且支持数据...

    weka_doc(weka文档)

    Weka(Waikato Environment for Knowledge Analysis)是一个强大的数据挖掘和机器学习工具,主要用于数据分析和预测建模。这个系统由新西兰怀卡托大学的计算机科学系开发,是完全开源的,采用Java语言编写,因此具备...

    Java实现对Weka算法的应用案例

    在IT领域,Weka是一个非常著名的数据挖掘工具,它提供了丰富的机器学习算法库。这个案例主要探讨了如何在Java环境中利用Weka进行数据分析和建模。以下是对标题和描述中涉及知识点的详细解释: 1. **Weka算法**:...

    weka使用中文教程

    WEKA 使用中文教程 WEKA(Waikato Environment for Knowledge Analysis)是一种开放的数据挖掘工作平台,能够承担大量数据挖掘任务,包括数据预处理、分类、回归、聚类、关联规则等。_WEKA 的主要开发者来自新西兰...

    weka java 开发软件

    "weka.jar"是Weka的核心库,包含了所有预定义的数据挖掘算法和工具,开发者可以直接在Java代码中引用这个库,调用Weka的功能。而"weka_src.jar"则包含了Weka的源代码,这对于开发者来说非常宝贵,因为可以查看并理解...

    weka源码学习

    Weka 开发[1]-Instances类 1 Weka开发[2]-分类器类 2 Weka开发[3]-Evaluation类 3 Weka开发[4]-特征选择 4 Weka开发[5]-半监督算法 6 Weka开发[0]-导入Weka包 8 半监督算法工具SVMlin使用 12 半...

    WEKA中文教程

    WEKA中文教程WEKA中文教程WEKA中文教程WEKA中文教程WEKA中文教程WEKA中文教程

    weka jar包

    **Weka详解** Weka(Waikato Environment for Knowledge Analysis)是一个开源的机器学习软件,由新西兰怀卡托大学开发,主要用于数据挖掘和数据分析。它提供了丰富的机器学习算法、数据预处理工具以及可视化功能,...

    weka-3.7.3.jar- java开发包

    Weka 是一个强大的数据挖掘和机器学习工具,主要用于教学、研究和工业应用。这个压缩包包含的是 Weka 3.7.3 版本的 Java 开发包,它允许开发者在自己的 Java 应用程序中直接集成和调用 Weka 的功能。 1. **Weka ...

    Weka 中文版 v0.3 发布 基于weka 3.7.12 x64

    在第2版weka中文版的 基础上制作了第3版,暂定版本v0.3。将 guichooser 汉化完成。考虑到大家还是习惯使用 guichooser 作为默认启动界面,将 RunWeka.ini 中的设置恢复默认。但是为了支持中文,其中的编码选项从 cp...

    weka_android.zip

    标题 "weka_android.zip" 暗示了这个压缩包包含了一个特别为Android平台优化的Weka版本。Weka是一个广泛使用的开源数据挖掘和机器学习工具集,通常在Java环境中运行,提供图形用户界面(GUI)和编程接口。在Android...

    weka的JAVA程序

    Weka 是一个强大的数据挖掘和机器学习工具,它源自新西兰的怀卡托大学。这个压缩包文件包含的是基于 Java 编写的 Weka 程序,意味着你可以通过编写 Java 代码来利用 Weka 的功能进行数据分析和建模。Weka 提供了丰富...

    weka 中em算法详细解析

    标题:“Weka中EM算法详细解析” 描述:“深入解析Weka中的EM算法,内容详尽,值得学习。” 根据给定的文件信息,我们将探讨Weka中EM算法的关键知识点,包括其在Weka框架中的实现、EM算法的工作原理、以及算法在...

    weka 融合TimeSerial Forcast资源

    【标题】:Weka时间序列预测(TimeSeriesForecasting)集成资源详解 【描述】:Weka是一款强大的数据挖掘和机器学习工具,广泛应用于学术研究和工业应用中。时间序列预测(TimeSeriesForecasting)是Weka的一个重要...

    matlab2weka.zip

    《MATLAB与WEKA数据挖掘工具的交互》 MATLAB是一款强大的数学计算软件,而WEKA则是一个广泛使用的数据挖掘和机器学习工具。"matlab2weka.zip"这个压缩包,显然包含了使得MATLAB能够与WEKA进行交互的相关文件。下面...

Global site tag (gtag.js) - Google Analytics