最近由于工作需要,要将线下的数据挖掘搬到线上来,这样就需要在线上实现各种数据挖掘算法,好在java开源的强大,有个开源的weka数据挖掘套件,里面实现了很多种DM算法,之前的pmml决策树算法已经可以用起来了(等weka搞完了分享下),最近在搞bayes算法的应用,发现遇到一些问题,故go之,才发现其实很多童鞋已经使用并分析了这个东西,在此将找到的一些资料汇总下,为后来人学习使用吧。
weka: naive bayes (大概分析了下类结构)
http://blog.csdn.net/aalbertini/archive/2011/04/01/6295092.aspx
Weka学习笔记 (对于使用GUI界面的童鞋可以有个很好的介绍,不过里面的图链接不存在了)
http://www.chiefsailor.net/blog/2010/02/weka-research-report/
Koala++'s blog
(Lucene Nutch Weka Larbin Sed)(对源码分析的很不错)
http://quweiprotoss.blog.163.com/
基于weka实现贝叶斯Multi-variate Bernoulli文本分类模型 (研究机器学习,自然语言处理的)
http://isip.buaa.edu.cn/lichen/?p=51
WEKA入门教程
http://bbs.wekacn.org/viewtopic.php?t=9
Weka 中文站
http://bbs2.wekacn.org/index.php
http://weka.wikispaces.com/Use+WEKA+in+your+Java+code
http://weka.wikispaces.com/Programmatic+Use
FAQ
http://weka.wikispaces.com/Frequently+Asked+Questions
分享到:
相关推荐
Weka是一款广泛应用于学术界和工业界的开源数据挖掘工具,由新西兰的怀卡托大学开发,支持多种数据挖掘任务,如分类、聚类、关联规则学习以及特征选择等。 在Weka中,API(Application Programming Interface)是...
机器学习工具WEKA的使用总结 机器学习工具WEKA是数据挖掘和机器学习领域中的一个非常流行的开源工具,提供了大量的机器学习算法和数据预处理方法。下面是WEKA中的一些重要知识点总结: 一、属性选择 在机器学习和...
机器学习工具WEKA的使用总结,包括算法选择、属性选择、参数优化 一、属性选择 在机器学习中,属性选择是指从原始数据中选择有代表性的特征,以提高模型的泛化能力和减少计算复杂度。WEKA中提供了多种属性选择方法...
Weka覆盖了数据挖掘实验的全过程,包括数据准备、学习方案评估以及数据和学习结果的可视化。 **1. 数据挖掘基础** 数据挖掘是探索大量数据以发现有价值信息的过程。Weka提供了各种算法,如分类、聚类、关联规则挖掘...
File inputFile = new File("C:\\Users\\zhangzhizhi\\Documents\\Everyone\\张志智\\总结积累\\Weka\\change_train.arff");// 训练语料文件 ArffLoader atf = new ArffLoader(); atf.setFile(inputFile); ...
总结起来,WEKA提供的特征选择方法和工具为数据挖掘提供了强大的支持,从不同角度考虑特征重要性,以优化模型性能和理解数据本质。在实际应用中,需要根据具体任务和资源限制选择合适的特征选择策略。
总之,这个"weka最新资料"压缩包为学习和使用Weka提供了一个全面的资源库,无论你是初次接触机器学习,还是希望深化对Weka的掌握,都能从中受益。通过深入研究开发文档,实践测试数据,参考案例,以及安装并使用Weka...
### 机器学习最佳入门学习资料汇总 #### 一、引言 随着人工智能技术的迅猛发展,机器学习作为其中的核心组成部分,越来越受到人们的关注。对于初学者而言,如何找到合适的学习资源成为了快速入门的关键。本文旨在为...
**正文** ...总结来说,Weka是一个强大的数据挖掘工具,涵盖了从数据预处理到模型构建的全过程。通过深入学习和使用Weka,你可以掌握各种机器学习算法,并在实际项目中应用这些知识,解决复杂的数据问题。
本资源包提供了关于如何在Weka中实现时间序列预测的详细资料,帮助用户深入理解并应用这一功能。 【知识点详述】: 1. **Weka简介**: Weka是由新西兰怀卡托大学开发的开源数据挖掘软件,它提供了多种预处理、...
**Weka介绍** Weka(Waikato Environment for ...总结来说,Weka是一个强大而全面的数据挖掘平台,尤其适合初学者入门。通过学习和实践,你可以掌握一系列数据挖掘技术,并在实际项目中应用这些知识解决复杂问题。
总结,通过对WEKA源代码的分析,我们可以深入理解这个强大的数据挖掘工具的内部机制,提高我们的编程和机器学习能力。无论是学习算法实现、数据预处理,还是构建自定义模型,WEKA都是一个宝贵的资源库。
数据挖掘是一种从海量数据中...总结来说,Weka 3.9是一个强大且全面的数据挖掘工具,它的源代码为学习和研究数据挖掘提供了宝贵的资源。无论你是初学者还是经验丰富的专业人士,都可以从中受益,提升你的数据科学技能。
Weka几乎包含了所有常见机器学习算法的Java实现,Weka中支持的数据格式主要是arff,虽然weka官网上提供了一些arff文件,但有时仅有这些还不能满足需求,为此,本人搜集各方资料,再加上自己的手工转换,整理出了一个...
总结,Weka是一个强大的机器学习和数据挖掘工具,其源码提供了宝贵的教育资源。通过深入研究Weka源码,不仅可以学习到各种机器学习算法的实现,还能提升Java编程和数据处理能力,为后续的AI项目开发打下坚实基础。
总结起来,Weka 3.60 Without Java VM是一个全面的数据挖掘工具,无需Java环境即可运行,包含了丰富的数据预处理、分类、聚类、关联规则学习和特征选择功能,为用户提供了高效、便捷的数据分析手段。无论是初学者...
Weka是一款强大的、开源的机器学习和数据挖掘工具,广泛应用于教育和研究领域。本实验报告将深入探讨如何使用Weka进行数据分类分析,以揭示数据背后的模式和规律。 一、Weka简介 Weka,全称Waikato Environment ...
Weka是一款开源的数据挖掘与机器学习软件包,广泛应用于学术研究、教育以及工业领域。它提供了丰富的数据预处理、分类、回归、聚类、关联规则挖掘等功能。本文将详细介绍Weka中的一个重要组件——Knowledge Flow及其...
### 机器学习Weka的入门教程 #### 一、Weka概述 Weka是一个非常优秀的机器学习工具,其全称为“怀卡托智能分析环境”(Waikato Environment for Knowledge Analysis),由新西兰怀卡托大学开发。Weka的源代码是...