在网上看到一篇文章介绍五个免费开源的数据挖掘软件,转过来。
Orange
Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。
RapidMiner
RapidMiner, 以前叫 YALE (Yet Another Learning Environment), 其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了真实世界数据挖掘。它提供的实验由大量的算子组成,而这些算子由详细的XML 文件记录,并被RapidMiner图形化的用户接口表现出来。RapidMiner为主要的机器学习过程提供了超过500算子,并且,其结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。
Weka
由Java开发的 Weka (Waikato Environment for Knowledge Analysis) 是一个知名机器学机软件,其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其技术基于假设数据是以一种单个文件或关联的,在那里,每个数据点都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。它主要的用户接品是Explorer,也同样支持相同功能的命令行,或是一种基于组件的知识流接口。
JHepWork
为科学家,工程师和学生所设计的 jHepWork 是一个免费的开源数据分析框架,其主要是用开源库来创建 一个数据分析环境,并提供了丰富的用户接口,以此来和那些收费的的软件竞争。它主要是为了科学计算用的二维和三维的制图,并包含了用Java实现的数学科学库,随机数,和其它的数据挖掘算法。 jHepWork 是基于一个高级的编程语言 Jython,当然,Java代码同样可以用来调用 jHepWork 的数学和图形库。
KNIME
KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性地运行一些或全部的分析步骤,并以后面研究结果,模型 以及 可交互的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比如:R语言,Weka, Chemistry Development Kit, 和 LibSVM.
源文:http://www.junauza.com/2010/11/free-data-mining-software.html(墙)
分享到:
相关推荐
面向开源生态的软件数据挖掘技术是一个对全球开源软件生态系统中大众化软件生产模式进行深入分析和研究的领域。当前,随着开源文化的发展,开源软件已经成为推动软件生产力增长的重要力量,并在软件开发和应用的各个...
WEKA,全称为怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一个广泛用于研究、教育和应用领域的开源数据挖掘软件。该工具由新西兰怀卡托大学计算机科学系开发,其源代码遵循GNU Public ...
开源数据挖掘软件 weka的源代码 java语言
weka一款开源的数据挖掘软件 weka一款开源的数据挖掘软件
weka一款开源的数据挖掘软件。 weka一款开源的数据挖掘软件。
### 开源数据挖掘软件 #### R语言与RapidMiner - **R语言**:作为一种统计计算和图形技术的语言,R语言因其强大的统计功能和广泛的社区支持而受到研究人员和数据分析师的青睐。它提供了大量的包来支持各种复杂的...
1. 数据挖掘领域的软件种类:文章提及了四种开源数据挖掘软件,它们分别是WEKA、RapidMiner、KNIME和Orange。 2. 数据挖掘软件的比较维度:文中从数据挖掘方法、可视化功能、使用难易程度三个维度对比了这些软件。 ...
神经网络法是模拟生物神经系统的结构和功能,是一种通过训练来学习的非线性预测模型,它将每一个连接看作一个处理单元,试图模拟人脑神经元的功能,可完成分类、聚类、特征挖掘等多种数据挖掘任务。神经网络的学习...
### 开源数据挖掘工具的历史背景 数据挖掘作为一个术语虽在1990年代中期才被正式提出,但其背后的统计学、机器学习、数据可视化及知识工程等领域的研究早已成熟。早期的数据挖掘软件包,尽管提供了基础的数据分析...
数据挖掘软件,开源的工具,整合了经典算法。
第3周 数据挖掘工具介绍及Modeler软件使用 要点 使用Modeler,实际数据操作,为后续课程准备) 第4周 挖掘-分类 要点(决策树 C5.0、逻辑回归,最常用的二种算法,原理及实际建模操作) 第5周 挖掘-聚类 要点...
总之,随着数据挖掘技术的不断发展,开源数据挖掘平台已经成为一个重要的研究和实践领域。通过对开源平台的性能分析,研究者和实践者可以更好地理解不同平台的适用场景,从而在数据挖掘实践中做出更加明智的选择。...
Orange 由斯洛文尼亚大学计算与信息学系的生物信息实验室 BioLab 进行开发,是一款免费开源的数据挖掘软件,可在官网下载,支持 Windows, Linux 和 MacOS。 Orange 由 C++ 和 Python 开发,包含了一系列的可视化...
数据挖掘技术通过从大量数据中发现信息和知识,能够有效地预测软件工程中的潜在问题,并提供决策支持,从而成为软件工程领域发展的一个必然趋势。 在软件工程领域,数据挖掘技术主要应用于以下几个方面: 1. 版本...
weka 一款开源数据挖掘软件。 weka 一款开源数据挖掘软件。
本文中,作者们探讨了基于存储库数据挖掘的开源软件成功度量方法,提出了一种新的度量模型,可以更全面地衡量开源软件项目成功。 首先,我们需要明确什么是开源软件。开源软件(OSS, Open Source Software)是指源...