阅读更多

17顶
0踩

行业应用

转载新闻 五个免费开源的数据挖掘软件

2010-12-13 16:02 by 正式编辑 chuiyan 评论(3) 有16152人浏览

Orange

 

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。

RapidMiner

 

RapidMiner, 以前叫 YALE (Yet Another Learning Environment), 其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了真实世界数据挖掘。它提供的实验由大量的算子组成,而这些算子由详细的XML 文件记录,并被RapidMiner图形化的用户接口表现出来。RapidMiner为主要的机器学习过程提供了超过500算子,并且,其结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。

 

Weka 

 

由Java开发的 Weka (Waikato Environment for Knowledge Analysis) 是一个知名机器学机软件,其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其技术基于假设数据是以一种单个文件或关联的,在那里,每个数据点都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。它主要的用户接品是Explorer,也同样支持相同功能的命令行,或是一种基于组件的知识流接口。

JHepWork 

 

为科学家,工程师和学生所设计的 jHepWork 是一个免费的开源数据分析框架,其主要是用开源库来创建一个数据分析环境,并提供了丰富的用户接口,以此来和那些收费的的软件竞争。它主要是为了科学计算用的二维和三维的制图,并包含了用Java实现的数学科学库,随机数,和其它的数据挖掘算法。 jHepWork 是基于一个高级的编程语言 Jython,当然,Java代码同样可以用来调用 jHepWork 的数学和图形库。

KNIME

 

KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性地运行一些或全部的分析步骤,并以后面研究结果,模型 以及 可交互的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比如:R 语言,Weka, Chemistry Development Kit, 和 LibSVM.

来自: 酷壳
17
0
评论 共 3 条 请登录后发表评论
3 楼 binyue1014 2013-07-25 10:10
海量数据挖掘,还得用国产的K-Miner(http://www.shentongdata.com/?bid=3&eid=354)。MPP+SMP并行计算架构,是目前唯一的所有算法都实现了并行化数据挖掘软件;27个数据挖掘算法+13个统计分析算法;大部分算法执行速度都远快于SPSS等的相应算法。 
2 楼 lavafree 2010-12-14 11:45
我勒个去啊,居然发收藏都不行
1 楼 chennianxiao 2010-12-14 10:56
还是没得sas强大

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 面向开源生态的软件数据挖掘技术研究综述.pdf

    面向开源生态的软件数据挖掘技术研究综述.pdf

  • 关于handled exception .exe:access violation的解决方法

     我遇到handled exception .exe:access violation的问题无法解决,请大家一起来看看怎么回事。  int X,Y,Z; float x,y,z,x1,y1,r,h; #include   void jingti(float c[][4],float (*p)[4])       //晶体的子程序,其中X,Y,Z为晶体三个方向的晶胞数{  int i,j; 

  • Exception异常处理和自定义异常

    在程序中会出现各种错误我们叫做异常. 下面介绍一下如何处理可能会出现的异常和自定义异常的使用.

  • 对Jena的简单理解和一个例子

    本文简单介绍Jena(Jena 2.4),使用Protégé 3.1(不是最新版本)创建一个简单的生物(Creature)本体,然后参照Jena文档中的一个例子对本体进行简单的处理,输出本体中的Class、Property等信息。本文内容安排如下:Ø         介绍JenaØ         运行JenaØ         Jena Ontology APIØ      

  • 经常使用runOnUiThread(),你真的理解它吗

    在Android开发的过程中,主线程主要来完成UI绘制和响应用户的操作,默认情况下,我们大部分的代码都是在主线程 中执行的,因此我们时刻要考虑主线程的情况。我们都知道要开启一个子线程来完成一个耗时操作,以避免阻塞主线程影响 用户体验,甚至ANR。但是子线程执行完要更新UI的时候,我们又必须回到主线程来更新,实现这一功能常用的方法是执行 Activity的runOnUiThread()方法:ru

  • 深入分析iOS问题-performSelector:onThread:withObject:waitUntilDone

    今天检查内存泄露的问题,发现误用系统API的问题。导致内存泄露。这个问题还是比较常见的,我觉得还是记下了,分享给大家

  • 开源数据挖掘 mysql_五个免费开源的数据挖掘软件

    刚接触数据挖掘,所以分享一下基本的东西---OrangeOrange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以...

  • 开源数据挖掘软件整理

    本文只对几种流行的开源数据挖掘平台进行了检视,...如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集

  • ADaMSoft:开源和数据挖掘软件-开源

    ADaMSoft是使用Java开发的免费开源数据挖掘软件。 它包含数据管理方法,并且可以创建随时可用的报告。 它可以从多个来源读取数据,并且可以以不同的格式写入结果。

  • 学习log1_Android线程池管理工具类

    import android.os.Handler; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; /* * 描述: 线程池管理类 */ public class ExecutorManager { private static volatile ExecutorManager mInstance = null; private Handler m...

  • Java学习之自定义异常和抛出异常

    知识点: 1.throws是在定义方法时候抛出异常,throw是在方法体内抛出异常 2.try{}catch(Exception e){}finally{}这是一个比较常见的组合使用try-catch-finally组合注意点: • 当不存在catch语句时,finally 语句必须存在并且紧跟在try语句后面。 • 在try语句和catch语句间不能存在任何语句,同样在catch语

  • 内存错误:Address .... is on thread 1's stack 与创建变量时出现段错误

    内存错误:Address …. is on thread 1’s stack 与创建变量时出现段错误标签: 内存错误 段错误by 小威威今天对代码进行内存检测的时候,发现出现了以下问题:Invalid write of size 8 at 0x400AB9: test_1() (main.cpp:6) by 0x401521: main (main.cpp:106)

  • python类别变量(class_label)转换为One_Hot的几种方式

        首先解析一下,one_hot (独热)编码,和dummy variable(哑变量)的区别:     在用keras时候,有一个模块写好one_hot转换 from keras.utils import to_categorical data = [1, 3, 2, 0, 3, 2, 2, 1, 0, 1] encoded=to_categorical(data) pri...

  • 5个好用的开源数据挖掘软件

    为科学家、工程师和学生所设计的 jHepWork 是一个免费的开源数据分析框架,其主要是用开源库来创建一个数据分析环境,并提供了丰富的用户接口,以此来和那些收费的的软件竞争。它主要是为了科学计算用的二维和三维的...

  • Orange_0.0.5数据挖掘软件下载

    Orange 由斯洛文尼亚大学计算与信息学系的生物信息实验室 BioLab 进行开发,是一款免费开源的数据挖掘软件,可在官网下载,支持 Windows, Linux 和 MacOS。 Orange 由 C++ 和 Python 开发,包含了一系列的可视化...

  • mysql数据挖掘工具_五个免费开源的数据挖掘工具推荐

    本文介绍了五个免费开源的数据挖掘工具。所谓数据挖掘工具包括两类,针对特定领域的数据挖掘工具以及通用的数据挖掘工具,本文介绍的五种工具均有所覆盖。OrangeOrange是一个基于组件的数据挖掘和机器学习软件套装,...

  • java 数据挖掘 开源_5个开源数据挖掘工具,收下这波干货

    今天给大家介绍5个开源数据挖掘工具,收下这波干货吧。1. OrangeOrange 是由C++ 和 Python开发的,基于组件的数据挖掘和机器学习软件套装,它的功能很丰富,而且强大。它包含了一系列组件,能进行数据预处理,并提供...

  • 基于存储库数据挖掘的开源软件成功度量方法.pdf

    基于存储库数据挖掘的开源软件成功度量方法.pdf

Global site tag (gtag.js) - Google Analytics