阅读更多
数据挖掘,又称为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,是一个挖掘和分析大量数据并从中提取信息的过程。其中一些应用包括市场细分 - 如识别客户​​从特定品牌购买特定产品的特征,欺诈检测 - 识别可能导致在线欺诈的交易模式等。在本文中,我们整理了进行数据挖掘的 8 个最佳开源工具。

1、Weka

WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

2、Rapid Miner
RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。

3、Orange

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。

4、Knime
KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。

5、jHepWork

jHepWork是一套功能完整的面向对象科学数据分析框架。 Jython宏是用来展示一维和二维直方图的数据。该程序包括许多工具,可以用来和二维三维的科学图形进行互动。

6、Apache Mahout
Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

7、ELKI
ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。ELKI是类似于weka的数据挖掘平台,用java编写,有GUI图形界面。可以用来寻找离群点。

8、Rattle

Rattle(易于学习的 R 分析工具)提供数据的统计和可视化摘要,将数据转换成容易建模的形式,从数据中构建无监督和监督模型,以图形方式呈现模型的性能,并得出新的数据集。
  • 大小: 11.7 KB
  • 大小: 56.4 KB
  • 大小: 72.9 KB
  • 大小: 164.2 KB
来自: oschina
1
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 2020年了,还不懂数据挖掘?数据挖掘工具有哪些?

    数据挖掘工具 1 Weka 2 SPSS 3 Clementine 4 RapidMiner 5 其他数据挖掘软件 一. 数据挖掘定义 数据挖掘:严格的科学定义上,数据挖掘是从大量的、有噪声的、不完全的、模糊和随机的数据中,提取出...

  • Python数据挖掘指南

    本指南将提供一个示例填充的使用Python的数据挖掘简介,Python是最广泛使用的数据挖掘工具之一- 从清理和数据组织到应用机器学习算法。首先,让我们更好地理解数据挖掘及其完成方式。

  • [数据挖掘、数据分析] clickhouse在go语言里的实践

    下面我们从clickhouse的起源、OLAP/OLTP、go语言开发实践、clickhouse的表存储引擎分析这几个方面,讲解clickhouse为何适合做大数据分析、数据挖掘,什么情况下用什么样的表引擎,以及clickhouse的缺陷等。

  • 数据挖掘的开源工具和库:最佳实践和使用指南

    在过去的几年里,许多开源工具和库已经成为数据挖掘领域的主要力量。这些工具和库提供了各种数据挖掘算法和技术,使得数据科学家和分析师能够更轻松地处理和分析数据。 在本文中,我们将讨论一些最常用的开源数据...

  • 数据质量:数据质量建模之数据挖掘工具

    数据质量建模(Data Quality Modeling)作为数据挖掘的一个重要组成部分,主要负责对收集到的数据进行质量评估、检测及纠正,确保数据真实可靠、准确无误地反映事物的本质。数据质量建模工作涉及数据处理过程中的多...

  • 数据挖掘学习

    数据挖掘的定义:从大量的数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或者知识就是组成数据集的元素(例如excel表格里的一个单元格),数据格式:样本、数据点、元组等定义:代表数据...

  • 19款最好用的免费数据挖掘工具大汇总

    数据在当今世界意味着金钱。随着向基于app的世界的过渡,数据呈指数增长。然而,大多数数据是非结构化的,因此...免费的数据挖掘工具包括从完整的模型开发环境如Knime和Orange,到各种用Java、c++编写的库,最常见...

  • 12款最好用的数据挖掘工具

    免费的数据挖掘工具包括从完整的模型开发环境如Knime和Orange,到各种用Java、c++编写的库,最常见的是Python。数据挖掘中通常涉及到四种任务: 分类:将熟悉的结构概括为新数据的任务 聚类:在数据中以某种方式查

  • 数据挖掘学习必备的10个技能(干货)

    数据挖掘是从庞大的数据源中提取有效信息,并将该信息转换为潜在有用且最终... 数据挖掘也是数据科学领域中最重要的技术,在2016年至2018年Glassdoor的“美国50最佳工作”列表中,数据挖掘排名第一。 此外,与2016...

  • 数据挖掘实战(以kaggle为例)

    主要分为以下内容进行讲述 机器学习工业应用领域 机器学习常用算法 机器学习常用工具 解决问题流程 数据的处理比模型更为重要 老师的博客,内容很详细 数据预处理 有时候可以一个feature一个feature去做 特征...

  • 大数据分析数据挖掘工具有哪些

     在完成数据挖掘技术教程之后,我们将讨论最佳的数据挖掘工具。此外,我们将尝试介绍顶级和最佳的数据挖掘工具和技术。此外,我们将为每种工具提及该工具是否为开源。  因此,让我们启动数据挖掘工具。   ...

  • [Python从零到壹] 十五.文本挖掘之数据预处理、Jieba工具和文本聚类万字详解

    本文将详细讲解数据预处理、Jieba分词和文本聚类知识,这篇文章可以说是文本挖掘和自然语言处理的入门文章。两万字基础文章,希望对您有所帮助。欢迎大家来到“Python从零到壹”,在这里我将分享约200篇Python系列...

  • 数据挖掘复习资料2021.12.15

    数据处理基础、分类与回归、聚类、关联性分析

  • AI的10个开源工具/框架

    AI已经是大趋势,不搞点人工智能就太落伍了,学习永无止境! 目录 TensorFlow 有用的链接 Apache SystemML ...数据集和数学模型 有用的链接 Torch 有用的链接 Neuroph 有用的链接 Dee...

  • 大规模 Web 数据采集的终极开源方案 - PulsarRPA

    PulsarRPA 是大规模采集 Web 数据的终极开源方案,可满足几乎所有规模和性质的网络数据采集需要。 大规模提取 Web 数据非常困难。网站经常变化并且变得越来越复杂,这意味着收集的网络数据通常不准确或不完整,...

  • 数据挖掘的开源工具与库

    开源工具和库为数据挖掘提供了强大的支持,让数据科学家和工程师更容易地实现数据挖掘任务。在本文中,我们将介绍一些最受欢迎的开源数据挖掘工具和库,以及它们的核心概念、算法原理和使用方法。 2.核心概念与联系...

  • 数据挖掘与数据分析

    1、在应用工具上,数据挖掘一般要通过自己的编程来实现需要掌握编程语言;而数据分析更多的是借助现有的分析工具进行。 2、在行业知识方面,数据分析要求对所从事的行业有比较深的了解和理解,并且能够将数据与自身...

  • 未来的数据是无价的,推荐十大数据挖掘工具

    数据肯定是无价的。但分析数据并非易事,因为结果越准确,成本就越高。鉴于数据急剧增长,需要一个过程来提供有意义的信息,最终变成实用...本文介绍了广泛用于大数据行业的10种综合数据挖掘工具。 01、Rapid Miner...

  • 毕设和企业适用springboot企业健康管理平台类及活动管理平台源码+论文+视频.zip

    毕设和企业适用springboot企业健康管理平台类及活动管理平台源码+论文+视频.zip

Global site tag (gtag.js) - Google Analytics