`
yangfuchao418
  • 浏览: 165904 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Apache Mahout中的机器学习算法集【转】

阅读更多

Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。

在Mahout实现的机器学习算法见下表:

算法类

算法名

中文名

分类算法

Logistic Regression

逻辑回归

Bayesian

贝叶斯

SVM

支持向量机

Perceptron

感知器算法

Neural Network

神经网络

Random Forests

随机森林

Restricted Boltzmann Machines

有限波尔兹曼机

聚类算法

Canopy Clustering

Canopy聚类

K-means Clustering

K均值算法

Fuzzy K-means

模糊K均值

Expectation Maximization

EM聚类(期望最大化聚类)

Mean Shift Clustering

均值漂移聚类

Hierarchical Clustering

层次聚类

Dirichlet Process Clustering

狄里克雷过程聚类

Latent Dirichlet Allocation

LDA聚类

Spectral Clustering

谱聚类

关联规则挖掘

Parallel FP Growth Algorithm

并行FP Growth算法

回归

Locally Weighted Linear Regression

局部加权线性回归

降维/维约简

Singular Value Decomposition

奇异值分解

Principal Components Analysis

主成分分析

Independent Component Analysis

独立成分分析

Gaussian Discriminative Analysis

高斯判别分析

进化算法

并行化了Watchmaker框架

推荐/协同过滤

Non-distributed recommenders

Taste(UserCF, ItemCF, SlopeOne)

Distributed Recommenders

ItemCF

向量相似度计算

RowSimilarityJob

计算列间相似度

VectorDistanceJob

计算向量间距离

非Map-Reduce算法

Hidden Markov Models

隐马尔科夫模型

集合方法扩展

Collections

扩展了java的Collections类

Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。

分享到:
评论

相关推荐

    测试mahout推荐算法的数据集

    【推荐算法】是一种重要的机器学习技术,主要用于个性化推荐,如电影、音乐、商品等。在IT行业中,推荐系统已经成为提高用户体验、提升销售额的关键工具。Apache Mahout是一个基于Hadoop的数据挖掘库,它提供了多种...

    如何成功运行Apache Mahout的Taste Webapp-Mahout推荐教程-Maven3.0.5-JDK1.6-Mahout0.5

    Apache Mahout是一个开源项目,隶属于Apache软件基金会(ASF),专门提供可扩展的机器学习算法实现。其目的是为了帮助开发人员更容易地创建智能应用程序。Mahout包含了多种机器学习的经典算法,如聚类、分类、协同...

    apache-mahout-distribution-0.11.0-src.zip

    总结来说,"apache-mahout-distribution-0.11.0-src.zip"是一个宝贵的资源,它不仅包含了一个强大机器学习库的源代码,还为开发者提供了一个深入了解和定制机器学习算法的机会。无论你是想研究算法细节,还是希望在...

    Apache Mahout Cookbook

    在机器学习领域,朴素贝叶斯分类器是一种广泛使用的算法,尤其适用于文本分类等任务。本书详细阐述了如何使用Mahout的文本分类器来演示朴素贝叶斯的基本用例,并提供了代码示例。进一步,作者探讨了如何从代码层面...

    大数据系列9:Mahout – 机器学习

    Apache Mahout是一个基于Hadoop的数据挖掘库,专注于提供机器学习算法,是大数据处理中实现预测分析和模式识别的重要工具。本篇文章将深入探讨Mahout在大数据环境下的应用及其核心功能。 Mahout这个名字来源于“象...

    apache-mahout-distribution-0.12.2.tar.gz

    此外,Mahout还支持一系列的机器学习算法,包括分类、聚类和回归等。分类算法如随机森林、朴素贝叶斯,用于将数据分为预定义的类别;聚类算法如K均值、层次聚类,用于发现数据中的自然群体结构;回归算法如线性回归...

    Learning Apache Mahout

    Apache Mahout是一个开源的机器学习库,主要用于在大数据环境中实现可扩展的机器学习算法。它提供了一套易用的API,以及一系列实现包括分类、聚类和推荐在内的常用机器学习算法的工具。Mahout的目的是为了简化大规模...

    基于mahout的协同过滤算法实现

    Apache Mahout是一个用于构建大规模机器学习算法的库,它构建于Hadoop之上,能够处理海量数据。Mahout提供了多种机器学习算法,包括聚类、分类和推荐等,其中协同过滤算法是推荐系统中的重要组成部分。 三、Mahout...

    基于Mahout实现协同过滤推荐算法的电影推荐系统.zip

    Apache Mahout是基于Hadoop的数据挖掘库,提供了多种机器学习算法,包括分类、聚类和推荐。在本项目中,Mahout被用作实现协同过滤推荐算法的工具,它支持大规模数据集的处理,并可以与其他大数据处理框架如Hadoop和...

    Apache_Mahout_Cookbook(高清版)

    Apache Mahout是一个高度可扩展的机器学习库,主要用于构建智能推荐系统、聚类分析以及其他数据挖掘任务。该库利用了Apache Hadoop的强大分布式计算能力,使得处理大规模数据集变得高效可行。 #### 二、安装与配置 ...

    mahout-core-0.9.jar+mahout-core-0.8.jar+mahout-core-0.1.jar

    Apache Mahout是一个基于Apache Hadoop的数据挖掘库,专注于大规模机器学习算法的实现。这个压缩包包含的是Mahout项目不同版本的核心库,分别是mahout-core-0.9.jar、mahout-core-0.8.jar和mahout-core-0.1.jar。...

    mahout-0.3.zip

    这个项目的核心目标是提供一系列可扩展的机器学习算法,以简化开发人员构建智能应用的过程。在“mahout-0.3.zip”这个压缩包中,包含了Mahout 0.3版本的所有组件和资源,让我们一起深入探索这个强大的工具库。 机器...

    java机器学习的常用算法方法汇总

    本文将详细介绍在Java环境中常用的几种机器学习算法,并探讨它们的应用与实现。 1. C4.5算法:C4.5是ID3算法的升级版,由Ross Quinlan开发。它是一种决策树学习算法,通过信息增益率来选择最优特征进行划分。C4.5...

    Mahout推荐算法usercf itemcf,slopeone三种算法实现

    Apache Mahout是一个基于Hadoop的数据挖掘库,提供了多种机器学习算法,其中包括推荐系统中的协同过滤(Collaborative Filtering)算法。本项目重点介绍了Mahout中的User-Based Collaborative Filtering(用户基协同...

    能找到的最全的 mahout in action中文版

    综上所述,Apache Mahout是实现机器学习算法的利器,尤其在推荐系统、聚类和分类方面有着广泛的应用。对于不同背景的读者,无论你是寻求理论知识还是实践经验,Mahout都能提供有价值的指导。通过了解和掌握Mahout,...

Global site tag (gtag.js) - Google Analytics