`
小网客
  • 浏览: 1241190 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Mahout之算法实现一览表

 
阅读更多

Collaborative Filtering

  • User-Based Collaborative Filtering - single machine
  • Item-Based Collaborative Filtering - single machine / MapReduce
  • Matrix Factorization with Alternating Least Squares - single machine / MapReduce
  • Matrix Factorization with Alternating Least Squares on Implicit Feedback- single machine / MapReduce
  • Weighted Matrix Factorization, SVD++, Parallel SGD - single machine

 

Classification

  • Logistic Regression - trained via SGD - single machine
  • Naive Bayes/ Complementary Naive Bayes - MapReduce
  • Random Forest - MapReduce
  • Hidden Markov Models - single machine
  • Multilayer Perceptron - single machine

 

Clustering

  • Canopy Clustering - single machine / MapReduce (deprecated, will be removed once Streaming k-Means is stable enough)
  • k-Means Clustering - single machine / MapReduce
  • Fuzzy k-Means - single machine / MapReduce
  • Streaming k-Means - single machine / MapReduce
  • Spectral Clustering - MapReduce

 

Dimensionality Reduction

  • Singular Value Decomposition - single machine
  • Lanczos Algorithm - single machine / MapReduce
  • Stochastic SVD - single machine / MapReduce / Spark
  • Principal Component Analysis (via Stochastic SVD)- single machine / MapReduce

 

Topic Models

  • Latent Dirichlet Allocation - single machine / MapReduce

 

Miscellaneous

  • Frequent Pattern Mining - MapReduce
  • RowSimilarityJob - compute pairwise similarities between the rows of a matrix - MapReduce
  • ConcatMatrices - combine 2 matrices or vectors into a single matrix - MapReduce
  • Collocations - find co-locations of tokens in text - MapReduce

 

PS:版本为:Mahout 0.9 

0
0
分享到:
评论
2 楼 小网客 2014-08-01  
dacoolbaby 写道
Mahout已经宣布不再更新了。。转投Spark的怀抱了。。

恩 不过目前感觉够用了
1 楼 dacoolbaby 2014-07-31  
Mahout已经宣布不再更新了。。转投Spark的怀抱了。。

相关推荐

    mahout聚类算法

    Mahout 聚类算法 Mahout 聚类算法是数据挖掘和机器学习领域中的一种重要算法,它可以将相似的数据点聚集在一起,以便更好地理解和分析数据。Mahout 聚类算法可以分为多种类型,如 Canopy、KMeans、Fuzzy-KMeans、...

    测试mahout推荐算法的数据集

    Mahout的协同过滤算法是其核心功能之一,它通过分析用户的历史行为来预测他们可能感兴趣的新内容。这种算法分为两种类型:用户-用户协同过滤和物品-物品协同过滤。用户-用户协同过滤基于“有相似历史行为的用户可能...

    mahout贝叶斯算法拓展

    mahout中的贝叶斯算法的拓展开发包,提供了相关接口可以供用户调用,直接即可跑出结果,相关运行方式参考blog《mahout贝叶斯算法开发思路(拓展篇)》

    Mahout推荐算法usercf itemcf,slopeone三种算法实现

    本项目重点介绍了Mahout中的User-Based Collaborative Filtering(用户基协同过滤,UserCF)、Item-Based Collaborative Filtering(物品基协同过滤,ItemCF)以及Slope One算法的实现。 1. **User-Based ...

    Mahout推荐算法实战

    3. **协同过滤**:详细解释协同过滤算法的原理和实现,包括用户-用户协同过滤和物品-物品协同过滤,并通过实例展示如何在Mahout中执行这些算法。 4. **基于内容的推荐**:介绍如何建立物品的内容模型,以及如何使用...

    Mahout推荐算法API详解

    简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的...

    基于Mahout实现协同过滤推荐算法的电影推荐系统.zip

    本项目"基于Mahout实现协同过滤推荐算法的电影推荐系统"旨在利用Apache Mahout这一开源机器学习库,构建一个能够为用户推荐个性化电影的系统。以下将详细介绍该系统的相关知识点: 1. **协同过滤推荐算法**: 协同...

    mahout bayesian 算法数据流

    mahout中bayesian算法的数据流,可以根据excel中的公式来推断出该算法的数据流

    mahout算法集

    mahout有哪些算法,这个图片上列举了mahout上的算法的名字

    Mahout算法详解

    Mahout提供了丰富的推荐算法实现,包括单机内存算法和基于Hadoop的分布式算法。 - **单机内存算法实现**:适合处理中小规模数据(如1GB至10GB),算法配置灵活,易于实现。但受限于单机资源,难以应对大规模数据...

    基于mahout的协同过滤算法实现

    《基于Mahout的协同过滤算法实现详解》 在大数据领域,推荐系统已成为不可或缺的一部分,它能够根据用户的历史行为和偏好,为用户提供个性化的产品或服务推荐。Mahout作为Apache的一个开源项目,提供了丰富的机器...

    基于Java+Mahout的协同过滤推荐算法图书推荐系统源码+项目说明.zip

    本项目是一个采用Java语言开发,结合Apache Mahout库实现的协同过滤推荐算法图书推荐系统。协同过滤是推荐系统中最常见的一种算法,它基于用户的行为历史和物品的属性,找出具有相似兴趣的用户或物品,为用户推荐...

    基于用户的协同过滤算法Mahout实现

    该资源是在Eclipse平台里,使用Mahout库的API,实现基于用户的协同过滤算法,从而进行商品推荐。 软件环境是:win7 64位 +Eclipse4.4 + jdk1.6, 用到了7个.jar包, 分别为:commons-logging-1.2.jar, commons-...

    Mahout推荐算法API.pdf

    在 Mahout 中,推荐算法是其核心功能之一,用于构建个性化的推荐系统。本篇文章将详细探讨 Mahout 的推荐算法 API,特别是 `Recommender` 接口及其相关的实现。 1. **Recommender 接口**: `Recommender` 是 ...

    Mahout推荐算法API参考.pdf

    在 Mahout 中,推荐算法API提供了一种方便的方式来实现和使用不同的推荐策略。在本篇文章中,我们将深入探讨 Mahout 推荐算法API的核心接口 `Recommender` 和其相关的实现类。 `Recommender` 接口是 Mahout 推荐...

    mahout关联推荐算法

    PFPGrowth(并行频繁集算法)是Mahout关联推荐算法的一种实现,它是FPGrowth算法的并行版本。FPGrowth算法是对传统Apriori算法的优化,Apriori算法在处理大数据集时效率较低,因为它需要多次扫描数据以找到频繁项集...

    mahout canopy算法仿造代码源码

    Apache Mahout 是一个开源机器学习库,它提供了一系列的算法,用于实现数据挖掘中的聚类、分类和推荐系统。Canopy 算法是 Mahout 中的一种快速聚类方法,适用于大数据集。Canopy 算法是为了解决层次聚类(如 K-Means...

    基于Hadoop-Mahout的分布式课程推荐算法.pdf

    接下来将深入探讨基于Hadoop-Mahout的分布式课程推荐算法的设计与实现。 首先,推荐系统是分布式系统中的一项重要应用。它能够向用户推荐符合他们兴趣或需求的产品或服务,包括书籍、电影、音乐和在线课程等。在...

Global site tag (gtag.js) - Google Analytics