`
thd52java
  • 浏览: 72559 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Mahout 算法

 
阅读更多

Mahour 包括协同过滤,基于UserItem的推荐;kmeansFuzzy-kmeans Mean shift Dirichlet process LDA聚类;奇异值分解;并行频繁项集挖掘;补充的贝叶斯分类、随机森林决策树分类。

一、分类算法

(一)Logistic 回归(SGD

(二)Bayesian 

(三)SVM

(四)Perceptron Winnow

(五)神经网络

(六)随机森林

(七)受限玻尔兹曼机

(八)Boosting

(九)HMM

(十)Online Passive Aggressive

二、聚类算法

(一)Canopy

(二)K-Means

(三)Fuzzy K-means

(四)EM

(五)Mean shift

(六)层次聚类

(七)Dirichlet process 

(八)LDA

(九)Spectral 

(十)MinHash

(十一)Top Down

三、推荐算法

           Mahout包括简单的非并行的推荐和基于Hadoop的并行推荐的实现。

(一)非并行推荐

(二)分布式的基于Item的协同过滤

(三)并行矩阵分解的协同过滤

四、关联规则挖掘算法

 

并行FP-Growth 

五、回归

Locally Weighted Linear Regression

六、降维

(一)SVD

(二)SSVD

(三)PCA

(四)ICA

(五)GDA

七、进化算法

八、向量相似性计算

(一)RowSimilarityJob 

用于计算Item之间的距离,是分布式的。

(二)VectorDistanceJob 

Map端连接,计算向量集中两两向量之间的距离。

<!--EndFragment-->
分享到:
评论

相关推荐

    Mahout算法调用展示平台2.1-part2

    第二部分 功能主要包括四个方面:集群配置、集群算法监控、Hadoop模块、Mahout模块。 详情参考《Mahout算法调用展示平台2.1》

    Mahout算法详解

    ### Mahout算法详解 #### Mahout推荐算法概览 Mahout是一个开源项目,专注于为开发者提供一系列用于构建高度可伸缩的大数据推荐引擎、聚类分析以及分类算法库。其核心算法包括协同过滤、聚类分析及分类算法,广泛...

    mahout聚类算法

    Mahout 聚类算法 Mahout 聚类算法是数据挖掘和机器学习领域中的一种重要算法,它可以将相似的数据点聚集在一起,以便更好地理解和分析数据。Mahout 聚类算法可以分为多种类型,如 Canopy、KMeans、Fuzzy-KMeans、...

    Mahout算法调用展示平台2.1-part3

    第三部分 功能主要包括四个方面:集群配置、集群算法监控、Hadoop模块、Mahout模块。 详情参考《Mahout算法调用展示平台2.1》

    Mahout算法调用展示平台2.1

    第一部分 功能主要包括四个方面:集群配置、集群算法监控、Hadoop模块、Mahout模块。 详情参考《Mahout算法调用展示平台2.1》

    mahout-learning:mahout算法学习代码

    在这个名为"mahout-learning"的项目中,我们可以找到针对Mahout算法的实践代码,这对于学习和理解Mahout的工作原理及其在实际中的应用非常有帮助。 首先,让我们深入了解一下Mahout的关键特性: 1. **分布式计算...

    mahout算法集

    mahout有哪些算法,这个图片上列举了mahout上的算法的名字

    svd mahout算法

    svd算法的工具类,直接调用出结果,调用及设置方式参考http://blog.csdn.net/fansy1990 &lt;mahout源码分析之DistributedLanczosSolver(七)&gt;

    基于Mahout协同过滤实现图书推荐系统-书籍推荐系统源码+项目说明.zip

    最新版本,在原先手动计算皮尔逊相似度和评分矩阵的基础上添加了Mahout实现的协同过滤推荐算法. 【备注】 主要针对计算机相关专业的正在做毕设的学生和需要项目实战的Java学习者。 也可作为课程设计、期末大作业。...

    测试mahout推荐算法的数据集

    Apache Mahout是一个基于Hadoop的数据挖掘库,它提供了多种推荐算法的实现,如协同过滤、基于内容的推荐以及混合推荐方法。 Mahout的协同过滤算法是其核心功能之一,它通过分析用户的历史行为来预测他们可能感兴趣...

    mahout0.9配置傻瓜说明

    - Mahout支持多种编程语言接口,包括Java、Scala等,可以根据实际项目需求选择合适的方式调用Mahout算法。 通过上述步骤,我们不仅可以顺利完成Mahout 0.9的安装配置,还能进行基本的功能测试,为后续更深入的学习...

    mahout贝叶斯算法拓展

    mahout中的贝叶斯算法的拓展开发包,提供了相关接口可以供用户调用,直接即可跑出结果,相关运行方式参考blog《mahout贝叶斯算法开发思路(拓展篇)》

    maven_mahout_template-mahout-0.8

    2. `src/main/java`:这里是Java源代码存放的地方,开发者可以在这里编写实现Mahout算法的代码。 3. `src/main/resources`:存放项目运行所需的非Java资源,如配置文件、模型数据等。 4. `src/test/java`和`src/...

    mahout 简介,中文

    Hadoop的MapReduce模型允许Mahout算法在多台服务器上并行执行,显著提高了数据处理的速度和效率。 ### 结论 Apache Mahout是一个开源项目,专注于为大规模数据集提供可扩展的机器学习库。它提供了丰富的机器学习...

    mahout Algorithms源码分析

    樊哲是Mahout的积极学习者和实践者,他在CSDN上分享了关于Mahout算法的解析与案例实战的博客,获得了“CSDN2013博客之星”的荣誉。樊哲的经验表明,虽然Hadoop平台上算法开发一般需要耗费很长时间,但Mahout已经实现...

    mahout-distribution-0.7-src.zip

    3. `examples`:提供了使用Mahout算法的示例代码,有助于开发者快速理解和使用Mahout。 4. `math`:封装了数学运算和统计方法,为算法提供基础支持。 5. `spark`:针对Apache Spark平台优化的算法实现,利用Spark的...

    mahout in action中的源码

    《Mahout in Action》是一本深入探讨Apache Mahout机器学习框架的专业书籍,其源码提供了丰富的实践示例和深入理解Mahout算法的机会。在GitHub上,你可以找到这些源码的完整版本,链接为。下面,我们将详细探讨...

    als算法并行思想使用类

    在描述中提到的博客“mahout算法源码分析之Collaborative Filtering with ALS-WR 并行思路”,可能详细剖析了Mahout库中Als算法的并行实现。Mahout是Apache的一个开源项目,提供了一系列机器学习算法,包括Als。ALS-...

    mahout-0.9 jar包

    7. **API和工具**:Mahout提供了丰富的Java API和命令行工具,使得开发者可以方便地集成和使用Mahout算法。 8. **社区支持**:作为Apache软件基金会的项目,Mahout拥有活跃的社区,用户可以在官方邮件列表、论坛和...

    mahout-distribution-0.9含jar包

    这使得在集群上运行Mahout算法成为可能。 7. **可扩展性和并行化**:Mahout的算法设计考虑了并行化,可以充分利用多核CPU和分布式计算资源,提高处理速度。 8. **预处理和特征提取**: Mahout还提供了一些工具,...

Global site tag (gtag.js) - Google Analytics