`

mahout 简介

 
阅读更多
    Apache Mahout起源于2008年,当时它是Apache Lucene的子项目。使用Hadoop库,可以将其功能有效地扩展到Apache Hadoop云平台中。2010年4月Apache mahout最终成了Apache的顶级项目。
    Apache Mahout的主要目标是建立可伸缩的机器学习算法。这种可伸缩性是针对大规模的数据集而言的。Apache Mahout的算法运行在Apache Hadoop平台下,它通过MapReduce模式实现。但是,Apache Mahout并不严格要求算法的实现要基于Hadoop平台,单个节点或非Hadoop平台也可以。
    Apache Mahout核心库的非分存式算法也具有良好的性能。
    Apache Mahout 项目包含聚类、分类、推荐引擎、频繁项集的挖掘。
    聚类:将诸如文本、文档 之类的数据分成局部相关的组;
    分类:利用已经存在的分类法文档训练分类器,对未分类的文档 进行分类;
    推荐引擎(协同过滤):获得用户的行为并从中发现用户可能喜欢的事物
    频繁项集的挖掘:利用一个项集(查询记录或购物目录)去识别经常一起出现的项目。
分享到:
评论

相关推荐

    Apache Mahout 简介

    Apache Mahout 简介

    mahout 简介,中文

    Mahout提供了这些相似度度量的实现,使得开发人员能够灵活选择最适合其应用场景的方法。 ### 集群 集群是无监督学习的一种形式,其目的是将一组对象分为几个类别或“集群”,使得同一集群内的对象彼此相似,而不同...

    如何成功运行Apache Mahout的Taste Webapp-Mahout推荐教程-Maven3.0.5-JDK1.6-Mahout0.5

    1. Apache Mahout简介 Apache Mahout是一个开源项目,隶属于Apache软件基金会(ASF),专门提供可扩展的机器学习算法实现。其目的是为了帮助开发人员更容易地创建智能应用程序。Mahout包含了多种机器学习的经典算法...

    mahout源码

    1. **Mahout简介** Apache Mahout的命名来源于古印度的一种数学算术工具,它体现了项目的目标——通过数学算法解决复杂问题。Mahout提供了丰富的机器学习算法,包括聚类、分类和协同过滤等,为大数据分析提供了强大...

    Mahout最新基础依赖包.rar

    **Apache Mahout简介** Apache Mahout 是一个开源项目,它为大数据分析提供了机器学习库。这个库主要关注三个核心领域:推荐系统、分类和聚类。Mahout 的目标是使开发人员能够轻松构建智能应用程序,利用分布式计算...

    mahout_in_action_中文版

    #### 一、Mahout简介 Mahout是Apache基金会下的一个开源机器学习项目。该项目主要关注于构建高效的机器学习算法库,尤其是面向大规模数据集的处理需求。Mahout的设计理念强调了算法的可扩展性和实用性,这使得它...

    Mahout In Action英文完整版

    #### 二、Mahout简介 **Apache Mahout**是一款开源的机器学习库,主要构建于Hadoop之上,支持分布式计算环境。它提供了多种算法实现,包括分类、聚类、推荐系统等,非常适合处理大规模数据集。Mahout的设计目标之一...

    apache-mahout-distribution-0.11.0-src.zip

    1. **Mahout简介**: Apache Mahout是基于Hadoop的数据挖掘库,提供了一套用于实现推荐系统、分类和聚类算法的工具。这个项目的目标是创建易于使用的、高效的机器学习算法,使大数据分析变得更加简单。 2. **源码...

    Mahout_in_Action

    #### 二、Mahout简介 Mahout是Apache软件基金会旗下的一个开源项目,专注于提供可扩展的机器学习算法。它主要涵盖了三个领域:协同过滤、聚类和分类。这些算法被广泛应用于推荐系统、用户行为分析以及大数据挖掘等...

    mahout的基于用户的推荐Demo

    Mahout简介 Mahout源于Hadoop生态系统,它提供了可扩展的机器学习算法,支持大规模数据集的处理。其主要功能包括协同过滤(Collaborative Filtering)、聚类(Clustering)和分类(Classification)。在这里,我们...

    Apache_Mahout_Cookbook(高清版)

    #### 一、Apache Mahout简介 Apache Mahout是一个高度可扩展的机器学习库,主要用于构建智能推荐系统、聚类分析以及其他数据挖掘任务。该库利用了Apache Hadoop的强大分布式计算能力,使得处理大规模数据集变得高效...

    data mining using mahout

    #### 一、Mahout简介 Mahout是Apache Lucene项目下的一个子项目,其目标是提供可扩展的机器学习算法实现。该项目始于2008年,并在2009年4月7日发布了0.1版本,包含了10种算法库。更多关于Mahout的信息可以参考官方...

    Mahout in Action(2012)

    #### 三、Mahout简介 Apache Mahout 是一个开源的Java库,旨在为开发者提供构建智能应用程序所需的机器学习算法。它提供了广泛的机器学习方法,包括分类、聚类、推荐系统等,特别适用于大规模数据集。Mahout的设计...

Global site tag (gtag.js) - Google Analytics