`
奔跑的羚羊
  • 浏览: 576932 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【译】mahout in action 6 分布式计算推荐器(Distributing Recommendation Computations)

阅读更多
本章包括:
。从维基百科统计分析大量的数据
。编写在hadoop上使用的推荐器和分布式算法
。伪分布式存在非分布式的推荐器

我们越来越关注日益增长的数据,自从开始这本书:从10个选择,到100,000到1千万,和现在1.7千万。这里仍旧只有半成品在推荐领域。本章,我们将再次处理大量的数据,超过1.3亿的“偏好”在提交维基百科的文章到文章的连接选择。在这个数据集合,用户和项目都是条件约束,他们展示怎么推荐可以有效的实施针对较少的常见内容。

针对展示1.3亿“偏好”仍然是易于控制的大小,它是一个这样的刻度:换句话说我们过去看到的,对单机处理很麻烦的推荐器。我们将部署新的推荐算法,使用分布式计算着手处理基于MapReduce和hadoop
分享到:
评论

相关推荐

    Mahout机器学习领域分布式计算框架

    ### Mahout机器学习领域分布式计算框架 #### 一、引言 随着大数据时代的到来,如何高效地处理和分析海量数据成为了一个重要的课题。Apache Mahout作为一款基于Hadoop的机器学习库,为解决这一问题提供了强大的工具...

    Mahout In Action英文完整版

    - **第6章:Distributing recommendation computations** - 随着数据量的增长,单机已经无法满足推荐系统的计算需求。本章将详细介绍如何利用Mahout在分布式环境下执行推荐计算任务。包括MapReduce编程模型的应用、...

    mahout in action中的源码

    《Mahout in Action》是一本深入探讨Apache Mahout机器学习框架的专业书籍,其源码提供了丰富的实践示例和深入理解Mahout算法的机会。在GitHub上,你可以找到这些源码的完整版本,链接为。下面,我们将详细探讨...

    Mahout in Action 最新版+完整版

    Distributing recommendation computations**:针对大规模数据集,介绍如何利用Hadoop等分布式计算框架加速推荐计算过程。 **PART 2 CLUSTERING** - **7. Introduction to clustering**:本章首先解释聚类的基本...

    Mahout_in_Action

    - **第6章:分发推荐计算**(Distributing recommendation computations):探讨了如何利用Hadoop等工具实现推荐系统的分布式计算,以应对大规模数据处理需求。 ##### 第二部分:聚类分析 - **第7章:聚类简介**...

    Mahout in Action(2012)

    - **第6章:分发推荐计算 (Distributing recommendation computations)** - 大规模推荐系统的实现策略。 - 分布式计算框架如Hadoop的集成。 ##### 第二部分:聚类算法 (Clustering) - **第7章:聚类简介 ...

    mahout in action 英文完整版(2012)

    - **Distributing recommendation computations**:随着数据量的增长,单机计算已无法满足需求,本章会探讨如何利用Mahout进行分布式计算以提高推荐系统的处理能力。 - **Part 2: Clustering**: - **...

    mahout in action中文版 最全的 docx

    在分布式计算推荐器这一章节,书中深入探讨了如何利用Hadoop和MapReduce进行分布式推荐算法的实现。随着数据量的急剧增加,单机处理变得困难,而Mahout通过分布式计算能够有效地处理海量数据。作者通过维基百科链接...

    Mahout in Action 2012

    书中分为三个部分,首先是关于推荐系统的介绍,包括推荐系统的原理、数据表示方法、如何生成推荐、如何将推荐系统部署到生产环境以及推荐系统的分布式计算。其次是关于聚类的介绍,内容涉及聚类的基础知识、数据表示...

    Mahout in Action完整版本.pdf

    本书《Mahout in Action》的三个核心部分覆盖了推荐系统、聚类和分类三个机器学习的主要领域。 在推荐系统部分,我们首先介绍了推荐引擎的基本概念,然后详细讲解了数据的表达方法(3. Representing data),如何...

    mahout_in_action_中文版

    针对维基百科的海量数据,Mahout可以部署新的推荐算法并利用分布式计算进行处理。具体而言,可以通过MapReduce模型来并行处理大规模的数据集,从而显著提高处理速度和效率。例如,在处理1.3亿条“偏好”记录时,...

    基于Mahout分布式协同过滤推荐算法分析与实现.pdf

    通过在分布式环境下运行,Mahout实现了协同过滤推荐算法的高效计算和良好的可扩展性。 分布式协同过滤推荐算法的关键在于,它能够处理大规模的用户和物品数据集。在分布式环境下,算法通过并行化处理和负载均衡,...

    Mahout in Action完整版本(英文)

    一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。  Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。

Global site tag (gtag.js) - Google Analytics