`
奔跑的羚羊
  • 浏览: 579350 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【译】mahout in action 6 分布式计算推荐器(Distributing Recommendation Computations)

阅读更多
本章包括:
。从维基百科统计分析大量的数据
。编写在hadoop上使用的推荐器和分布式算法
。伪分布式存在非分布式的推荐器

我们越来越关注日益增长的数据,自从开始这本书:从10个选择,到100,000到1千万,和现在1.7千万。这里仍旧只有半成品在推荐领域。本章,我们将再次处理大量的数据,超过1.3亿的“偏好”在提交维基百科的文章到文章的连接选择。在这个数据集合,用户和项目都是条件约束,他们展示怎么推荐可以有效的实施针对较少的常见内容。

针对展示1.3亿“偏好”仍然是易于控制的大小,它是一个这样的刻度:换句话说我们过去看到的,对单机处理很麻烦的推荐器。我们将部署新的推荐算法,使用分布式计算着手处理基于MapReduce和hadoop
分享到:
评论

相关推荐

    Mahout In Action英文完整版

    - **第6章:Distributing recommendation computations** - 随着数据量的增长,单机已经无法满足推荐系统的计算需求。本章将详细介绍如何利用Mahout在分布式环境下执行推荐计算任务。包括MapReduce编程模型的应用、...

    Mahout in Action 最新版+完整版

    Distributing recommendation computations**:针对大规模数据集,介绍如何利用Hadoop等分布式计算框架加速推荐计算过程。 **PART 2 CLUSTERING** - **7. Introduction to clustering**:本章首先解释聚类的基本...

    Mahout_in_Action

    - **第6章:分发推荐计算**(Distributing recommendation computations):探讨了如何利用Hadoop等工具实现推荐系统的分布式计算,以应对大规模数据处理需求。 ##### 第二部分:聚类分析 - **第7章:聚类简介**...

    Mahout in Action(2012)

    - **第6章:分发推荐计算 (Distributing recommendation computations)** - 大规模推荐系统的实现策略。 - 分布式计算框架如Hadoop的集成。 ##### 第二部分:聚类算法 (Clustering) - **第7章:聚类简介 ...

    mahout in action 英文完整版(2012)

    - **Distributing recommendation computations**:随着数据量的增长,单机计算已无法满足需求,本章会探讨如何利用Mahout进行分布式计算以提高推荐系统的处理能力。 - **Part 2: Clustering**: - **...

    Mahout in Action完整版本.pdf

    本书《Mahout in Action》的三个核心部分覆盖了推荐系统、聚类和分类三个机器学习的主要领域。 在推荐系统部分,我们首先介绍了推荐引擎的基本概念,然后详细讲解了数据的表达方法(3. Representing data),如何...

Global site tag (gtag.js) - Google Analytics