介绍
本页主要描述,怎么在hadoop集群上运行Mahout Taste的推荐器
步骤
在那单个机器上测试
进入事例目录,执行:
mvn -q exec:java -Dexec.mainClass="org.apache.mahout.cf.taste.hadoop.pseudo.RecommenderJob" -Dexec.args="<OPTIONS>"
在集群上运行
1.进入$MAHOUT_HOME/,编辑jar包(mvn install),将在$MAHOUT_HOME/core/target/生成,并且名称包含版本号。例如当使用Mahout 0.3 release,将生成mahout-core-0.3.jar
2.(可选)启动hadoop:
$HADOOP_HOME/bin/start-all.sh
3.上传数据
$HADOOP_HOME/bin/hadoop fs -put <PATH TO DATA> testdata
4.运行任务:
$HADOOP_HOME/bin/hadoop jar $MAHOUT_HOME/core/target/mahout-core-<MAHOUT VERSION>.job org.apache.mahout.cf.taste.hadoop.<JOB> <OPTIONS>
5.从HDFS得到输出数据,并且查看。使用
bin/hadoop fs -lsr output
查看所有的output文件
命令行选项
在命令行使用"--help" 得到完整的命令行选项摘要信息。或者在javadoc中"Job"类下查看
补充:
运行的完整例子
hadoop jar mahout-core-0.4-job.jar org.apache.mahout.cf.taste.hadoop.pseudo.RecommenderJob -i mahout-testing.txt -o out --recommenderClassName org.apache.mahout.cf.taste.impl.recommender.slopeone.SlopeOneRecommender
原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/TasteCommandLine
分享到:
相关推荐
在这个“mahout的基于用户的推荐Demo”中,我们将深入探讨如何利用Mahout构建一个简单的用户基于的推荐系统。 ### 1. Mahout简介 Mahout源于Hadoop生态系统,它提供了可扩展的机器学习算法,支持大规模数据集的...
- **推荐系统(Recommender Systems)**: Mahout支持基于用户和物品的协同过滤,以及矩阵分解技术,如SVD(奇异值分解),用于个性化推荐。 - **关联规则学习(Association Rule Learning)**: 通过发现项集之间的...
在Mahout Taste Webapp的recommender.properties文件中,需要指定推荐算法的类,例如GroupLensRecommender。这是配置推荐系统行为的重要步骤。 7. 准备数据文件 Mahout Taste Webapp需要数据集来演示推荐系统的工作...
Apache Mahout是一个用于构建大规模机器学习算法的库,它构建于Hadoop之上,能够处理海量数据。Mahout提供了多种机器学习算法,包括聚类、分类和推荐等,其中协同过滤算法是推荐系统中的重要组成部分。 三、Mahout...
Taste 提供了一个高效的推荐引擎,支持基于 Java 的开发,具备良好的可扩展性,并且能够利用 Hadoop 的分布式架构,以 MapReduce 方式提升推荐算法的处理能力。Taste 包含了多种推荐算法的实现,如基于用户的、基于...
1. **推荐系统**:Mahout提供了一系列推荐算法,如基于用户的协同过滤(User-Based Collaborative Filtering)、基于物品的协同过滤(Item-Based Collaborative Filtering)等。这些算法能够根据用户的历史行为数据预测...
Mahout基于Java开发,与Hadoop紧密结合,能够处理大规模数据集,支持分布式计算环境下的高效算法执行。 #### 二、Mahout简介 Mahout是Apache软件基金会旗下的一个开源项目,专注于提供可扩展的机器学习算法。它...
Mahout提供了丰富的推荐算法实现,包括单机内存算法和基于Hadoop的分布式算法。 - **单机内存算法实现**:适合处理中小规模数据(如1GB至10GB),算法配置灵活,易于实现。但受限于单机资源,难以应对大规模数据...
Mahout 支持非并行和基于 Hadoop 的并行推荐算法,其中非并行推荐算法包括: - **TasteUserCF**:基于用户的协同过滤。 - **ItemCF**:基于项目的协同过滤。 - **SlopeOne**:一种简单的预测算法。 而基于 Hadoop ...
- **分布式计算**:考虑到大规模数据集的处理需求,Mahout支持Hadoop等分布式计算框架,使得算法能够在大规模集群上并行执行。 - **性能调优**:为了提升算法的执行效率和准确性,开发者需要对算法参数进行细致调整...
总之,Mahout-recommender提供了一套强大的工具,用于构建和优化推荐系统。通过Python接口,我们可以方便地将这些算法集成到现有的数据分析流程中,实现更高效、更个性化的推荐服务。在实际项目中,需要结合业务需求...
《easy-recommender:基于Mahout与Lucene的个性化推荐框架详解》 在现代的互联网应用中,个性化推荐系统已经成为提升用户体验、增加用户黏性的关键工具。`easy-recommender`是一个专门针对这一需求设计的Java框架,...
- **推荐系统**:Mahout提供了一系列推荐算法,包括基于用户的协同过滤、基于物品的协同过滤等。 - **聚类算法**:包括k-means、Canopy等,用于自动对数据进行分组。 - **分类**:提供多种机器学习算法用于预测类别...
Making recommendations**:重点介绍Mahout提供的各种推荐算法,如基于用户的协同过滤、基于物品的协同过滤、矩阵分解方法等,并通过实际例子演示如何使用这些算法。 - **5. Taking recommenders to production**:...
Taste 是 Mahout 中的一个推荐引擎,它基于 Java 编写,具有良好的可扩展性,并且支持 MapReduce 编程模式,可以在 Hadoop 分布式架构上运行,从而提高推荐算法的处理速度和效率。 Taste 包含了四个主要组件: 1. ...
- **Mahout Recommender**:介绍如何使用Mahout构建推荐系统。 #### 九、Flume示例 - **前提**:熟悉Flume的基本概念和架构。 - **概要**:Flume是一个用于收集、聚合和移动大量日志数据的服务。 - **提供的样例*...