Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout还支持在Hadoop集群中运行,使这些算法可以更高效的运行在云计算环境中。
目前Mahout已经发布的最高版本是0.5。在这里https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout可以找到Mahout的下载路径,可以下载0.5版本的源码压缩包,也可以从svn中co主干代码。但是主干代码0.6-SNAPSHOT中没有找到taste-webapp相关代码。
后面的介绍都是以0.5版本的源代码包为基础做的介绍。
1.下载代码后,解压。然后命令行进入mahout-distribution-0.5目录执行
mvn -DskipTests install
将mahout相关模块进行编译,并安装到本地maven仓库中
如果出现内存溢出,可以先调大JVM的堆内存大小
export MAVEN_OPTS=-Xmx1024m
2.生成eclipse工程,本步骤可选,但是建议进行。因为在eclipse中修改java工程代码比较方便。还是在mahout-distribution-0.5目录执行以下命令
mvn eclipse:eclipse
3.如果执行了第2步,请继续执行此步骤。在eclipse中导入mahout-distribution-0.5下的所有工程,这个就不详细介绍了。
4.修改mahout-taste-webapp工程的pom.xml,添加对mahout-examples的依赖
<dependency>
<groupId>${project.groupId}</groupId>
<artifactId>mahout-examples</artifactId>
<version>0.5</version>
</dependency>
5.在mahout-taste-webapp工程的recommender.properties中添加
recommender.class=org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommender
6.从http://www.grouplens.org/node/73上下载数据文件,我下载的是1M Ratings Data Set (.tar.gz)经过测试验证通过,其他数据文件请自行验证。解压以后将ratings.dat复制到mahout-taste-webapp工程的/org/apache/mahout/cf/taste/example/grouplens/下,至于为什么是这个路径?请大家去看这个类GroupLensDataModel。
7.现在准备工作基本完成了,cd到taste-web我们来运行一把
mvn jetty:run-war
8.访问一下http://localhost:8080/RecommenderServlet?userID=1就能看到效果,这个servlet还支持其他参数请参看RecommenderServlet的javadoc说明
现在可以开始Mahout的机器学习之旅了。
分享到:
相关推荐
根据给定的文件信息,我们可以提炼出以下几个与Apache Mahout及其Taste Webapp相关的知识点: 1. Apache Mahout简介 Apache Mahout是一个开源项目,隶属于Apache软件基金会(ASF),专门提供可扩展的机器学习算法...
This book is a practical guide that explains the classification algorithms provided in Apache Mahout with the help of actual examples. Starting with the introduction of classification and model ...
Thank you for requesting the download for Apache Mahout Cookbook. Please click the following link to download the code:
Apache Mahout is a scalable machine learning library with algorithms for clustering, classification, and recommendations. It empowers users to analyze patterns in large, diverse, and complex datasets ...
Apache Mahout 简介
不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,...
《Apache Mahout Cookbook》是一本深入探讨Apache Mahout框架的指南,旨在帮助读者掌握并熟练应用Mahout的各种功能,从基础设置到高级分析技术。本书不仅涵盖了安装与配置Mahout所需的环境,还提供了丰富的示例代码...
### Apache Mahout Cookbook知识点概述 #### 一、Apache Mahout简介 Apache Mahout是一个高度可扩展的机器学习库,主要用于构建智能推荐系统、聚类分析以及其他数据挖掘任务。该库利用了Apache Hadoop的强大分布式...
Apache Mahout是一个开源项目,专注于开发可扩展的机器学习库,它主要由Java语言编写,并且依赖于Maven构建系统。在"apache-mahout-distribution-0.11.0-src.zip"这个压缩包中,您将找到Mahout 0.11.0版本的源代码,...
Apache Mahout是一个基于Hadoop的大规模数据集上实现的机器学习库,它的主要目标是提供简单易用的算法,用于构建智能应用。在标题中提到的"apache-mahout-distribution-0.12.2.tar.gz"是Mahout的一个发行版本,版本...
直接翻译自java版的协同过滤推荐引擎 apache mahout taste。支持在java最新版0.9中移除的Slope One、TreeClustering demo: string filePath = @"E:\WorkStudio\ntaste\ntaste.Test\datafile\item.csv"; var model = ...
具体步骤,参见博客:http://blog.csdn.net/fufengrui/article/details/17022535
总的来说,这个项目提供了一个实践性的例子,展示了如何将SpringBoot的便捷性和Apache Mahout的推荐算法能力结合,以解决实际的推荐问题。对于想要学习推荐系统、SpringBoot或者Apache Mahout的开发者来说,这是一个...
Apache Mahout is one of the first and most prominent Big Data machine learning platforms. It implements machine learning algorithms on top of distributed processing platforms such as Hadoop and Spark...
Apache Mahout是一个开源的机器学习库,主要用于在大数据环境中实现可扩展的机器学习算法。它提供了一套易用的API,以及一系列实现包括分类、聚类和推荐在内的常用机器学习算法的工具。Mahout的目的是为了简化大规模...