刚开始接触Mahout,在网上也看了一些人家的文章,但是感觉都比较复杂。
下面我这种方式,在单机做一些简单的实验、作为初步对于mahout的了解估计是比较好的方法。
1. 到官网下载最新的版本:http://apache.fayea.com/apache-mirror/mahout/0.9/
2. 下载之后解压
3. Eclipse之中创建一个普通的java project 并将解压包之中的jar包导入到项目的classpath之中
在创建好项目之后,我们试一下第一个程序: (使用到的intro.csv被压缩在intro.zip之中了)
import java.io.File; import java.io.IOException; import java.util.List; import org.apache.mahout.cf.taste.common.TasteException; import org.apache.mahout.cf.taste.impl.model.file.FileDataModel; import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood; import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender; import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity; import org.apache.mahout.cf.taste.model.DataModel; import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood; import org.apache.mahout.cf.taste.recommender.RecommendedItem; import org.apache.mahout.cf.taste.recommender.Recommender; import org.apache.mahout.cf.taste.similarity.UserSimilarity; public class Test { public static void main(String[] args) throws IOException, TasteException { DataModel model = new FileDataModel(new File("E:\\DataSet\\intro.csv")); UserSimilarity sim = new PearsonCorrelationSimilarity(model); UserNeighborhood nbh = new NearestNUserNeighborhood(2, sim, model); // 生成推荐引擎 Recommender rec = new GenericUserBasedRecommender(model, nbh, sim); // 为用户1推荐物品1 List<RecommendedItem> recItemList = rec.recommend(1, 1); for(RecommendedItem item : recItemList) { System.out.println(item); } } } // RecommendedItem[item:104, value:4.257081]
结果即为推荐104这个东西
Done!
相关推荐
**标题解析:** "Mahout 单机demo" 指的是使用Apache Mahout这个开源机器学习库在单机环境下进行的一个演示项目。Mahout主要用于大规模数据集的推荐系统、分类和聚类算法。 **描述解析:** "mahout 推荐算法,csv...
### Mahout 安装与配置详解 #### 一、Mahout 概述 Mahout 是一个高度可扩展的机器学习库,特别适用于大数据环境。它提供了多种数据挖掘算法的实现,如分类、聚类、推荐系统等,并且这些算法可以在 Hadoop 分布式...
- Mahout的安装指南:详细介绍了如何在不同的操作系统上安装Mahout,以及如何配置相关环境,确保Mahout可以顺利运行。 - 数据预处理:在进行机器学习之前,数据预处理是一个重要的步骤,Mahout提供了相应的工具来...
1. **配置环境**:确保已经安装了Java和Hadoop,并且设置了相应的环境变量。 2. **下载Mahout**:解压提供的`mahout-distribution-0.5`压缩包到本地目录。 3. **创建输入数据**:准备要进行聚类的数据,通常是以CSV...
这个压缩包包含的是Mahout项目不同版本的核心库,分别是mahout-core-0.9.jar、mahout-core-0.8.jar和mahout-core-0.1.jar。这些版本的差异在于功能的完善、性能的优化以及对新特性的支持。 1. **Mahout核心功能**:...
### Hadoop入门进阶课程之Mahout介绍、安装与应用案例 #### Mahout概述 Mahout作为Apache Software Foundation(ASF)旗下的一个开源项目,致力于提供一系列可扩展的机器学习算法实现,以帮助开发者更轻松地构建...
为了在 Eclipse 中使用 Mahout,你需要安装 Hadoop 和 Mahout 相关的插件,或者手动配置项目以包含 "Mahout 最新基础依赖包" 中的 JAR 文件。这样可以避免因缺少依赖而导致的编译错误或运行时问题。 **使用步骤** ...
对于开发者来说,生成Eclipse工程有助于代码的编辑与管理,因此建议在Mahout目录下执行Maven命令将项目转换为Eclipse工程。之后,可以在Eclipse中导入这些工程,并进行后续的开发和调试。 5. 添加Mahout示例依赖 在...
《Apache Maven与Mahout实战:基于maven_mahout_template-mahout-0.8的探索》 Apache Maven是一款强大的项目管理和依赖管理工具,广泛应用于Java开发领域。它通过一个项目对象模型(Project Object Model,POM)来...
4. **安装与配置**:详述如何在本地或分布式环境中设置Mahout,包括依赖库的安装、Hadoop集群的配置以及与其他大数据工具(如Hive和Pig)的集成。 5. **数据预处理**:在应用机器学习算法之前,数据清洗和转换是...
配置完成后,验证Hadoop安装是否成功是推荐的下一步。 接下来,用户需要下载Mahout及其相关组件,这通常可以在Maven仓库中找到。当一切准备就绪后,可以开始创建推荐系统或执行聚类操作。Mahout推荐引擎允许用户...
**Apache Mahout 源码解析** Apache Mahout 是一个基于Java的开源机器学习库,旨在简化大规模数据集上的机器学习算法实现。它为开发者提供了一系列预构建的、可扩展的机器学习算法,包括分类、聚类、推荐系统以及...
对于初学者而言,如何在缺乏足够资料的情况下快速学习Mahout,也是一大挑战。 樊哲的经历还提到了编程训练的重要性。即便是在理论知识如数据结构、高等数学、算法编程等方面已经学习得很充分,但实际的编程训练仍然...
接着,将深入讲解Mahout的架构、工作原理以及安装配置方法,使读者能够搭建起自己的Mahout开发环境。 在机器学习部分,书中涵盖了多种Mahout支持的算法,如协同过滤、聚类、分类和回归等。协同过滤是推荐系统的核心...
《深入理解Mahout:朴素贝叶斯分类与中文分词技术解析》 Apache Mahout是一款基于Java开发的机器学习库,旨在提供可扩展的、高效的算法,用于数据挖掘和模式识别。在大数据时代,Mahout已经成为数据科学家和工程师...