`

[Mahout] Windows下Mahout单机安装

 
阅读更多

刚开始接触Mahout,在网上也看了一些人家的文章,但是感觉都比较复杂。

下面我这种方式,在单机做一些简单的实验、作为初步对于mahout的了解估计是比较好的方法。

 

1. 到官网下载最新的版本:http://apache.fayea.com/apache-mirror/mahout/0.9/

2. 下载之后解压

3. Eclipse之中创建一个普通的java project 并将解压包之中的jar包导入到项目的classpath之中


 

在创建好项目之后,我们试一下第一个程序: (使用到的intro.csv被压缩在intro.zip之中了)

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.apache.mahout.cf.taste.common.TasteException;
import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;
import org.apache.mahout.cf.taste.recommender.RecommendedItem;
import org.apache.mahout.cf.taste.recommender.Recommender;
import org.apache.mahout.cf.taste.similarity.UserSimilarity;


public class Test {

	public static void main(String[] args) throws IOException, TasteException {
		
		DataModel model = new FileDataModel(new File("E:\\DataSet\\intro.csv"));
		UserSimilarity sim = new PearsonCorrelationSimilarity(model);
		UserNeighborhood nbh = new NearestNUserNeighborhood(2, sim, model);
		
		// 生成推荐引擎
		Recommender rec = new GenericUserBasedRecommender(model, nbh, sim);
		
		// 为用户1推荐物品1
		List<RecommendedItem> recItemList = rec.recommend(1, 1);
		
		for(RecommendedItem item : recItemList) {
			System.out.println(item);
		}
		
	}
}

// RecommendedItem[item:104, value:4.257081]

 结果即为推荐104这个东西

 

Done!

  • 大小: 9.5 KB
2
2
分享到:
评论

相关推荐

    Mahout 单机demo

    **标题解析:** "Mahout 单机demo" 指的是使用Apache Mahout这个开源机器学习库在单机环境下进行的一个演示项目。Mahout主要用于大规模数据集的推荐系统、分类和聚类算法。 **描述解析:** "mahout 推荐算法,csv...

    mahout安装图文版

    ### Mahout 安装与配置详解 #### 一、Mahout 概述 Mahout 是一个高度可扩展的机器学习库,特别适用于大数据环境。它提供了多种数据挖掘算法的实现,如分类、聚类、推荐系统等,并且这些算法可以在 Hadoop 分布式...

    Learning Apache Mahout

    - Mahout的安装指南:详细介绍了如何在不同的操作系统上安装Mahout,以及如何配置相关环境,确保Mahout可以顺利运行。 - 数据预处理:在进行机器学习之前,数据预处理是一个重要的步骤,Mahout提供了相应的工具来...

    mahout所需jar包

    1. **配置环境**:确保已经安装了Java和Hadoop,并且设置了相应的环境变量。 2. **下载Mahout**:解压提供的`mahout-distribution-0.5`压缩包到本地目录。 3. **创建输入数据**:准备要进行聚类的数据,通常是以CSV...

    mahout-core-0.9.jar+mahout-core-0.8.jar+mahout-core-0.1.jar

    这个压缩包包含的是Mahout项目不同版本的核心库,分别是mahout-core-0.9.jar、mahout-core-0.8.jar和mahout-core-0.1.jar。这些版本的差异在于功能的完善、性能的优化以及对新特性的支持。 1. **Mahout核心功能**:...

    9.Hadoop入门进阶课程_第9周_Mahout介绍、安装与应用案例.pdf

    ### Hadoop入门进阶课程之Mahout介绍、安装与应用案例 #### Mahout概述 Mahout作为Apache Software Foundation(ASF)旗下的一个开源项目,致力于提供一系列可扩展的机器学习算法实现,以帮助开发者更轻松地构建...

    Mahout最新基础依赖包.rar

    为了在 Eclipse 中使用 Mahout,你需要安装 Hadoop 和 Mahout 相关的插件,或者手动配置项目以包含 "Mahout 最新基础依赖包" 中的 JAR 文件。这样可以避免因缺少依赖而导致的编译错误或运行时问题。 **使用步骤** ...

    如何成功运行Apache Mahout的Taste Webapp-Mahout推荐教程-Maven3.0.5-JDK1.6-Mahout0.5

    对于开发者来说,生成Eclipse工程有助于代码的编辑与管理,因此建议在Mahout目录下执行Maven命令将项目转换为Eclipse工程。之后,可以在Eclipse中导入这些工程,并进行后续的开发和调试。 5. 添加Mahout示例依赖 在...

    maven_mahout_template-mahout-0.8

    《Apache Maven与Mahout实战:基于maven_mahout_template-mahout-0.8的探索》 Apache Maven是一款强大的项目管理和依赖管理工具,广泛应用于Java开发领域。它通过一个项目对象模型(Project Object Model,POM)来...

    MAHOUT实战(中文版)

    4. **安装与配置**:详述如何在本地或分布式环境中设置Mahout,包括依赖库的安装、Hadoop集群的配置以及与其他大数据工具(如Hive和Pig)的集成。 5. **数据预处理**:在应用机器学习算法之前,数据清洗和转换是...

    Mahout tutorial

    配置完成后,验证Hadoop安装是否成功是推荐的下一步。 接下来,用户需要下载Mahout及其相关组件,这通常可以在Maven仓库中找到。当一切准备就绪后,可以开始创建推荐系统或执行聚类操作。Mahout推荐引擎允许用户...

    Mahout源码

    **Apache Mahout 源码解析** Apache Mahout 是一个基于Java的开源机器学习库,旨在简化大规模数据集上的机器学习算法实现。它为开发者提供了一系列预构建的、可扩展的机器学习算法,包括分类、聚类、推荐系统以及...

    mahout Algorithms源码分析

    对于初学者而言,如何在缺乏足够资料的情况下快速学习Mahout,也是一大挑战。 樊哲的经历还提到了编程训练的重要性。即便是在理论知识如数据结构、高等数学、算法编程等方面已经学习得很充分,但实际的编程训练仍然...

    大数据Mahout实践指南

    接着,将深入讲解Mahout的架构、工作原理以及安装配置方法,使读者能够搭建起自己的Mahout开发环境。 在机器学习部分,书中涵盖了多种Mahout支持的算法,如协同过滤、聚类、分类和回归等。协同过滤是推荐系统的核心...

    mahout源码

    《深入理解Mahout:朴素贝叶斯分类与中文分词技术解析》 Apache Mahout是一款基于Java开发的机器学习库,旨在提供可扩展的、高效的算法,用于数据挖掘和模式识别。在大数据时代,Mahout已经成为数据科学家和工程师...

Global site tag (gtag.js) - Google Analytics