`
davidxiaozhi
  • 浏览: 242133 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
阅读更多
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911
 
剖析mahout脚本
 

mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的入口。

主要会做各类环境变量的设置。

MAHOUT_JAVA_HOME:指定java的执行路劲,会覆盖$JAVA_HOME

MAHOUT_HEAPSIZE   :JAVA运行堆栈的内存大小

HADOOP_CONF_DIR  : hadoop 配置文件路径主要是*-site.xml这些文件的位置

MAHOUT_OPTS           : mahout运行时的java参数

MAHOUT_CONF_DIR    :类文件属性文件所在文件,文件名是类名简写,默认位置$MAHOUT_HOME/src/conf

MAHOUT_LOCAL         : 设置是否本地运行,如果设置这个参数就不会运行hadoop了,一旦设置这个参数,那HADOOP_CONF_DIR HADOOP_HOME 这两个参数的设置就自动失效了。

MAHOUT_CORE          :是否应用开发环境的core,还是发布的core

 

参数-core                  指定引用包的路径

 

 

  • 案例调用流程

要运行example的时候,最终的触发语句如下:

exec"$HADOOP_BINARY" jar $MAHOUT_JOB $CLASS "$@"

1$HADOOP_BINARY 就是hadoop的执行文件

2$MAHOUT_JOB:  就是mahout-examples-*-job.jar 所在位置

3$CLASS   :      是默认的 org.apache.mahout.driver.MahoutDriver

4$@           :      就是要调用的class名字,比如org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

0
0
分享到:
评论

相关推荐

    基于Mahout协同过滤实现图书推荐系统-书籍推荐系统源码+项目说明.zip

    包含:项目源码、数据库脚本、项目说明等,该项目可以直接作为毕设使用。 也可以用来学习参考借鉴! 【特别强调】 1、csdn上资源保证是完整最新,会不定期更新优化; 2、请用自己的账号在csdn官网下载,若通过第三方...

    MAHOUT实战--中文高清版.pdf下载

    这将包括Mahout的安装、配置以及编写脚本或程序调用其API来实现数据挖掘任务。 5. 个性化服务:在个性化需求越来越被重视的今天,Mahout通过其算法能够帮助企业分析用户行为、提供个性化的产品推荐、内容推荐等,...

    基于spark、mahout和spring boot构建的智能推荐系统.zip

    在本项目中,Mahout被用于实现推荐模型的构建,通过分析用户的历史行为数据,找出相似的用户或物品,进而进行个性化推荐。 3. Spring Boot框架:Spring Boot简化了Spring应用的初始搭建以及开发过程,使得开发...

    mahout-recommender

    **正文** ...通过Python接口,我们可以方便地将这些算法集成到现有的数据分析流程中,实现更高效、更个性化的推荐服务。在实际项目中,需要结合业务需求,对算法进行调优,以提高推荐的准确性和覆盖率。

    Hadoop实战书籍

    例如,Hive是建立在Hadoop之上的数据仓库工具,它提供了数据摘要、查询和分析的SQL-like语言(HiveQL);HBase是一种可扩展的分布式存储系统,提供了高性能的随机访问能力,适合大规模的数据存储需求;Mahout则是一...

    hadoop 命令大全

    对于作业的更深入分析,如成功的任务数量以及每个任务的尝试次数等信息,可以通过命令`$bin/hadoop job -history all output-dir`来获取。 **5. 格式化新的分布式文件系统** 在部署新的Hadoop集群或重置现有集群时...

    Distributed-Statistical-Computing:分布式统计计算的注释和分配

    7. **统计分析库**:在分布式环境中,如Apache Mahout或MLlib(Spark的机器学习库)等库被用于大规模的统计分析和机器学习任务。这些库提供了并行化的算法,能够在分布式系统上高效运行。 8. **性能优化**:优化...

    英特尔Hadoop发行版 2.2 开发者指南

    - **使用**:可以通过命令行工具调用该脚本来执行测试,并查看结果。 - **TeraSort Benchmark Suite** - **样例代码**:实现了一套完整的排序基准测试,包括生成随机数据、排序以及验证排序正确性等功能。 - **...

    推荐

    Groovy的简洁语法使得这些算法的实现更为直观,同时,Groovy可以轻松调用Java库,如Apache Mahout或Spark MLlib,这些库提供了丰富的推荐算法实现。 总的来说,"recommend"项目利用Groovy的强大功能,构建了一个...

    SWE400Project1:LSA 项目

    在数据处理和文本分析领域,Java有丰富的库支持,比如Apache Mahout和Weka,它们提供了实现LSA所需的工具和算法。 【压缩包子文件的文件名称列表】: SWE400Project1-master 这个文件名表明了项目源代码的主分支,...

    smodelkit:用Java编写的用于多维分类的机器学习工具包

    此外,Java语言的面向对象特性使得smodelkit能够轻松地与其他Java库或项目集成,如Apache Mahout、Weka等其他机器学习框架。 在压缩包文件`smodelkit-master`中,我们可以期待找到以下内容: 1. **源代码**:包含...

    jpype:JPype是跨语言的桥梁,允许python程序完全访问java类库

    1. 数据科学:Python有许多优秀的数据处理库,但有些Java库(如Apache Mahout或Weka)在机器学习方面也有独特优势。 2. 大型系统集成:当Python脚本需要与已有的Java系统交互时,JPype提供了一个方便的接口。 3. GUI...

    机器学习分类大师人物Java

    在人物分类问题中,这可能涉及到识别图像中的人物、分析人物的性格特征或预测人物的行为等。以下是一些相关的知识点: 1. **数据预处理**:在任何机器学习项目中,数据预处理都是至关重要的步骤。对于人物分类,这...

Global site tag (gtag.js) - Google Analytics