`
backsnow
  • 浏览: 130926 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

mahout在eclipse下的开发环境

 
阅读更多

首先将源码转移到~/workspace下,目标文件夹为mahout-distribution-0.5

 

进入该目录,运行

mvn eclipse:eclipse

然后, 运行

sudo mvn -Declipse.workspace= eclipse:add-maven-repo

接着从eclipse->file->import->existing project into workspace,mahout-distribution-0.5目录导入,即可。

 

 

参考自 http://shuyo.wordpress.com/2011/02/01/mahout-development-environment-with-maven-and-eclipse-1/

分享到:
评论
4 楼 backsnow 2011-10-31  
调试运行时报~/workspace/mahout/examples/nsl-forest已存在,将它改名为nsl-forest-bak
3 楼 backsnow 2011-07-30  
上面说的不执行sudo可能还是解决不了,因为~/.m2里其实已经有了相应的repository,还是需要手工将包导入到工程中.
2 楼 backsnow 2011-07-30  
m2-repo的jar找不到的原因是:我在执行sudo mvn -Declipse.workspace= eclipse:add-maven-repo时,相应的jar包产生在根用户的.m2和lib目录下(这可由/etc/maven2/m2.conf得知),所以,eclipse找不到,需要把这里面的jar包烤出来,目前.m2中的内容已拷到/home/ubuntu/m2-repos下,如果以后需要可以看看lib目录下的东西。

另外,执行时不用sudo或许就能避免这个问题,以后有需要的话可以试试。
1 楼 backsnow 2011-07-30  
工程导入后build path error, 查看错误发现是很多m2-repo下的Jar找不到,于是换成了mahout-integration里面相同的包,问题解决。

相关推荐

    mahout环境搭建

    Mahout 基于 Apache Hadoop,能够处理大规模数据集,为开发人员提供可扩展的、分布式计算环境下的机器学习算法。本文将详细介绍如何在 Ubuntu 10.04 上搭建 Mahout 实验环境。 首先,为了运行 Mahout,我们需要安装...

    hadoop 2.4.1+mahout0.9环境搭建

    修改后的源码包是为了解决版本间的不兼容,确保在新的Hadoop环境下仍能正常编译和运行Mahout算法。 3. **源码编译与安装**:为了在Hadoop 2.4.1上运行Mahout 0.9,我们需要对源码进行编译。这通常包括以下步骤:...

    Mahout最新基础依赖包.rar

    为了在 Eclipse 中使用 Mahout,你需要安装 Hadoop 和 Mahout 相关的插件,或者手动配置项目以包含 "Mahout 最新基础依赖包" 中的 JAR 文件。这样可以避免因缺少依赖而导致的编译错误或运行时问题。 **使用步骤** ...

    maven_mahout_template-mahout-0.8

    使用这个模板,开发者可以迅速设置好开发环境,无需从零开始配置依赖。只需导入到IDE,如IntelliJ IDEA或Eclipse,然后就可以直接开始编写基于Mahout的机器学习程序。 Mahout 0.8版本是一个重要的里程碑,包含了...

    如何成功运行Apache Mahout的Taste Webapp-Mahout推荐教程-Maven3.0.5-JDK1.6-Mahout0.5

    对于开发者来说,生成Eclipse工程有助于代码的编辑与管理,因此建议在Mahout目录下执行Maven命令将项目转换为Eclipse工程。之后,可以在Eclipse中导入这些工程,并进行后续的开发和调试。 5. 添加Mahout示例依赖 在...

    MAHOUT实战

    2. **字符串拼接**:在单线程环境下使用`StringBuilder`进行字符串拼接;多线程环境下使用`StringBuffer`,以确保线程安全。 - 示例: ```java StringBuilder sb = new StringBuilder(); sb.append("Hello")....

    mahout-example

    开发者可以通过解压并导入到IDE(如Eclipse或IntelliJ IDEA)中,查看和运行示例代码,了解如何在实际项目中应用Mahout。 1. 示例项目结构: - src/main/java:包含Java源代码,展示了如何调用Mahout API创建机器...

    play-mahout:一个运行Apache Mahout方法的游乐场

    **集成开发环境(IDE)** 为了更好地开发和调试`play-mahout`项目,通常会使用Java IDE,如Eclipse或IntelliJ IDEA。这些IDE提供了代码自动完成、错误检查、版本控制集成以及方便的项目管理和构建工具,极大地提高...

    java实现基于贝努力模型的朴素贝叶斯分类器

    `Eclipse`是Java开发常用的集成开发环境(IDE),用于编写、运行和调试代码。在这个项目中,`.classpath`和`.project`文件是Eclipse项目配置文件,它们定义了项目的构建路径和编译设置。 `pom.xml`是Maven项目的...

    大数据课程列表.pdf

    2. **Linux及Ubuntu系统基础**:由于Hadoop主要运行在Linux环境下,因此熟悉Linux操作系统和Ubuntu是入门的必要条件。学员将学习如何安装和配置这些系统。 3. **Hadoop安装配置**:包括单机模式和伪分布式模式的...

    大数据课程列表.docx

    在这个阶段,你将学习如何在Hadoop上运用Mahout的成熟算法进行大数据分析,探索不同场景下的应用,例如用户行为分析、推荐系统等。 **第六阶段:HBase与Hadoop生态系统** HBase是基于Hadoop的分布式NoSQL数据库,...

    阿里云javasdk源码-hackathon-ocw:黑客马拉松

    开发环境 安装 . 安装 . Git Clone 代码库: git clone https://github.com/foamliu/hackathon-ocw.git 开发环境: a. Feed API: 打开命令行窗口, 进入FeedAPI目录, 输入:activator ui 回车, 即可开发 FeedAPI 项目....

    Java基于大数据的个人与企业信用评分系统源码.zip

    8. **开发工具与环境**:可能使用Eclipse或IntelliJ IDEA作为Java开发环境,Maven或Gradle作为项目构建工具,Jenkins或GitLab CI/CD进行持续集成和持续部署。 9. **测试框架**:为了确保代码质量,项目可能包含了...

    大数据开发入门指南:从概念到实践应用讲解.zip

    11. **大数据开发工具**:包括Eclipse、IntelliJ IDEA等集成开发环境,以及Apache Maven或Gradle等构建工具。 12. **数据可视化**:Tableau、Power BI、D3.js等工具用于将复杂数据转化为直观的图表,帮助决策者理解...

    基于协同过滤算法的商品推荐系统的设计与实现 springboot

    开发软件:eclipse/myeclipse/idea Maven包:Maven3.3.9 浏览器:谷歌浏览器 Java配置环境链接:https://pan.baidu.com/s/1Dzpiqb46mrukQzXOEj3otw 后台路径地址:localhost:8080/项目名称/admin/dist/index....

    基于大数据时代计算机软件技术的开发与应用分析.zip

    1. 开发工具:IDE如Eclipse、IntelliJ IDEA支持大数据项目开发,集成Hadoop、Spark等框架。 2. 开发语言:Java、Python、Scala等语言在大数据领域广泛应用,Python因其易学易用性尤其受到青睐。 3. 测试与调试:...

    NaiveBayes:朴素贝叶斯机器学习课程学习算法

    Eclipse是一款强大的Java集成开发环境,对于学习和实现各种算法非常方便。为了运行课程项目,你需要提供两个数据集:`src/train-win.dat`和`src/test-win.dat`。训练数据集(train-win.dat)用于构建模型,而测试...

    基于Spark的电商用户分析系统-开题报告.docx

    开发语言选用Java、JSP、JavaScript,开发工具Eclipse,确保了开发效率。 2. 硬件可行性:具备足够的计算和存储资源,以及必要的软件测试设备。 3. 社会可行性:相比传统数据库,大数据技术更适应处理大规模时序...

    分布式集群技术.pdf

    Storm 常用组件和编程 API 是分布式集群技术的基础,Topology、Spout、Bolt、Storm 分组策略(stream groupings)、Storm 项目 maven 环境搭建、使用 Strom 开发一个 WordCount 例子、Storm 程序本地模式 debug、...

Global site tag (gtag.js) - Google Analytics