`
奔跑的羚羊
  • 浏览: 576305 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【译】mahout in action 1.1 Mahout是否适合我

阅读更多
大家可能想知道,这个项目,这本身是否适合我?
如果你想找一本机器学习的教科书,那就不适合你。本书不是用来完全解释理论,算法的各种来历和技术展现。熟悉这些机器学习的方法和相关的概念,如matrix and vector math,这些知识在读这本书时都是很有用的。

如果你正在开发现代化的智能应用程序,这本书适合你。随着解决方法的完整示例,这本书提供了一个实用的而非理论的方式来处理这些技术。它开发了一些关于mahout如何部署来解决问题的方案,这些方案是由示范过程中有经验的学员收集的。

如果你是一个关于人工智能,机器学习以及相关领域的研究人员,适合你。可能你最大的障碍就是把新的算法应用到实践中。Mahout为检测和部署新的大型的算法提供了一个丰富的框架。这本书在复杂的分布式计算框架上运行机器学习系统是一个有效的引入人。

如果你是一个产品团队或系统启动项的领导,将会利用机器学习创造一个有竞争性的优势,那么这本书对你也是有用的。通过现实生活中的例子,将会产生关于这些技术可能被部署的许多方式的观点。它也会帮助你的碎片技术团队直接形成一个低成本的实施,这可以处理大量的以前数据,这些数据只对拥有大型技术资源的组织是很现实的。

最后,你可能想知道怎样来说mahout,它应该与“trout”谐音。它应该是一个关于大象管理员的印的词语,并试图解释这一词语,这里有一个小的历史。2008年,mahout作为apache Lucene项目的子项目出现,它提供了同名的著名的开源搜索引擎。Lucene为关于搜索,文本开采和信息检索技术提供了高级实施。从计算机科学的整体来说,这些概念对机器学习技术,如聚类,在一定程度上,如分类,是邻近的。所以,对这些机器学习领域投入更多的lucene committers,它的一些工作是把自己甩进自己的子项目里。不久以后,Mahout吸收了“Taste”开源协同过滤(CF)项目。

2010年4月,mahout就其本身已经变成了一个高水平的Apache项目。

Mahout的很多工作通常不仅以一种高效的可扩展的方式实现了这些算法,而且转换一些算法至Hadoop的规模上运行。Hadoop的吉祥物是一只大象,它最后解释了这个项目名称。


图 1.1 Mahout和它的相关项目

Mahout不断提供一些技术和算法,其中许多技术和算法仍处在开发或试验阶段。在这个项目的早期阶段,三个核心主题是明显的:协同过滤/推荐引擎,聚类和分类。如果你正在读这本书,而你已经意识到这三类技术的有趣的潜能。如果你还没能了解,请继续读下去。
  • 大小: 54.6 KB
2
2
分享到:
评论

相关推荐

    Mahout In Action英文完整版

    ### Mahout in Action:全面解析 #### 一、概述 《Mahout in Action》是一本由Sean Owen、Robin Anil、Ted Dunning和Ellen Friedman合著的专业书籍,旨在深入介绍Apache Mahout这一强大的机器学习库。该书的网上...

    mahout in action中的源码

    《Mahout in Action》是一本深入探讨Apache Mahout机器学习框架的专业书籍,其源码提供了丰富的实践示例和深入理解Mahout算法的机会。在GitHub上,你可以找到这些源码的完整版本,链接为。下面,我们将详细探讨...

    Mahout in Action 2012

    Apache Mahout是一个Apache开源数据挖掘和机器学习项目,它提供了一系列基于...《Mahout in Action》作为一本实践导向的书籍,提供了详尽的理论知识和代码示例,是学习和应用Mahout进行数据挖掘和机器学习的理想选择。

    Mahout in Action完整版本(英文)

    一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。  Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。

    Mahout in action 实战中文版 高清 完整

    《Mahout in Action》是一本深入探讨Apache Mahout的实战指南,它详尽地介绍了如何在Hadoop平台上实现机器学习算法。这本书的中文高清完整版为中国的读者提供了方便,使得更多的开发者可以理解并掌握这一强大的数据...

    mahout in action源代码maven编译jar包

    《Mahout in Action源代码Maven编译JAR包详解》 Apache Mahout是一个流行的机器学习库,广泛用于数据挖掘和大数据分析。《Mahout in Action》这本书是Mahout技术的权威指南,提供了丰富的示例代码供读者实践。然而...

    Mahout in Action 最新版+完整版

    《Mahout in Action》是一部全面而深入的指南,不仅适合初学者入门学习,也适合有经验的开发者深入了解Mahout的高级用法。通过阅读本书,读者可以掌握利用Mahout解决实际问题的方法,并了解最新的机器学习技术和趋势...

    Mahout In Action 2012 Source Code

    Mahout In Action 2012.pdf 配套源代码 Mahout In Action 2012 Source Code 原书 Mahout In Action 2012 版本 源代码。 帮助理解推荐系统的常用算法,分布式信息挖掘技术。

    mahout in action中文版 最全的 docx

    《Mahout in Action》是一本详细介绍Apache Mahout的书籍,中文版提供了全面的翻译,适合对机器学习和大数据处理感兴趣的读者。Mahout是一个Apache基金会的开源项目,专注于机器学习算法,它在Java语言基础上构建,...

    Mahout in action清晰完整版

    Mahout In Action 清晰完整版 聚类分析、算法推荐

    Mahout in action(适合mahout初学者,英文pdf,易懂)

    本书《Mahout in Action》是针对Mahout初学者的实用指南,内容涵盖了Mahout的安装和设置、推荐引擎、聚类、分类等机器学习的关键应用。书中不仅介绍了Mahout是什么以及如何设置,还提供了对推荐引擎、聚类、分类在...

    mahout in action 英文完整版(2012)

    ### Mahout in Action 英文完整版(2012)关键知识点解析 #### 标题:Mahout in Action 英文完整版(2012) - **Mahout in Action**:本书主要介绍了Apache Mahout框架的应用和技术细节。Mahout是一个开源项目,专注...

Global site tag (gtag.js) - Google Analytics