`
奔跑的羚羊
  • 浏览: 576905 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【译】mahout in action 1.3 聚类Clustering

阅读更多
聚类的出现不太出名,但同样是重要的内容。正如它的名字意味着聚类技术试图把大量的事情聚集起来形成群集以便来分享它们的相似点。这是一种在大型的或者很难理解的数据集合中发现层次结构和规则的方法,用这种方法可以揭示有趣的模式或形成易于理解的数据集合。

谷歌新闻中心为了使介绍的新闻需要按逻辑模式来分类,而不是按一个包含所有文章的未加工的列表。因此他们运用聚类技术,根据文章主题来分组各类新闻。图1.3将会在下面举例说明。

像clusty group这样的搜索引擎搜索类似的原因。

客户可能被这种技术聚类,有可能是根据如:收入状况,地点,购买习惯等属性分成几个片段。


图1.3一个来自于谷歌新闻中心的新闻分类样本。
这是一个来自于一篇典型故事的详细片段展示,并根据有此主题的群里的其他一些相似的故事联系起来。这也是很方便的,将其它所有的故事联系按照这样一个主题聚集在一起。
  • 大小: 26.7 KB
分享到:
评论

相关推荐

    Mahout In Action英文完整版

    ### Mahout in Action:全面解析 #### 一、概述 《Mahout in Action》是一本由Sean Owen、Robin Anil、Ted Dunning和Ellen Friedman合著的专业书籍,旨在深入介绍Apache Mahout这一强大的机器学习库。该书的网上...

    mahout in action中的源码

    《Mahout in Action》是一本深入探讨Apache Mahout机器学习框架的专业书籍,其源码提供了丰富的实践示例和深入理解Mahout算法的机会。在GitHub上,你可以找到这些源码的完整版本,链接为。下面,我们将详细探讨...

    mahout in action 英文完整版(2012)

    - **Clustering algorithms in Mahout**:本章详细介绍Mahout中实现的各种聚类算法,如K-Means算法、Canopy聚类、DBSCAN算法等,并给出具体的实践案例。 - **Evaluating and improving clustering quality**:聚类...

    Mahout in Action 最新版+完整版

    《Mahout in Action》是一本关于Apache Mahout的权威指南,该书详细介绍了如何利用Mahout进行推荐系统、聚类分析以及分类等机器学习任务。此版本为2012年的最新完整版,由Sean Owen、Robin Anil、Ted Dunning和Ellen...

    Mahout in Action 2012

    Apache Mahout是一个Apache开源数据挖掘和机器学习项目,它提供了一系列基于...《Mahout in Action》作为一本实践导向的书籍,提供了详尽的理论知识和代码示例,是学习和应用Mahout进行数据挖掘和机器学习的理想选择。

    Mahout in action清晰完整版

    Mahout In Action 清晰完整版 聚类分析、算法推荐

    Mahout in Action(2012)

    - **第9章:Mahout中的聚类算法 (Clustering algorithms in Mahout)** - Mahout支持的不同聚类算法。 - 如何选择合适的算法。 - **第10章:评估和改进聚类质量 (Evaluating and improving clustering quality)** ...

    Mahout_in_Action

    - **第9章:Mahout中的聚类算法**(Clustering algorithms in Mahout):详细介绍了Mahout提供的各种聚类算法,如k-means、Canopy Clustering等,并讨论了它们的工作原理及适用场景。 - **第10章:评估和改进聚类...

    Mahout in Action完整版本.pdf

    本书《Mahout in Action》的三个核心部分覆盖了推荐系统、聚类和分类三个机器学习的主要领域。 在推荐系统部分,我们首先介绍了推荐引擎的基本概念,然后详细讲解了数据的表达方法(3. Representing data),如何...

    Mahout in Action 英文版, 标准PDF格式非伪PDF

    ### Mahout in Action #### 一、概述 《Mahout in Action》是一本关于Apache Mahout的详尽指南,由Sean Owen、Robin Anil、Ted Dunning和Ellen Friedman四位专家共同编写。这本书以标准的PDF格式呈现,采用Latex...

    Mahout in action 实战中文版 高清 完整

    《Mahout in Action》是一本深入探讨Apache Mahout的实战指南,它详尽地介绍了如何在Hadoop平台上实现机器学习算法。这本书的中文高清完整版为中国的读者提供了方便,使得更多的开发者可以理解并掌握这一强大的数据...

    mahout in action中文版 最全的 docx

    《Mahout in Action》是一本详细介绍Apache Mahout的书籍,中文版提供了全面的翻译,适合对机器学习和大数据处理感兴趣的读者。Mahout是一个Apache基金会的开源项目,专注于机器学习算法,它在Java语言基础上构建,...

Global site tag (gtag.js) - Google Analytics