`
奔跑的羚羊
  • 浏览: 576929 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【译】mahout in action 1.4 分类Classification

阅读更多
分类技术决定一个东西是不是某个类型或种类的一部分,或者有没有某些属性。分类同样是普遍存在的,虽然这是更多的幕后工作。这种系统问题通常是通过对目录中的项目,很多例子的回顾来了解,从而推断出分类的规则。这里大致可以发现很多应用程序:

雅虎邮件,决定收到的消息是否是垃圾邮件,这基于用户之前的电子邮件和垃圾邮件报告,和电子邮件本身的特性一样。一些被分类为垃圾邮件的信息将会在图1.4中显示。

Picasa(http://picasa.google.com/)和其他一些相片管理应用程序,可以从一个图像中识别出一个人的脸部。

光学字符辨识软件,通过把小范围的已扫描的文本分割成若干个小单元格的个体,来分成单字。

Apple在报道的iTunes中的天才特性,就是用分类技术为用户把歌曲分成潜在的播放列表。


图1.3 雅虎邮件发现的垃圾邮件信息
基于用户的垃圾邮件报告,加上其他的分析,系统已经获得了通常用来辨认垃圾邮件的某些属性。例如,在“viagra”提到的信息经常是垃圾邮件,通常的拼错的如“v1agra”中也是这样。这样例子的存在是一个例子的一个属性,这个属性是从一个垃圾邮件分类器可以获得的。
  • 大小: 9.3 KB
分享到:
评论

相关推荐

    mahout in action中的源码

    《Mahout in Action》是一本深入探讨Apache Mahout机器学习框架的专业书籍,其源码提供了丰富的实践示例和深入理解Mahout算法的机会。在GitHub上,你可以找到这些源码的完整版本,链接为。下面,我们将详细探讨...

    Mahout In Action英文完整版

    ### Mahout in Action:全面解析 #### 一、概述 《Mahout in Action》是一本由Sean Owen、Robin Anil、Ted Dunning和Ellen Friedman合著的专业书籍,旨在深入介绍Apache Mahout这一强大的机器学习库。该书的网上...

    Mahout in Action完整版本(英文)

    一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。  Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。

    Mahout in Action 2012

    Apache Mahout是一个Apache开源数据挖掘和机器学习项目,它提供了一系列基于...《Mahout in Action》作为一本实践导向的书籍,提供了详尽的理论知识和代码示例,是学习和应用Mahout进行数据挖掘和机器学习的理想选择。

    mahout in action源代码maven编译jar包

    《Mahout in Action源代码Maven编译JAR包详解》 Apache Mahout是一个流行的机器学习库,广泛用于数据挖掘和大数据分析。《Mahout in Action》这本书是Mahout技术的权威指南,提供了丰富的示例代码供读者实践。然而...

    mahout in action 英文完整版(2012)

    #### 描述:Mahout in Action 英文完整版(2012),自然语言处理,协同过滤,推荐引擎,聚类,分类 - **自然语言处理**:自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个...

    Mahout In Action 2012 Source Code

    Mahout In Action 2012.pdf 配套源代码 Mahout In Action 2012 Source Code 原书 Mahout In Action 2012 版本 源代码。 帮助理解推荐系统的常用算法,分布式信息挖掘技术。

    Mahout in action 实战中文版 高清 完整

    《Mahout in Action》是一本深入探讨Apache Mahout的实战指南,它详尽地介绍了如何在Hadoop平台上实现机器学习算法。这本书的中文高清完整版为中国的读者提供了方便,使得更多的开发者可以理解并掌握这一强大的数据...

    mahout_in_action_中文版

    3. **分类(Classification)**:这是一种有监督的学习方法,用于预测给定输入数据的类别或标签。分类算法在文本分类、情感分析等任务中有广泛的应用。 #### 三、Mahout的技术特点 1. **强大的可扩展性**:Mahout...

    Mahout in action清晰完整版

    Mahout In Action 清晰完整版 聚类分析、算法推荐

    Mahout in Action 最新版+完整版

    《Mahout in Action》是一本关于Apache Mahout的权威指南,该书详细介绍了如何利用Mahout进行推荐系统、聚类分析以及分类等机器学习任务。此版本为2012年的最新完整版,由Sean Owen、Robin Anil、Ted Dunning和Ellen...

    mahout in action中文版 最全的 docx

    《Mahout in Action》是一本详细介绍Apache Mahout的书籍,中文版提供了全面的翻译,适合对机器学习和大数据处理感兴趣的读者。Mahout是一个Apache基金会的开源项目,专注于机器学习算法,它在Java语言基础上构建,...

    Mahout In Action带书签完整版

    ### Mahout In Action – 关键知识点解析 #### 一、Mahout概述 - **起源与发展**:Mahout作为Apache基金会下的一个开源项目,专注于提供可扩展的机器学习库。其核心算法涵盖了机器学习的主要领域,包括但不限于协同...

Global site tag (gtag.js) - Google Analytics