分类技术决定一个东西是不是某个类型或种类的一部分,或者有没有某些属性。分类同样是普遍存在的,虽然这是更多的幕后工作。这种系统问题通常是通过对目录中的项目,很多例子的回顾来了解,从而推断出分类的规则。这里大致可以发现很多应用程序:
雅虎邮件,决定收到的消息是否是垃圾邮件,这基于用户之前的电子邮件和垃圾邮件报告,和电子邮件本身的特性一样。一些被分类为垃圾邮件的信息将会在图1.4中显示。
Picasa(http://picasa.google.com/)和其他一些相片管理应用程序,可以从一个图像中识别出一个人的脸部。
光学字符辨识软件,通过把小范围的已扫描的文本分割成若干个小单元格的个体,来分成单字。
Apple在报道的iTunes中的天才特性,就是用分类技术为用户把歌曲分成潜在的播放列表。
图1.3 雅虎邮件发现的垃圾邮件信息
基于用户的垃圾邮件报告,加上其他的分析,系统已经获得了通常用来辨认垃圾邮件的某些属性。例如,在“viagra”提到的信息经常是垃圾邮件,通常的拼错的如“v1agra”中也是这样。这样例子的存在是一个例子的一个属性,这个属性是从一个垃圾邮件分类器可以获得的。
- 大小: 9.3 KB
分享到:
相关推荐
《Mahout in Action》是一本深入探讨Apache Mahout机器学习框架的专业书籍,其源码提供了丰富的实践示例和深入理解Mahout算法的机会。在GitHub上,你可以找到这些源码的完整版本,链接为。下面,我们将详细探讨...
### Mahout in Action:全面解析 #### 一、概述 《Mahout in Action》是一本由Sean Owen、Robin Anil、Ted Dunning和Ellen Friedman合著的专业书籍,旨在深入介绍Apache Mahout这一强大的机器学习库。该书的网上...
一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。 Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。
Apache Mahout是一个Apache开源数据挖掘和机器学习项目,它提供了一系列基于...《Mahout in Action》作为一本实践导向的书籍,提供了详尽的理论知识和代码示例,是学习和应用Mahout进行数据挖掘和机器学习的理想选择。
《Mahout in Action源代码Maven编译JAR包详解》 Apache Mahout是一个流行的机器学习库,广泛用于数据挖掘和大数据分析。《Mahout in Action》这本书是Mahout技术的权威指南,提供了丰富的示例代码供读者实践。然而...
#### 描述:Mahout in Action 英文完整版(2012),自然语言处理,协同过滤,推荐引擎,聚类,分类 - **自然语言处理**:自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个...
Mahout In Action 2012.pdf 配套源代码 Mahout In Action 2012 Source Code 原书 Mahout In Action 2012 版本 源代码。 帮助理解推荐系统的常用算法,分布式信息挖掘技术。
《Mahout in Action》是一本深入探讨Apache Mahout的实战指南,它详尽地介绍了如何在Hadoop平台上实现机器学习算法。这本书的中文高清完整版为中国的读者提供了方便,使得更多的开发者可以理解并掌握这一强大的数据...
Mahout In Action 清晰完整版 聚类分析、算法推荐
《Mahout in Action》是一本关于Apache Mahout的权威指南,该书详细介绍了如何利用Mahout进行推荐系统、聚类分析以及分类等机器学习任务。此版本为2012年的最新完整版,由Sean Owen、Robin Anil、Ted Dunning和Ellen...
《Mahout in Action》是一本详细介绍Apache Mahout的书籍,中文版提供了全面的翻译,适合对机器学习和大数据处理感兴趣的读者。Mahout是一个Apache基金会的开源项目,专注于机器学习算法,它在Java语言基础上构建,...
### Mahout In Action – 关键知识点解析 #### 一、Mahout概述 - **起源与发展**:Mahout作为Apache基金会下的一个开源项目,专注于提供可扩展的机器学习库。其核心算法涵盖了机器学习的主要领域,包括但不限于协同...