机器学习是什么?
机器学习是什么?这个问题的答案可以参考权威的机器学习定义,但是实际上,机器学习是由它所解决的问题定义的。因此,理解机器学习最好的方式是观察一些实例。
首先来看一些现实生活中众所周知和理解的机器学习问题的实例,然后讨论标准的机器学习问题的分类(命名系统),学习如何辨别一个问题是属于哪种标准案例。这样做的意义是,了解所面对的问题类型,我们就可以思考所需要的数据和可尝试的算法。
机器学习问题的十个实例
机器学习问题到处都是,它们组成了日常使用的网络或桌面软件的核心或困难部分。推特上“想来试试吗”的建议和苹果的Siri语音理解系统就是实例。
以下,是十个真正有关机器学习到底是什么的的实例:
- 垃圾邮件检测:根据邮箱中的邮件,识别哪些是垃圾邮件,哪些不是。这样的模型,可以程序帮助归类垃圾邮件和非垃圾邮件。这个例子,我们应该都不陌生。
- 信用卡欺诈检测:根据用户一个月内的信用卡交易,识别哪些交易是该用户操作的,哪些不是。这样的决策模型,可以帮助程序退还那些欺诈交易。
- 数字识别:根据信封上手写的邮编,识别出每一个手写字符所代表的数字。这样的模型,可以帮助程序阅读和理解手写邮编,并根据地利位置分类信件。
- 语音识别:从一个用户的话语,确定用户提出的具体要求。这样的模型,可以帮助程序能够并尝试自动填充用户需求。带有Siri系统的iPhone就有这种功能。
- 人脸识别:根据相册中的众多数码照片,识别出那些包含某一个人的照片。这样的决策模型,可以帮助程序根据人脸管理照片。某些相机或软件,如iPhoto,就有这种功能。
- 产品推荐:根据一个用户的购物记录和冗长的收藏清单,识别出这其中哪些是该用户真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助程序为客户提供建议并鼓励产品消费。登录Facebook或GooglePlus,它们就会推荐可能有关联的用户给你。
- 医学分析:根据病人的症状和一个匿名的病人资料数据库,预测该病人可能患了什么病。这样的决策模型,可以程序为专业医疗人士提供支持。
- 股票交易:根据一支股票现有的和以往的价格波动,判断这支股票是该建仓、持仓还是减仓。这样的决策模型,可以帮助程序为金融分析提供支持。
- 客户细分:根据用户在试用期的的行为模式和所有用户过去的行为,识别出哪些用户会转变成该产品的付款用户,哪些不会。这样的决策模型,可以帮助程序进行用户干预,以说服用户早些付款使用或更好的参与产品试用。
- 形状鉴定:根据用户在触摸屏幕上的手绘和一个已知的形状资料库,判断用户想描绘的形状。这样的决策模型,可以帮助程序显示该形状的理想版本,以绘制清晰的图像。iPhone应用Instaviz就能做到这样。
这十个实例展示了一个机器学习问题是什么样的很好的理念。有一个专门的文集记录那些有着历史意义的例子。其中一个例子是,一个需要建模的决策,为该决策有效地的自动建模为某一行业或者说领域带来了利益。
有些问题是人工智能中,如自然语言处理和机器视觉(处理人们很容易处理的问题),最困难的问题。其他一些也很困难,但它们同时是很经典的机器学习问题,如垃圾邮件检测和信用卡欺诈检测。
想想你在过去的一周中跟线上或线下的软件之间的交互。你肯定能很轻易的推测出十或二十个直接或间接使用的机器学习实例。
机器学习问题的类型
通过上述的机器学习问题的实例,你一定已经意识到一些相似性之处。这种技能很有价值,因为擅长从现象看本质,使得你可以高效的思考需要的数据和可尝试的算法类型。
关于机器学习,有一些常见的分类。以下这些分类,是我们在研究机器学习时碰到的大多问题都会参考的典型。
- 分类:标记数据,也就是将它归入某一类,如垃圾/非垃圾(邮件)或欺诈/非欺诈(信用卡交易)。决策建模是为了标记新的未标记的数据项。这可以看做是辨别问题,为小组之间的差异性或相似性建模。
- 回归:数据被标记以真实的值(如浮点数)而不是一个标签。简单易懂的例子如时序数据,如随着时间波动的股票价格。这个建模的的决策是为新的未预测的数据估计值。
- 聚类:不标记数据,但是可根据相似性,以及其他的对数据中自然结构的衡量对数据进行分组。可以从以上十个例子清单中举出一例:根据人脸,而不是名字,来管理照片。这样,用户就不得不为分组命名,如Mac上的iPhoto。
- 规则提取:数据被用作对提议规则(前提/结果,又名如果)进行提取的基础。这些规则,可能但不都是有指向的,意思是说,这些方法可以找出数据的属性之间在统计学上有说服力的关系,但不都是必要的涉及到需要预测的东西。有一个找出买啤酒还是买尿布之间关系的例子,(这是数据挖掘的民间条例,真实与否,都阐述了期望和机会)。
当你认为一个问题是机器学习问题时(如需要从数据中建模的决策问题),接着思考下什么问题类型可以直接借用,或者,用户或需求期待什么样的结果,反过来也这样做。
资源
很少有资源列出现实世界中机器学习的问题清单。也可能它们就在那,但我没发现。我还是找到了一些很酷的资源供你们参考:
- 一年一度的“Humies”奖:这是一些授予那些计算到的结果可以媲美人类的算法的奖项。这些算法只是工作在数据或者付费函数上,就能够如此有创造性,足以违反专利。太了不起了!
- 人工智能效应:有这样一种观念:只要人工智能程序取得了足够好的成绩,就不再被看做人工智能,而只当做是科技,然后被日常使用。这个观念,同样适用于机器学习。
- 人工智能大赛:这个大赛涉及了人工智能领域中非常困难的问题,如果这些问题能够解决,将会是强大的证明人工智能的案例(科幻小说中想象的那种,真正的人工智能)。计算机视觉和自然语言处理都是人工智能竞赛问题的实例,它们也被当作是机器学习问题的特定领域的分类。
- 2013年机器学习十大问题:这个Quora上的问题有一些非常精彩的回答,其中一个答案列出了实际的机器学习问题的粗略分类。
上文我们讨论了一些现实世界中机器学习问题的常见实例及其种类。现在,我们有信息谈论一个问题是否属于机器学习问题,并且能够从问题描述中挑选出一些元素来判断它属于分类类型,回归雷系,还是属于规则提取类型。
你知道现实世界中的一些机器学习问题吗?评论分享你的想法吧。
相关推荐
【机器学习算法实例】 在机器学习领域,算法的实践应用是至关重要的,它们是我们构建智能模型的基础。这里我们将深入探讨两种不同的线性最小均方误差(Least Mean Square Error, LMSE)算法实例,分别是有解情况和...
该实例代码提供了一个完整的机器学习回归实例,展示了如何使用 Python 语言和相关库来解决回归问题。该实例代码可以作为机器学习入门者的参考,帮助他们更好地理解机器学习的基本概念和实现方法。
在压缩包“mvn”中,可能包含了一些关于如何使用多元正态分布在机器学习项目中的示例代码、教程或者数据集。学习这些实例可以帮助你更好地理解如何在实际问题中应用线性与非线性模型,并且掌握如何利用多元正态分布...
是机器学习很好的资料是非常不错的资料有助于机器学习的实战
《Python 机器学习经典实例》是一本专注于使用Python进行机器学习实践的书籍,代码基于Python 3.x版本实现。这本书涵盖了各种机器学习算法和技术,旨在帮助读者深入理解并掌握机器学习的基本原理和应用。在“人工...
Java机器学习实例源码,一共有10个源码示例,机器学习入门。
附件为Python机器学习经典实例源码11.4 创建一个深度神经网络,供大家参考
本实例“HadoopSparkExampler”旨在通过实际操作,帮助用户理解如何结合使用这两个技术进行机器学习任务。 Hadoop是Apache软件基金会开发的一个开源框架,主要用于处理和存储大规模数据集。它采用了分布式计算模型...
"Python机器学习经典实例代码shizhan.rar"这个压缩包提供了丰富的实战代码,旨在帮助学习者通过实际操作来加深对机器学习概念的理解。这里我们将详细探讨其中可能涵盖的一些重要知识点。 1. **基础库的使用**:...
本资源摘要信息将对贝叶斯统计机器学习的主要内容进行概括,从贝叶斯决策理论到机器学习问题实例,涵盖了机器学习的主要模型、模式识别与机器学习的基本问题等多个方面。 贝叶斯决策理论是机器学习中一个重要的理论...
机器学习-贝叶斯-西瓜分类 对代码的每一行进行了注解,适合初学者使用,主要代码来源是百度ai社区,只是对其进行了注解
本文将从三个方面介绍机器学习算法:典型机器学习算法、量子机器学习、李群机器学习。 典型机器学习算法是机器学习的基础部分,包括监督学习、非监督学习、半监督学习等。监督学习是通过大量已标记的训练序列建立一...
《Python机器学习经典实例》是一本深入探讨Python在机器学习领域的应用的书籍,其Code.zip压缩包包含了书中各个章节的实战代码。通过分析这个压缩包中的文件结构,我们可以看出它覆盖了从基础到进阶的多个关键章节。...
这些章节的源代码实例为读者提供了一个动手实践的机会,通过实际运行代码来理解机器学习的理论知识。在Python环境中,读者可以利用TensorFlow这个强大的库来构建和训练模型,从而更好地掌握机器学习的核心概念和技巧...
《机器学习》算法实例-决策树算法-预测鱼类和非鱼类实例 根据不浮出水面是否可以生存、是否有脚蹼2 个特征,将动物分成两类: 鱼类和非鱼类。 收集数据: 可以使用任何方法 准备数据: 树构造算法(这里使用的是ID3算法...
机器学习线性回归 实例数据集——广告投入与销售额
在本实例中,我们将深入探讨“一个简单的机器学习的线性回归实例”。这个实例涉及了如何使用Python编程语言,特别是Python 3.7版本中的库来实现线性回归模型。 首先,线性回归的基本思想是通过找到最佳拟合直线(或...
总的来说,这个"spark机器学习简单实例文档"很可能包含以上提到的各种算法的实现细节,包括数据预处理、模型训练、模型评估和参数调优的过程。如果你想要深入理解Spark上的机器学习,这份文档会是一个很好的学习资源...
包含:Python 基础教程、10个编程技巧、Python高级编程、优化算法、实例学习Numpy与Matplotlib、实例学习pandas、机器学习、深度学习、梯度下降、实验等等等等人工智能实战——从Python入门到机器学习资料大全。...