阅读更多

1顶
0踩

行业应用

转载新闻 关于机器学习的十个实例

2014-03-13 15:06 by 资深记者 学良3 评论(0) 有17141人浏览
机器学习是什么?

机器学习是什么?这个问题的答案可以参考权威的机器学习定义,但是实际上,机器学习是由它所解决的问题定义的。因此,理解机器学习最好的方式是观察一些实例。

首先来看一些现实生活中众所周知和理解的机器学习问题的实例,然后讨论标准的机器学习问题的分类(命名系统),学习如何辨别一个问题是属于哪种标准案例。这样做的意义是,了解所面对的问题类型,我们就可以思考所需要的数据和可尝试的算法。



机器学习问题的十个实例

机器学习问题到处都是,它们组成了日常使用的网络或桌面软件的核心或困难部分。推特上“想来试试吗”的建议和苹果的Siri语音理解系统就是实例。

以下,是十个真正有关机器学习到底是什么的的实例:

  • 垃圾邮件检测:根据邮箱中的邮件,识别哪些是垃圾邮件,哪些不是。这样的模型,可以程序帮助归类垃圾邮件和非垃圾邮件。这个例子,我们应该都不陌生。
  • 信用卡欺诈检测:根据用户一个月内的信用卡交易,识别哪些交易是该用户操作的,哪些不是。这样的决策模型,可以帮助程序退还那些欺诈交易。
  • 数字识别:根据信封上手写的邮编,识别出每一个手写字符所代表的数字。这样的模型,可以帮助程序阅读和理解手写邮编,并根据地利位置分类信件。
  • 语音识别:从一个用户的话语,确定用户提出的具体要求。这样的模型,可以帮助程序能够并尝试自动填充用户需求。带有Siri系统的iPhone就有这种功能。
  • 人脸识别:根据相册中的众多数码照片,识别出那些包含某一个人的照片。这样的决策模型,可以帮助程序根据人脸管理照片。某些相机或软件,如iPhoto,就有这种功能。
  • 产品推荐:根据一个用户的购物记录和冗长的收藏清单,识别出这其中哪些是该用户真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助程序为客户提供建议并鼓励产品消费。登录Facebook或GooglePlus,它们就会推荐可能有关联的用户给你。
  • 医学分析:根据病人的症状和一个匿名的病人资料数据库,预测该病人可能患了什么病。这样的决策模型,可以程序为专业医疗人士提供支持。
  • 股票交易:根据一支股票现有的和以往的价格波动,判断这支股票是该建仓、持仓还是减仓。这样的决策模型,可以帮助程序为金融分析提供支持。
  • 客户细分:根据用户在试用期的的行为模式和所有用户过去的行为,识别出哪些用户会转变成该产品的付款用户,哪些不会。这样的决策模型,可以帮助程序进行用户干预,以说服用户早些付款使用或更好的参与产品试用。
  • 形状鉴定:根据用户在触摸屏幕上的手绘和一个已知的形状资料库,判断用户想描绘的形状。这样的决策模型,可以帮助程序显示该形状的理想版本,以绘制清晰的图像。iPhone应用Instaviz就能做到这样。
这十个实例展示了一个机器学习问题是什么样的很好的理念。有一个专门的文集记录那些有着历史意义的例子。其中一个例子是,一个需要建模的决策,为该决策有效地的自动建模为某一行业或者说领域带来了利益。

有些问题是人工智能中,如自然语言处理和机器视觉(处理人们很容易处理的问题),最困难的问题。其他一些也很困难,但它们同时是很经典的机器学习问题,如垃圾邮件检测和信用卡欺诈检测。

想想你在过去的一周中跟线上或线下的软件之间的交互。你肯定能很轻易的推测出十或二十个直接或间接使用的机器学习实例。

机器学习问题的类型

通过上述的机器学习问题的实例,你一定已经意识到一些相似性之处。这种技能很有价值,因为擅长从现象看本质,使得你可以高效的思考需要的数据和可尝试的算法类型。

关于机器学习,有一些常见的分类。以下这些分类,是我们在研究机器学习时碰到的大多问题都会参考的典型。

  • 分类:标记数据,也就是将它归入某一类,如垃圾/非垃圾(邮件)或欺诈/非欺诈(信用卡交易)。决策建模是为了标记新的未标记的数据项。这可以看做是辨别问题,为小组之间的差异性或相似性建模。
  • 回归:数据被标记以真实的值(如浮点数)而不是一个标签。简单易懂的例子如时序数据,如随着时间波动的股票价格。这个建模的的决策是为新的未预测的数据估计值。
  • 聚类:不标记数据,但是可根据相似性,以及其他的对数据中自然结构的衡量对数据进行分组。可以从以上十个例子清单中举出一例:根据人脸,而不是名字,来管理照片。这样,用户就不得不为分组命名,如Mac上的iPhoto。
  • 规则提取:数据被用作对提议规则(前提/结果,又名如果)进行提取的基础。这些规则,可能但不都是有指向的,意思是说,这些方法可以找出数据的属性之间在统计学上有说服力的关系,但不都是必要的涉及到需要预测的东西。有一个找出买啤酒还是买尿布之间关系的例子,(这是数据挖掘的民间条例,真实与否,都阐述了期望和机会)。
当你认为一个问题是机器学习问题时(如需要从数据中建模的决策问题),接着思考下什么问题类型可以直接借用,或者,用户或需求期待什么样的结果,反过来也这样做。

资源

很少有资源列出现实世界中机器学习的问题清单。也可能它们就在那,但我没发现。我还是找到了一些很酷的资源供你们参考:

  • 一年一度的“Humies”奖:这是一些授予那些计算到的结果可以媲美人类的算法的奖项。这些算法只是工作在数据或者付费函数上,就能够如此有创造性,足以违反专利。太了不起了!
  • 人工智能效应:有这样一种观念:只要人工智能程序取得了足够好的成绩,就不再被看做人工智能,而只当做是科技,然后被日常使用。这个观念,同样适用于机器学习。
  • 人工智能大赛:这个大赛涉及了人工智能领域中非常困难的问题,如果这些问题能够解决,将会是强大的证明人工智能的案例(科幻小说中想象的那种,真正的人工智能)。计算机视觉和自然语言处理都是人工智能竞赛问题的实例,它们也被当作是机器学习问题的特定领域的分类。
  • 2013年机器学习十大问题:这个Quora上的问题有一些非常精彩的回答,其中一个答案列出了实际的机器学习问题的粗略分类。
上文我们讨论了一些现实世界中机器学习问题的常见实例及其种类。现在,我们有信息谈论一个问题是否属于机器学习问题,并且能够从问题描述中挑选出一些元素来判断它属于分类类型,回归雷系,还是属于规则提取类型。

你知道现实世界中的一些机器学习问题吗?评论分享你的想法吧。

原文链接:Jason Brownlee   翻译: 伯乐在线 - Victoria
译文链接:http://blog.jobbole.com/62334/
  • 大小: 24.3 KB
  • 大小: 24.4 KB
来自: 伯乐在线
1
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • JBPM采购申请系统——06_JBPM版本控制及Token对象.7z

    JBPM采购申请系统——06_JBPM版本控制及Token对象.7z JBPM采购申请系统——06_JBPM版本控制及Token对象.7z JBPM采购申请系统——06_JBPM版本控制及Token对象.7z JBPM采购申请系统——06_JBPM版本控制及Token对象.7z ...

  • JBPM范例 可以运行 简单易懂 快速掌握JBPM

    JBPM范例 可以运行 简单易懂 快速掌握JBPM

  • JBPM4.4版本开发工具jar包

    jbpm4.4开发工具jar包

  • activiti-5.21.0 jbpm的升级版本

    activiti-5.21.0的完整包第一部分,受限于60M限制,一共分成两部分下载,包含activiti-5.21 的所有资源,jbpm4的升级版本

  • osworkflow、jbpm、activiti、flowable、camunda开源流程引擎哪个好?

    市场上比较有名的开源流程引擎有osworkflow、jbpm、activiti、flowable、camunda。其中:Jbpm4、Activiti、Flowable、camunda四个框架同宗同源,祖先都是Jbpm4,开发者只要用过其中一个框架,基本上就会用其它三个。...

  • jbpm

    jbpm

  • jbpm-jpdl-designer-3.0.13.zip_jbpm_jbpm design_jbpm designer_jbp

    jbpm-jpdl-designer-3.0.13 关于jbpm的jpdl 设计器

  • 纵观jBPM:从jBPM3到jBPM5以及Activiti5

    TomBaeyens离开的具体原因尚不清楚,但他的离开产生了两个结果:一是jBPM的下一个版本jBPM5完全放弃了jBPM4的基础代码,基于Drools Flow重头来过;二是TomBaeyens加入Alfresco后很快推出了新的基于jBPM4的开源工作流...

  • 最简单的jbpm工具

    这个是我用的最简单的JBPM的jar包,用着还不错,可以用link引入,或是放在eclipse相应的文件夹下

  • start.jbpm.org:Bootstrap JBPM是一个应用程序,可以轻松生成基于jBPM的业务应用程序

    凹凸版本为了提高jBPM和/或Enterprise发行版的版本,请克隆存储库jbpm-bootstrap-model , jbpm-bootstrap-kjar和jbpm-bootstrap-service : $ lsjbpm-bootstrap-kjar jbpm-bootstrap-model jbpm-bootstrap-service ...

  • JBPM.rar_jbpm

    JBPM是一个扩展性很强的工作流系统,百分百用JAVA语言开发,持久层采用Hibernate实现,理论上说,只要Hibernate支持的数据库JBPM都支持。同时它还能被部署在任何一款JAVA应用服务器上。

  • jbpm.rar_jbpm

    JBPM是一个扩展性很强的工作流系统,百分百用JAVA语言开发,持久层采用Hibernate实现,理论上说,只要Hibernate支持的数据库JBPM都支持。同时它还能被部署在任何一款JAVA应用服务器上

  • jbpm.rar_java jbpm_jbpm

    jbpm 开发实例 jbpm 开发实例 jbpm 开发实例

  • jbpm4.rar_jbpm_jbpm designer_jbpm4

    jBPM 4 Graphical Designer ,是比较详细介绍了jbpm4

  • JBPM工作原理及表结构详解

    本文件从JBPM的原理、实现方法、实例等方面详细讲解了JBPM的原理,包括以下内容: 1、JBPM特色: 3 2、流程图的组成: 3 2.1流转 (TRANSITION) 3 2.2活动 (ACTIVITY) 3 3、所用到的表: 4 3.1资源库与运行时表结构:...

  • jbpm.rar_jbpm_jbpm 3.0 books

    jbpm 开发指南 jbpm是jboss旗下的一款开源的工作流引擎,其功能非常强大,

  • Python项目-自动办公-59 PPT_pptx_在PPT中写入图片和表格.zip

    Python课程设计,含有代码注释,新手也可看懂。毕业设计、期末大作业、课程设计、高分必看,下载下来,简单部署,就可以使用。 包含:项目源码、数据库脚本、软件工具等,该项目可以作为毕设、课程设计使用,前后端代码都在里面。 该系统功能完善、界面美观、操作简单、功能齐全、管理便捷,具有很高的实际应用价值。

  • Python项目-实例-20 快递查询.zip

    Python课程设计,含有代码注释,新手也可看懂。毕业设计、期末大作业、课程设计、高分必看,下载下来,简单部署,就可以使用。 包含:项目源码、数据库脚本、软件工具等,该项目可以作为毕设、课程设计使用,前后端代码都在里面。 该系统功能完善、界面美观、操作简单、功能齐全、管理便捷,具有很高的实际应用价值。

  • 杂货产品检测43-YOLO(v5至v9)、CreateML、Paligemma、TFRecord、VOC数据集合集.rar

    杂货产品检测43-YOLO(v5至v9)、CreateML、Paligemma、TFRecord、VOC数据集合集.rarIPCV分配-V6 2024-01-21 6:10 PM ============================= *与您的团队在计算机视觉项目上合作 *收集和组织图像 *了解和搜索非结构化图像数据 *注释,创建数据集 *导出,训练和部署计算机视觉模型 *使用主动学习随着时间的推移改善数据集 对于最先进的计算机视觉培训笔记本,您可以与此数据集一起使用 该数据集包括7012张图像。 家庭废物以createMl格式注释。 将以下预处理应用于每个图像: *像素数据的自动取向(带有Exif-Arientation剥离) *调整大小为640x640(拉伸) 没有应用图像增强技术。

  • 绝对给力的源码,在线音乐播放器完整项目.zip

    Android 毕业设计,Android 毕业设计,小Android 程设计,含有代码注释,新手也可看懂。毕业设计、期末大作业、课程设计、高分必看,下载下来,简单部署,就可以使用。 包含:项目源码、数据库脚本、软件工具等,该项目可以作为毕设、课程设计使用,前后端代码都在里面。 该系统功能完善、界面美观、操作简单、功能齐全、管理便捷,具有很高的实际应用价值。

Global site tag (gtag.js) - Google Analytics