机器学习应用较多的分类为以下三种:
(1)监督学习 supervised learning,通过已有的一部分输入数据和输出数据之间的对应关系,生成一个函数,将输入映射给合适的输出。如分类。
(2)非监督学习 unsupervised learning,直接对输入数据进行建模,例如聚类
(3)半监督学习 semi-supervised learning,综合利用有类标的数据和没有类标的数据,来生成合适的分类函数
1.监督学习
监督学习是训练神经网络和决策树最常见的技术,因为他们高度依赖事先确定的分类系统给出的信息。对于神经网络来说,分类系统用于判断网络的错误,然后调整网络适应他,决策树,分类系统用来判断哪些属性提供了更多的信息,这样可以用它来解决分类的问题。
同时,使用隐马尔科夫模型和的语音设别系统也依赖某些监督要素,但通常是为了调节系统额参数以便于最小化给定输入中的错误。
给出一个数据集合D,包含属性值集合A和分类集合C,机器学习的任务是产出一个联系属性值集合A和分类集合C的分类/预测函数(classification/prediction function)。这个函数可以用来预测新的属性集合。这个函数被称为分类模型(classification model)、预测模型(predictive model)或者简称分类器(classifier)。并且,分类模型可以是任何形式的,如决策树,规则集、贝叶斯模型或者一个平面等。
决策树算法
决策树学习算法的分类模型是一个树的形式,我们称之为决策树 decision tree ,包含两种节点,决策节点(decision node)和叶子节点(leaf node),一个决策节点内包含针对数据实例某个属性的一些测试,而叶子节点则代表一个类表。
如上图,根节点提出问题,这个问题可能有三个答案,这三个可能的答案构成了根节点下面的三个分支,其它内部节点也以类似方式工作。叶子节点代表一个类标。
一个决策树的构建过程是不断的分割训练数据,以使得最终分割所得到的各个子集尽可能的纯,一个纯的子集(pure subset)中的数据实例类标一致。
2.非监督学习
unsupervised learning seems much harder,the goal is to have the computer learn how to do something that we don't tell it how do do!两种思路,第一种,不告诉agent明确的分类,但是在成功时采用激励制度。第二种,称为聚类,这类学习类型的目标不是让效用函数最大化,而是找到训练数据的近似点。
3.半监督学习
半监督学习研究的主要内容就是如何高效的利用少量标记数据和大量的未标记数据来训练分类器。相比
监督学习半监督学习能够得到更高的性价比,因此半监督学习在理论和实际在运用中均受到了广泛关注。最
早在训练中运用未标记数据的想法(Self-Training)是:首先利用标记数据集训练出初始分类器,使用该分
类器对一些未标记数据进行标记,将可信度最高的一些标记新示例放入到标记数据集中再在新标记数据集上
进行下一次训练直到满足截止条件为止(e.g.,Scudder(1965);Fralick(1967);Agrawala(1970))。在这里未标记数据被用来修正和提高分类器的准确率。由于初始分类器总是一个弱分类器,self-training 不断地利用上次迭代过程中训练得到的分类器来对未标记数据进行分类并将分类结果加入下次迭代的训练过程中的做法,将会导致 self-training 算法不断累积自身的分类错误最终造成分类器分类效率不高。
相关推荐
人工智能和机器学习概述.md人工智能和机器学习概述.md人工智能和机器学习概述.md人工智能和机器学习概述.md人工智能和机器学习概述.md人工智能和机器学习概述.md人工智能和机器学习概述.md人工智能和机器学习概述.md...
人工智能——机器学习概述AI人工智能+区块链+物联网人工智能——机器学习概述AI人工智能+区块链+物联网人工智能——机器学习概述AI人工智能+区块链+物联网人工智能——机器学习概述AI人工智能+区块链+物联网人工智能...
一、机器学习概述 二、监督学习 三、无监督学习 四、强化学习 五、特征工程与数据预处理 六、模型选择与评估 七、深度学习基础 八、常用机器学习库与工具 九、实战案例分析 十、机器学习伦理与未来趋势 一、机器...
机器学习概述 机器学习是人工智能领域中一个重要的分支,它涉及到计算机科学、数学、统计学、信息论等多个领域。机器学习的核心思想是让计算机系统自动地从数据中学习和提高性能,不断地改进和自我完善。 机器学习...
机器学习概述与应用 1.机器学习是人工智能领域的一个热门方向,具有广阔的发展前景。 2.机器学习应用于数据挖掘、计算机视觉、语音识别、自然语言处理等多个领域。 3.机器学习算法能够帮助识别用户流失、推荐内容,...
机器学习概述课程设计报告(MATLAB 人脸识别) 本资源摘要信息涵盖了机器学习概述课程设计报告的主要内容,涉及人脸识别系统的设计和实现,利用 MATLAB 软件进行人脸识别的实践操作。 一、课程设计的目的 人脸...
day01-机器学习概述、特征工程、机器学习算法 共127页.pptx day02-sklearn、knn、朴素贝叶斯、决策树、随机森林 共102页.pptx day03-线性回归、岭回归、逻辑回归、分类、聚类算法 共86页.pptx day04-Tensorflow基础...
人工智能(英语:Artificial Intelligence, AI)亦称机器智能,是指利 用计算机来对人的意识、思维信息过程、 智能行为进行模拟(如学习、推理、思 考、规划等)和延伸,使计算机能实现 更高层次的应用。
"机器学习概述.pptx" 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。这些算法可以从数据中...
"机器学习概述课程设计报告(MATLAB人脸识别)" 本文是一篇机器学习概述课程设计报告,主题为MATLAB人脸识别系统。该报告分为五个部分:课程设计的目的、设计的内容与要求、详细设计、课程设计的总结和参考文献。 在...
【机器学习概述】 机器学习是人工智能的一个重要分支,它研究如何让计算机系统通过经验学习和改进,而无需显式编程。这一领域起源于上世纪50年代,随着时间的推移,经历了符号主义、概率论和联结主义三个主要发展...
机器学习概述课程设计报告MATLAB人脸识别样本.doc 本文档是一份机器学习概述课程设计报告,旨在设计一个基于MATLAB的人脸识别系统。该系统使用支持向量机(SVM)算法对人脸进行识别,并通过图像处理技术实现人脸的...
"机器学习概述课程设计报告MATLAB人脸识别" 在这篇课程设计报告中,我们将探索机器学习中的一个重要应用领域:人脸识别。人脸识别是一项新兴的科学研究工程,拥有广泛的应用前景。随着计算机技术的更新发展,这项...
机器学习----机器学习概述 机器学习算法分类 机器学习常用算法 特征工程与数据预处理 模型评估与优化 实践案例与编程实现
机器学习概述课程设计报告MATLAB人脸识别.pdf