有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。
无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里,所有的标记(分类)是未知的。因此,训练样本的岐义性高。聚类就是典型的无监督学习
机器学习中的方法或范式(paradigm)有很多种分类体系,例如从学习的方式分,有例子中学习、类比学习、分析学习等,但一般来说,现在研究得最多、被认为最有用的是从例子中学习。对从例子中学习,又有很多分类方法,例如从学习的主动性方面,可以分为主动学习和被动学习;从训练过程启动的早晚,可以分为迫切学习和惰性学习等等。最常见的对“从例子中学习”的方法的分类是监督学习、非监督学习和强化学习,这是从训练样本的歧义性(ambiguity)来进行分类的。对监督学习来说,它通过对具有概念标记(concept label)的训练例进行学习,以尽可能正确地对训练集之外的示例的概念标记进行预测。这里所有训练例的概念标记都是已知的,因此训练样本的歧义性最低。
对非监督学习来说,它通过对没有概念标记的训练例进行学习,以发现训练例中隐藏的结构性知识。这里的训练例的概念标记是不知道的,因此训练样本的歧义性最高。对强化学习来说,它通过对没有概念标记、但与一个延迟奖赏或效用(可视为延迟的概念标记)
相关联的训练例进行学习,以获得某种从状态到行动的映射。这里本来没有概念标记的概念,但延迟奖赏可被视为一种延迟概念标记,因此其训练样本的歧义性介于监督学习和非监督学习之间。
需要注意的是,监督学习和非监督学习从一开始就是相对的,而强化学习在提出时并没有从训练样本歧义性的角度考虑其与监督学习和非监督学习的区别,因此,一些早期的研究中把强化学习视为一种特殊的非监督学习。事实上,对强化学习的定位到目前仍然是有争议的,有的学者甚至认为它是与“从例子中学习”同一级别的概念。
从训练样本歧义性角度进行的分类体系,在近几年可望有一些扩展,例如多示例学习(multi-instance learning)等从训练样本歧义性方面来看很特殊的新的学习框架有可能会进入该体系。但到目前为止,没有任何新的框架得到了公认的地位。另外,半监督学习(semi-supervised learning)也有一定希望,它的障碍是半监督学习中的歧义性并不是与生俱来的,而是人为的,即用户期望用未标记的样本来辅助对已标记样本的学习。这与监督学习、非监督学习、强化学习等天生的歧义性完全不同。半监督学习中人为的歧义性在解决工程问题上是需要的、有用的(对大量样本进行标记的代价可能是极为昂贵的),但可能不太会导致方法学或对学习问题视点的大的改变。
不同的分类体系是相交的,例如,监督学习方法既可能是迫切的(例如大多数神经网络、决策树等),也可能是惰性的(例如k近邻等)。另外,分类体系也不是绝对的,例如前面提到的强化学习的情况。
相关推荐
有监督学习和无监督学习的主要区别在于: 1. 数据需求:监督学习需要带有标签的训练数据,无监督学习仅需未标记的数据。 2. 学习目标:监督学习是学习给定输入和输出之间的映射,无监督学习是寻找数据内部的结构或...
### 深度学习与无监督学习:关键技术与应用 #### 深度学习概览 深度学习是一种机器学习技术,它通过构建多层的人工神经网络来模拟人脑的学习过程,实现对复杂数据模式的有效识别与理解。深度学习的核心在于能够...
在计算机视觉中,自监督学习可以用于图像分类、目标检测和语义分割等任务;在自然语言处理中,它应用于语言模型预训练、情感分析和问答系统等;在图学习领域,它用于节点分类和图分类等任务。 在自监督学习中,研究...
### 有监督学习与无监督学习在金融预测中的应用及对比 #### 引言 近年来,随着人工智能技术的发展,特别是神经网络技术的进步,其在商业领域中的应用日益广泛。其中,有监督学习与无监督学习作为两种重要的机器...
支持向量机,监督学习与无监督学习的描述。
半监督学习是机器学习领域的一种重要方法,它介于有监督学习和无监督学习之间,主要应用于大量未标记数据和少量标记数据的情况。在实际应用中,由于获取标注数据的成本高昂,半监督学习能有效利用未标注数据来提升...
无监督学习方法在深度神经网络中扮演着重要角色,特别是在大数据处理和人工智能领域,如图像和语音识别、自动驾驶等。无监督学习方法可以作为深度神经网络的预训练方法,帮助深度网络更好地学习复杂的数据结构,从而...
推荐系统的实现通常涉及多种机器学习方法,如矩阵分解、深度学习模型,甚至结合监督和无监督学习。 深度学习是近年来机器学习领域的一大突破,它模仿人脑神经网络的结构和功能。深度学习模型,如卷积神经网络(CNN...
内容概要:文章系统地介绍了R语言在机器学习领域的应用,涵盖监督学习和无监督学习的主要技术,详细讲解了几种常用的算法如逻辑回归、SVM、决策树、随机森林、线性回归等。此外,还讨论了模型评估与选择方法以及...
深度学习和数据分析是当今信息科技领域极为重要的两个研究方向,而无监督学习算法则是深度学习中的一个主要分支。无监督学习,顾名思义,是指在没有标记数据...这将有助于未来在无监督学习领域的深入研究和应用开发。
在深度学习领域,结合监督学习和无监督学习的模型已经成为一种有效的策略,特别是在解决复杂问题时,例如图像识别、自然语言处理和推荐系统等。本文将深入探讨标题中提到的"基于监督学习+无监督学习实现的阶梯网络...
半监督学习是一种机器学习方法,它结合了监督学习和无监督学习的优点,可以处理带标签和不带标签的数据。半监督学习的主要思想是,利用少量的标签数据和大量的无标签数据来训练模型,使模型学习到有用的特征表示,...
机器学习入门的可以看一看,作者呕心沥血整理的资源,学习的可以看一看,里面包括机器学习历年来的发展,机器学习的分支,传统机器学习算法和无监督学习,监督学习和强化学习相关定义等等
半监督学习(Semi-Supervised Learning, SSL)是一种介于有监督学习和无监督学习之间的机器学习方法。它旨在利用少量有标记数据和大量未标记数据来提高模型的性能。在实际应用中,获取大量标记数据往往成本高昂且...
自监督学习(Self-Supervised Learning, SSL)属于无监督学习(Unsupervised Learning, UL)的范畴,但它在处理数据和提取特征的方式上有着显著的区别。传统的无监督学习通常不利用任何标签信息,侧重于数据的聚类、...
在监督学习中,我们有两类数据:训练数据和测试数据。训练数据包含了特征和对应的标签,模型通过学习这些数据来理解特征与标签之间的关系。一旦模型训练完成,我们用测试数据来评估模型的性能,通常会使用准确率、...
无监督学习是机器学习的一个重要分支,其在机器学习、数据挖掘、生物医学大数据分析、数据科学等领域有着重要地位。本书阐述作者近年在无监督学习领域所取得的主要研究成果,包括次胜者受罚竞争学习算法、K-means...
监督学习、无监督学习与强化学习
在无监督学习的过程中,稀疏编码模型通常用于特征的提取和表示学习,它在自然语言处理、图像处理等领域有广泛应用。 无监督学习在互联网和大数据时代显得尤为重要,因为现实世界中大量数据是未标记的,无监督学习...