`

半监督学习综述

 
阅读更多

在机器学习领域中,传统的学习方法有两种:监督学习和无监督学习。半监督学习(Semi-supervised Learning)是近年来模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。半监督学习对于减少标注代价,提高学习机器性能具有非常重大的实际意义。

 

聚类假设

        聚类假设是指样本数据间的距离相互比较近时,则他们拥有相同的类别。根据该假设,分类边界就必须尽可能地通过数据较为稀疏的地方,以能够避免把密集的样本数据点分到分类边界的两侧。在这一假设的前提下,学习算法就可以利用大量未标记的样本数据来分析样本空间中样本数据分布情况,从而指导学习算法对分类边界进行调整,使其尽量通过样本数据布局比较稀疏的区域。例如,Joachims提出的转导支持向量机算法,在训练过程中,算法不断修改分类超平面并交换超平面两侧某些未标记的样本数据的标记,使得分类边界在所有训练数据上最大化间隔,从而能够获得一个通过数据相对稀疏的区域,又尽可能正确划分所有有标记的样本数据的分类超平面。

流形假设

  流形假设的主要思想是同一个局部邻域内的样本数据具有相似的性质,因此其标记也应该是相似。这一假设体现了决策函数的局部平滑性。和聚类假设的主要不同是,聚类假设主要关注的是整体特性,流形假设主要考虑的是模型的局部特性。在该假设下,未标记的样本数据就能够让数据空间变得更加密集,从而有利于更加标准地分析局部区域的特征,也使得决策函数能够比较完满地进行数据拟合。流形假设有时候也可以直接应用于半监督学习算法中。例如,Zhu 等人利用高斯随机场和谐波函数进行半监督学习,首先利用训练样本数据建立一个图,图中每个结点就是代表一个样本,然后根据流形假设定义的决策函数的求得最优值,获得未标记样本数据的最优标记;Zhou 等人利用样本数据间的相似性建立图,然后让样本数据的标记信息不断通过图中的边的邻近样本传播,直到图模型达到全局稳定状态为止。

  从本质上说,这两类假设是一致的,只是相互关注的重点不同。其中流形假设更具有普遍性

 

半监督学习的主要算法

基于概率的算法;

在现有监督算法基础上作修改的方法;

直接依赖于聚类假设的方法;

基于多试图的方法;

基于图的方法  

 

不足

半监督学习分类算法从提出到现在时间比较短,还有许多方面没有更深入的研究

半监督学习分类算法的现实价值

  半监督学习从诞生以来,主要用于处理人工合成数据、只在实验室试用,还没办法在某个现实领域得到应用,也就是说,其现实意义没体现出来;因此,半监督学习的实际应用价值问题值得更多的研究。

新假设的提出

  文中前面叙述到的各种半监督分类算法的假设,提出新的模型假设可能会改进半监督分类算法。所以对半监督学习分类算法的模型假设的研究将是十分有价值的。

半监督学习的抗干扰性比较弱

  无噪声干扰的样本数据是当前大部分半监督学习方法使用的数据,而在实际生活中用到的数据却大部分不是无干扰的,通常都比较难以得到纯样本数据。上面谈论的三个基本假设显然是有效的,不过过于简约,这些假设没能把噪声干扰下未标记样本数据分布的不确定性以及它的复杂性充分的考虑全
分享到:
评论

相关推荐

    《深度半监督学习》综述论文

    深度半监督学习是当前机器学习和人工智能领域中的一个重要研究方向,它旨在通过充分利用大量未标记的数据和少量标记的数据来提升模型的学习效率和泛化能力。在机器学习领域,数据标注是一项耗时、昂贵且有时难以进行...

    半监督学习综述(a survey of semi-supervised learning)

    一篇数据挖掘课的作业论文。...关于半监督学习方面的综述性文章。 所参考文献在2009年以前。 目前这方面的中文文献相对较少,希望我的这篇作业能对有兴趣做这方面研究的朋友有所帮助,其中错误之处还请大家多多指出。

    半监督学习研究综述 半监督

    本文是关于半监督学习的研究综述,旨在介绍半监督学习的基本概念、经典方法和基于GAN的半监督学习模型。半监督学习是机器学习领域中的一种重要方法,它可以同时利用有标签数据和无标签数据来训练模型,从而提高学习...

    8篇半监督学习相关论文

    半监督学习机制下的说话人辨认...半监督学习综述 基于半监督学习的眉毛图像分割方法 基于半监督学习的网络流量分类 基于核策略的半监督学习方法 一种基于半监督学习的多模态Web查询精化方法 有关半监督学习的问题及研究

    电子科大最新《深度半监督学习》综述论文(2021版)

    深度半监督学习是一个快速发展的领域,具有一系列的实际应用。本文从模型设计和无监督损失函数的角度对深度半监督学习方法的基本原理和最新进展进行了全面的综述。

    半监督深度学习图像分类方法研究综述.pdf

    半监督学习可以分为三类:基于生成模型的半监督学习、基于判别模型的半监督学习和基于混合模型的半监督学习。基于生成模型的半监督学习使用生成模型来生成新的数据,以增强模型的性能。基于判别模型的半监督学习使用...

    机器学习-半监督机器学习综述

    机器学习中半监督机器学习的综述,半监督,有监督,无监督

    深度半监督学习中伪标签方法综述.docx

    "深度半监督学习中伪标签方法综述" 深度半监督学习是指在深度学习中结合少量的标签数据和大量的无标签数据来训练模型,以提高模型的性能。其中,伪标签方法是深度半监督学习中的一种重要方法,该方法通过为无标签...

    《对比监督学习》2020综述论文

    总结起来,这篇综述论文全面地介绍了对比监督学习的概念、方法和应用,强调了其在无监督和半监督学习场景中的价值,并对未来的研究方向提出了展望。关键词包括对比学习、自我监督学习、判别学习、图像/视频分类、...

    半监督生成对抗网络综述

    在这篇综述中,作者Liam Schoneveld在他的硕士论文中提出了一种统一的半监督学习框架,并将多种当代方法纳入这个框架中。研究重点是使用GANs进行半监督学习的方法,并对特定的基于GAN的SSL方法进行了详细分析。论文...

    半监督支持向量机综述

    半监督支持向量机(Semi-Supervised Support Vector Machines,简称S3VMs)是机器学习领域中一种重要的算法,旨在解决半监督学习问题。半监督学习是一种介于有监督学习与无监督学习之间的学习范式,它利用少量的标记...

    SSL4MIS:用于医学图像分割的半监督学习,文献综述和代码实现的集合

    医学图像分割的半监督学习。 近来,半监督图像分割已成为医学图像计算中的热门话题,不幸的是,由于隐私策略等原因,只有少数开源代码和数据集。为了便于评估和公平比较,我们正在尝试建立一个半监督医学图像分割...

    AlexNet深度学习综述

    这些方法可以被进一步细分为监督学习、半监督学习和无监督学习。 除了对基础深度学习方法的介绍,本综述还着重考察了深度学习的先进变体技术。许多在2012年之后发表的论文都在不同深度学习方法的基础上提出了一些...

    图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低.pdf

    图像分类是计算机视觉中的基本任务之...最近,自监督学习与预训练技术的发展使得图像分类技术出现新的变化,这篇论文概述了最新在实际情况中少标签小样本等情况下,关于自监督学习、半监督、无监督方法的综述,值得看!

    大数据与深度学习综述.docx

    半监督学习则结合了监督学习和无监督学习的特点,利用部分有标签数据和大量无标签数据进行训练。 大数据和深度学习的应用案例包括人脸识别、智能客服、医疗诊断等。人脸识别技术可以通过分析人脸图像实现身份验证,...

    机器学习+深度学习综述(英文)

    主要分为监督学习、无监督学习和半监督学习三大类。在监督学习中,如分类和回归问题,我们有标记的数据来指导学习过程;无监督学习则在没有标签的数据上进行,如聚类和降维;半监督学习则介于两者之间,利用少量标记...

Global site tag (gtag.js) - Google Analytics