`

主动学习,半监督学习,直推学习

 
阅读更多

 

在机器学习(Machine learning)领域,监督学习(Supervised learning)、非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多,应用比较广的学习技术

  • 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,
  • 非监督学习:直接对输入数据集进行建模
  • 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数

     

    半监督学习指的是在训练数据十分稀少的情况下,通过利用一些没有类标的数据,去学习没有标注数据的最优标注,减少标注代价,从而提高学习准确率的方法。


    主动学习(active learning):有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。这里是半监督学习的最大区别,其学习算法不需要人工干预,基于自身对未标记数据加以利用。

    筛选过程也就是主动学习主要研究的地方了,怎么样筛选数据才能使得请求标注的次数尽量少而最终的结果又尽量好

    主动学习的过程大致是这样的,有一个已经标好类标的数据集K(初始时可能为空),和还没有标记的数据集U,通过K集合的信息,找出一个U的子集C,提出标注请求,待专家将数据集C标注完成后加入到K集合中,进行下一次迭代。

    按wiki上所描述的看,主动学习也属于半监督学习的范畴了,但实际上是不一样的,半监督学习和直推学习(transductive learning)以及主动学习,都属于利用未标记数据的学习技术,但基本思想还是有区别的。

    如上所述,主动学习的“主动”,指的是主动提出标注请求,也就是说,还是需要一个外在的能够对其请求进行标注的实体(通常就是相关领域人员),即主动学习是交互进行的。

    至于直推学习,它与半监督学习一样不需要人工干预,不同的是,直推学习假设未标记的数据就是最终要用来测试的数据,学习的目的就是在这些数据上取得最佳泛化能力。相对应的,半监督学习在学习时并不知道最终的测试用例是什么。

    也就是说,直推学习其实类似于半监督学习的一个子问题,或者说是一个特殊化的半监督学习,所以也有人将其归为半监督学习。

    而主动学习和半监督学习,其基本思想上就不一样了,所以还是要加以区分的,如果wiki上对半监督学习的解释能特别强调一下“是在不需要人工干预的条件下由算法自行完成对无标记数据的利用”,问题就会更清楚一些了。

  •  

    分享到:
    评论

    相关推荐

      《基于神经网络的监督和半监督学习方法与遥感图像智能解译》读书笔记模板.pptx

      基于支持向量机的半监督学习方法是指通过支持向量机来实现半监督学习,作者介绍了基于直推式支持向量机的半监督学习方法、基于渐进直推式支持向量机的半监督学习方法与应用、基于改进渐进直推式支持向量机的半监督...

      第十三章 半监督学习1

      在半监督学习中,有两种常见的方法:纯半监督学习和直推学习。纯半监督学习假设训练数据中的未标记样本并不用于预测,而是帮助理解数据分布。直推学习则认为未标记数据本身就是需要预测的目标。主动学习是一种相关...

      半监督学习介绍1

      半监督学习是机器学习领域的一种重要方法,尤其在现实世界中,数据的获取...同时,理解并合理运用Low-density Separation和Smoothness假设,以及区分归纳式和直推式学习的应用场景,对于优化半监督学习算法至关重要。

      12.半监督学习1

      半监督学习方法可以大致分为两类:纯半监督学习和直推学习。纯半监督学习关注于利用未标记样本改善学习模型的性能,假设这些未标记样本并非最终的预测目标。而直推学习则是直接将未标记样本作为预测对象,通过学习...

      半监督学习中的协同训练风范*

      利用未标记示例的主流学习技术主要有三大类[Zhou06],即半监督学习(semi-supervised learning)、直推学习(transductive learning)和主动学习(active learning)

      机器学习和迁移学习PPT学习教案.pptx

      迁移学习可以根据源领域和目标领域样本是否标注以及任务是否相同,可以把迁移学习划分为:归纳迁移学习、直推式迁移学习和无监督迁移学习。按照迁移学习方法采用的技术划分,又可以把迁移学习方法大体上分为:基于...

      基于间接域适应特征生成的直推式零样本学习方法.pdf

      针对上述挑战,本篇论文提出了一个创新的解决方案——基于间接域适应特征生成(FG-IDA)的直推式零样本学习方法。FG-IDA方法的创新之处在于,它将语义映射与域适应的优化过程进行了串行化处理,即这两个关键步骤被...

      油缸直推式举升机构设计及其性能分析

      根据不同的使用性能要求,按给定油缸初始位置的尺度和2个极限位置进行了油缸直推式举升机构的尺寸设计,即初始位置油缸作用力臂最大的机构、上下限位置传动角相等的机构和油缸推力波动最小的机构。建立举升机构的运动...

      20180411_迁移学习1

      直推式学习是指在没有目标领域标签的情况下,使用源领域的信息来训练模型。这种方法可以帮助模型学习到更加泛化的特征,从而提高模型的泛化能力。 2.1 领域适应性(Domain Adaptation) 领域适应性是指学习 domain...

    Global site tag (gtag.js) - Google Analytics