【线性可分问题 之 问题】
先从最简单的情况说起,说线性可分问题。问题是这样的,至少可以想象是这样的:在二维空间中有一些点,分别属于两个不同的类别,如何在二维空间中找到这样一条直线,直线的一边是某一类别的点,直线的另一边是另一个类别的点?如果这样的直线存在多条,如何选择一条最“好”的直线?
上面描述中,样本被描述成了二维空间的点;其实也可以是高维空间中的点,而一个向量来表征。类别,可以简单地用整数+1和-1表示,不必是向量。
分类器,对于二维空间是一条直线;对于高维空间,就是一个超平面。通常做如下表示:
g(x) = <w * x> + b
x表示样本点,通常是一个向量;w表示分类超平面的法向量;b表示截距,它和w共同确定了分类超平面,也就组成了分类器本身。分类的过程通过一个符号函数 sgn[ g(x) ] 来判定,即当g(x)>0的时候,判定为正类别;否则为负类别。
通常找到这样一个超平面不难,难的是超平面有很多,究竟选择哪一个?
【线性可分问题 之 问题转化 之 最大几何间隔】
选择哪一个,总会有一个“标准”,这个标准就决定了我们的目标函数,这样寻找最优超平面问题就能够转换成为普通的优化问题。
首先做一些铺垫,定义一个样本x(i)点到超平面的“间隔”为:
Theta(i) = y(i) ( <w * x(i)> + b )
公式中“(i)"表示的是下标。看起来就是样本点用超平面计算出来的数值(不是向量)与它已知的分类结果相乘。注意到,这个值Theta(i)永远是正值,等于 | g( x(i) ) |,竖线表示绝对值。将上面公式进一步对w做归一化,得到:
Theta(i) = | g( x(i) ) | / || w ||
双竖线表示w的范式。上面公式的几何意义是样本点x(i)到超平面的几何间隔。
有了上面的铺垫,好,我们直接说结论:我们要找的那个超平面是距离两类样本点集合的几何间隔最大的那个超平面。至于,上面只定义了单个样本到超平面的几何间隔,那么点的集合到超平面的几何间隔,类似的可以定义,这里就不罗嗦了,总之,我相信,你懂得。
不过,上面结论怎么来的?我看的资料里面没有详细推导,即便是有详细推导,我也可能没有耐心看完。我猜想是按照如下思路来的:首先,根据期望风险和经验风险以及VC维的关系(参考上一篇博文"svm_基础理论1"中的公式),将问题转化成旨在用经验风险和VC维降低期望风险的”上界“;这个问题又转化为降低样本的错分类次数的上界;错分类次数的上界有如下公式决定:
误分次数 <= pow ( 2*R / Theta, 2)
是某个比值的平方,而这个比值又和 Theta 有关,而Theta的数值又是样本点到超频面的几何间隔。至此,问题转化为选取超平面,要求距离样本点的几何间隔最大。公式中R是什么?如果样本分布在三维空间中,R就是能够包含所有样本的最小球的直径。显然,这是和样本相关的量。这个量,对于基于这些样本训练处的所有模型都是相同的。
回顾上面Theta的计算公式,Theta的数值与|| w ||有关,问题又进一步转化为:如何选择超平面,使得|| w ||的值最小。
如何求解呢?其实问题还需要进一步变换——看svm的一个突出感觉就是,问题都不好解决,只好转换成别的问题,而别的问题也不好解决,只好继续转换...... 我们下文再说吧。
分享到:
相关推荐
最后,"参考文献"可能列出了SVM领域的经典论文或教程,这些文献可以帮助深入理解SVM的理论基础,比如Vapnik-Chervonenkis(VC)维、软间隔、核技巧等。通过阅读这些文献,可以了解SVM的最新研究成果和实际应用情况。...
OpenCV(开源计算机视觉...在"opencv学习笔记"中,你将找到关于这些主题的详细讲解,包括理论知识、实例代码和实践技巧,帮助你逐步掌握OpenCV并运用到实际项目中。无论是初学者还是有经验的开发者,都能从中受益匪浅。
通过深入理解SVM的理论基础,熟练掌握核函数的选择和参数调整,我们可以灵活地应用SVM解决实际问题,提高预测和分类的准确性和效率。这份笔记旨在提供一个全面而详细的SVM算法流程指南,帮助读者更好地理解和运用这...
《吴恩达机器学习笔记》是一份详尽的教程,主要涵盖了机器学习的基础概念、算法原理及其应用。作为全球知名的计算机科学家和人工智能专家,吴恩达的机器学习课程深受全球学习者的欢迎。这份笔记旨在帮助读者理解并...
本笔记将深入探讨机器学习的基础理论、算法和应用。首先,我们需要理解机器学习的基本类型:监督学习、无监督学习和半监督学习。在监督学习中,我们有标记的训练数据,模型通过学习这些数据的关系来预测未知数据。无...
本笔记将深入探讨SVM的核心概念、理论基础以及如何通过SMO(Sequential Minimal Optimization)算法解决优化问题。 ### SVM基础 1. **间隔与最大间隔**:SVM的核心思想是构建一个具有最大边距的决策边界,这个边界...
这份笔记作为学习资源,不仅涵盖了理论知识,也注重实践操作,可以帮助读者从理论到实践全面掌握机器学习。通过深入阅读和理解,你将能够构建和应用自己的机器学习模型,为未来在人工智能领域的发展打下坚实基础。
通过学习这门课程的笔记,你可以掌握SVM的理论基础,了解如何选择和调整核函数,以及如何利用SVM进行实际的预测任务。无论是对机器学习初学者还是经验丰富的从业者,深入理解和支持向量机都能为解决复杂问题提供强大...
而“huangbo929.blog.edu.cn.txt”可能是某个博客或教育资源的链接,可能提供了作者的学习笔记、心得或教学材料。 通过这些资料,学习者可以系统地学习SVM,从基础理论到实践应用,进一步提升机器学习技能。在学习...
这篇笔记深入浅出地讲解了机器学习的核心概念,旨在帮助读者建立起坚实的理论基础,并能够实际应用这些知识。 一、机器学习概述 机器学习是人工智能的一个分支,主要研究计算机如何通过经验学习,而不是明确编程来...
《机器学习笔记》是基于Andrew Ng的机器学习课程编写的,包含了作者的个人理解和实践心得。这份笔记深入浅出地探讨了多个机器学习的核心概念和技术,旨在帮助读者掌握这一领域的关键知识。 首先,我们从“线性回归...
本资源包含中文版和英文版电子档,以及学习笔记和习题解答,对于自学者或教师来说,都是非常宝贵的学习材料。 首先,我们要理解模式识别是机器学习的一个重要分支,其主要目标是从数据中提取有用信息,识别出隐藏的...
首先,我们来看《机器学习学习笔记》系列,这些PDF可能涵盖了从基础理论到实践应用的广泛内容。机器学习是人工智能的一个分支,其目标是让计算机通过数据学习和改进,而无需显式编程。B0017机器学习学习笔记.pdf和B...
在这个部分,我们将会关注机器学习的基础理论、模型和算法。 首先,我们要理解机器学习的分类。根据是否需要人类标注数据,机器学习可以分为监督学习、无监督学习和半监督学习。监督学习是最常见的形式,包括回归和...
【机器学习笔记作者黄海广】是一份详细记录了斯坦福大学2014年机器学习课程精华内容的学习笔记,由作者黄海广精心整理而成。这份笔记旨在帮助读者深入理解机器学习的基本概念、理论与实践,是学习者掌握机器学习知识...
《个人机器学习笔记》 ...总结,这份个人机器学习笔记全面覆盖了从基础理论到实际应用的知识点,对于初学者和进阶者来说都是宝贵的学习资源。通过深入理解和实践,我们可以更好地驾驭这个充满无限可能的领域。
学习支持向量机(SVM)可以通过以下步骤进行: 基础知识: 学习基础的线性代数、概率论和统计学知识。 熟悉机器学习的基本概念,如监督学习、分类、回归等。 理论学习: 阅读关于SVM的理论介绍,理解其基本原理,如...
《斯坦福大学机器学习课程个人学习笔记》是一份全面且实用的学习资源,它引导读者逐步深入机器学习的世界,通过理论与实践的结合,使学习者能够熟练掌握机器学习的各种算法和技术,为他们在人工智能领域的发展打下...