摘录自:http://www.blogjava.net/zhenandaci/archive/2009/02/13/254519.html
线性分类器(一定意义上,也可以叫做感知机) 是最简单也很有效的分类器形式.在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念.
用一个二维空间里仅有两类样本的分类问题来举个小例子。如图所示
C1和C2是要区分的两个类别,在二维平面中它们的样本如上图所示。中间的直线就是一个分类函数,它可以将两类样本完全分开。一般的,如果一个线性函数能够将样本完全正确的分开,就称这些数据是线性可分的,否则称为非线性可分的。
什么叫线性函数呢?在一维空间里就是一个点,在二维空间里就是一条直线,三维空间里就是一个平面,可以如此想象下去,如果不关注空间的维数,这种线性函数还有一个统一的名称——超平面(Hyper Plane)!
实际上,一个线性函数是一个实值函数(即函数的值是连续的实数),而我们的分类问题(例如这里的二元分类问题——回答一个样本属于还是不属于一个类别的问题)需要离散的输出值,例如用1表示某个样本属于类别C1,而用0表示不属于(不属于C1也就意味着属于C2),这时候只需要简单的在实值函数的基础上附加一个阈值即可,通过分类函数执行时得到的值大于还是小于这个阈值来确定类别归属。 例如我们有一个线性函数
g(x)=wx+b
我们可以取阈值为0,这样当有一个样本xi需要判别的时候,我们就看g(xi)的值。若g(xi)>0,就判别为类别C1,若g(xi)<0,则判别为类别C2(等于的时候我们就拒绝判断,呵呵)。此时也等价于给函数g(x)附加一个符号函数sgn(),即f(x)=sgn [g(x)]是我们真正的判别函数。
关于g(x)=wx+b这个表达式要注意三点:一,式中的x不是二维坐标系中的横轴,而是样本的向量表示,例如一个样本点的坐标是(3,8),则xT=(3,8) ,而不是x=3(一般说向量都是说列向量,因此以行向量形式来表示时,就加上转置)。二,这个形式并不局限于二维的情况,在n维空间中仍然可以使用这个表达式,只是式中的w成为了n维向量(在二维的这个例子中,w是二维向量,为了表示起来方便简洁,以下均不区别列向量和它的转置,聪明的读者一看便知);三,g(x)不是中间那条直线的表达式,中间那条直线的表达式是g(x)=0,即wx+b=0,我们也把这个函数叫做分类面。
实际上很容易看出来,中间那条分界线并不是唯一的,我们把它稍微旋转一下,只要不把两类数据分错,仍然可以达到上面说的效果,稍微平移一下,也可以。此时就牵涉到一个问题,对同一个问题存在多个分类函数的时候,哪一个函数更好呢?显然必须要先找一个指标来量化“好”的程度,通常使用的都是叫做“分类间隔”的指标。下一节我们就仔细说说分类间隔,也补一补相关的数学知识。
分享到:
相关推荐
### SVM入门(五)线性分类器的求解——问题的描述Part2 #### 重要概念与背景 本文档旨在帮助读者理解支持向量机(SVM)中的线性分类器求解过程及其数学表述,特别关注于如何将线性分类器问题转化为优化问题,并讨论...
从给出的内容片断中,我们可以了解到文档讨论了对抗攻击(Evasion Attacks),特别是针对线性分类器和非线性分类器的绕过攻击(Evasion of Classifiers),以及如何检测恶意PDF文件。 文档开篇引用了《孙子兵法》中...
线性分类器如贝叶斯分类器,能够提供基于概率的决策边界。非线性分类器则包括多层感知器、决策树和径向基网络(RH网络)。这些非线性模型通常能够处理更复杂的数据关系,适应更广泛的实际应用。 此外,本书还涉及上...
然后是线性分类器,如支持向量机(SVM)和感知器。线性分类器因其简洁的数学形式和高效的计算而备受青睐。它们通过在特征空间中找到一个超平面来划分不同类别的样本。线性SVM寻找最大的间隔边界,以最大化两类样本...
Part 1可能介绍了朴素贝叶斯分类器的基本原理和应用场景,而Part 2可能深入到条件独立假设、贝叶斯网络以及在文本分类和推荐系统中的应用。 总的来说,这些课件提供了丰富的机器学习和人工智能基础知识,涵盖了从...
"Part 4.1 Linear Support vector machine.pdf"讨论了支持向量机(SVM),这是一种强大的分类和回归工具。支持向量机通过构造最大边距超平面来进行分类,可以处理高维数据,并具有很好的泛化能力。这部分可能包括核...
1. 统计模式识别:利用概率模型,如朴素贝叶斯分类器,来识别数据中的模式。 2. 基于实例的学习:包括K近邻(K-NN)算法,通过查找与新样本最相似的训练样本来做出决策。 3. 神经网络和深度学习:通过多层非线性...
DPM通常基于Boosting框架,通过一系列弱分类器(如Haar特征或HOG特征)组合成强分类器,以提高检测性能。 在实际应用中,深度神经网络经常与各种技术结合,例如与循环神经网络(Recurrent Neural Network, RNN)和...
朴素贝叶斯分类器是一种基于概率的分类方法,它利用贝叶斯定理来计算给定数据的条件下属于某一类的概率。该算法的前提假设是特征之间相互独立,这样可以简化计算过程。 决策树是一种图形化的决策支持工具,以树状...
10. **AdaBoost**:通过迭代训练弱分类器,构建强分类器的集成学习方法。 11. **随机森林(Random Forest)**:包含多个决策树的集成学习方法,提高了预测的稳定性和准确性。 12. **主成分分析(Principal Component...
2. **人脸检测**:常用的人脸检测方法有Haar特征级联分类器、HOG(Histogram of Oriented Gradients)和DPM(Deformable Part Models)。MATLAB中的vision.CascadeObjectDetector函数可以实现基于Haar特征的快速人脸...
2. **人脸检测**:使用如Haar特征级联分类器或DPM(Deformable Part Models)等方法检测图像中的人脸区域。 3. **姿态校正**:通过旋转和平移校正图像,使所有人脸都处于相似的视角。 4. **模型训练**:使用SVM...
朴素贝叶斯分类器假设特征之间相互独立,虽然这一假设在实际应用中往往不成立,但该方法简单高效,适用于大规模数据集。 - **J48()**: C4.5决策树算法。C4.5是一种经典的决策树算法,它可以生成易于理解的决策规则,...
1. **Part1: Introduction_niloy.pdf** 这部分可能是深度学习的基础介绍,包括深度学习的历史、基本原理以及在现代科技中的应用。它可能涵盖了神经网络的基本架构,如感知机、多层感知机和反向传播算法,同时可能...
例如,Bag of Words (BoW)模型结合SIFT或SURF特征,通过KMeans聚类生成视觉词汇,并利用SVM进行分类。稀疏编码(Sparse Coding)方法如LLC(Locality-constrained Linear Coding)通过学习局部线性表示来对图像进行分类...
#### Lecture4: Backpropagation and Neural Networks part 1 (Backpropagation; Introduction to neural networks) **Backpropagation** - **计算图:** 将前向传播和后向传播过程可视化为一个计算图。 - **前向/...
传统的行人检测方法包括 Dalal 等人提出的梯度直方图(Histogram of Oriented Gradient,HOG)以及与线性分类器支持向量机(Support Vector Machine,SVM)结合的行人检测方法。 Felazenszwalb 等人随后提出了改进的...
9.5 级联分类器——人脸检测.. 353 9.5.1 级联分类器. 353 9.5.2 CascadeClassifier 类 353 9.6 应用实例 355 9.6.1 运动目标提取 355 9.6.2 TLD 单目标跟踪.. 358 9.6.3 人眼检测与跟踪.. 361 9.7 小结. 365 附录A ...